Hayatta kalma analizinde neden tamamen parametrik modeller yerine yarı parametrik modeller (Cox orantılı tehlikeler) kullanıyoruz?


24

Cox Orantısal Tehlikeler modelini inceledim ve bu soru çoğu metinde açıklandı.

Cox, kısmi bir olabilirlik yöntemi kullanarak Tehlike fonksiyonunun katsayılarının kullanılmasını önerdi, ancak neden maksimum olasılık yöntemini ve doğrusal bir modeli kullanarak parametrik bir Hayatta Kalma fonksiyonunun katsayılarına uymuyor?

Verileri sansürlediğiniz durumlarda, sadece eğri altındaki alanı bulabilirsiniz. Örneğin, tahmininiz 80 standart sapma ile 380 ise ve bir numune> 300 sansürlenmişse, o zaman bu örnek için normal hata varsayalım.


Burada aktüeryal bilim soruları olduğu kadar, bu sorunun büyük olasılıkla istatistik sitesinde Cross Validated ile daha iyi bir cevap alacağını söylemeliyim. Bir moderatörün göç etmesini isteyebilirsiniz.
Grafik

Tamam, bunun var olduğunun farkında değildim. Geçiş isteğinde olduğundan emin değil. Lütfen taşınsın mı?

@ Graphth, bir tane de olduğunu bilmiyordum ... "Tüm siteler" listesinde bulamadım, buraya link verebilir misiniz? Thanks

Yanıtlar:


27

Verilerinizin takip ettiği parametrik dağılımı biliyorsanız o zaman maksimum olabilirlik yaklaşımı kullanarak ve dağıtım mantıklı geliyor. Cox Orantılı Tehlikeler regresyonunun asıl avantajı, dağılımı bilmeden (veya varsaymadan) hayatta kalma modellerine uymaya devam edebilmenizdir. Normal dağılımı kullanarak bir örnek verirsiniz, ancak hayatta kalma sürelerinin çoğu (ve Cox PH regresyonunun kullanıldığı diğer veri türleri) normal bir dağılımı takip etmeye yaklaşmaz. Bazıları log normal veya Weibull veya başka bir parametrik dağılım izleyebilir ve bu varsayımı yapmaya istekliyseniz, maksimum olasılık parametrik yaklaşımı mükemmeldir. Ancak birçok gerçek dünyada, uygun dağılımın ne olduğunu bilmiyoruz (ya da yeterince yakın bir yaklaşım). Sansür ve değişkenlerle basit bir histogram yapamıyoruz ve "bana ... dağılmış gibi görünüyor" diyemeyiz. Bu nedenle, belirli bir dağılıma ihtiyaç duymadan iyi çalışan bir tekniğe sahip olmak çok faydalıdır.

Dağıtım işlevi yerine neden tehlikeyi kullanıyorsunuz? Aşağıdaki ifadeyi göz önünde bulundurun: "A grubundaki insanlar, 80 yaşında B grubundaki insanlardan iki kat daha fazla ölüm". Şimdi bu doğru olabilir, çünkü B grubundaki insanlar A grubundakilerden daha uzun yaşamaya meyillidirler veya B grubundaki kişilerin daha kısa hayatlar yaşama eğiliminde oldukları ve çoğu 80 yaşından çok önce öldükleri için çok küçük bir olasılık vermiş olabilirler. 80 yaşından büyüklerin 80'i yaşarken, A grubu içinde yeterli sayıda insan, 80 yaşında yaşarken, bu yaşta çok sayıda insanın ölmesi olasılığını artırır. Dolayısıyla aynı ifade, A grubunda olmanın, B grubunda olmasından daha iyi ya da daha kötü olduğu anlamına gelebilir. 80 yaşına kadar yaşayan bu kişilerin (her bir grupta) 80 yaşına basmadan önce hangi oranın öleceğini söylemek daha mantıklı geliyor. Bu tehlikedir (ve tehlike, dağıtım fonksiyonunun / hayatta kalma fonksiyonunun / vb. Bir fonksiyonudur). Tehlike, yarı parametrik modelde çalışmak daha kolaydır ve daha sonra size dağıtım hakkında bilgi verebilir.


7
Güzel cevap Zamanla ilgili benzersiz olan tek yönden geçmesi ve yüksek riskli bir süreye girdiğimizde, esas olarak şu an yürürlükte olan risklerle ilgileniyoruz. Tehlike fonksiyonunun bize söylediği şey budur.
Frank Harrell

2
Eklemeye değer bir diğer nokta, sansürlü verilerle, dağıtım varsayımlarını denetlemenin çok zor olabileceğidir. Örneğin, deneklerin yalnızca% 20'sinin bir etkinlik izlediğini varsayalım. Dağıtım kuyruklarının Weibull dağılımını takip edip etmediğini belirlemeye çalışmak kesinlikle mümkün olmayacak! Cox-PH modeli bu konuyu biraz gölgelendiriyor (ancak yüksek sansür uygulanmış alanlara göre tahmin etmek istiyorsanız orantılı tehlikelerin varsayımına karşı çok dikkatli olmalısınız)
Cliff AB

16

"Biz" mutlaka gerekmez. Hayatta kalma analizi araçları, Kaplan-Meier metodu gibi tamamen parametrik olmayanlardan, temel tehlikenin dağılımını belirlediğiniz tamamen parametrik modellere kadar uzanmaktadır. Her birinin avantajları ve dezavantajları vardır.

Cox orantılı tehlikeler modeli gibi yarı parametrik yöntemler, temel tehlike fonksiyonunu belirtmemekle kaçmanıza izin verir. Bu, her zaman altta yatan tehlike işlevini her zaman bilmediğimiz ve çoğu durumda da umursamadığımızdan yardımcı olabilir . Örneğin, birçok epidemiyoloji çalışması bilmek ister ki "X pozlaması Y olayına kadar geçen süreyi azaltır mı?" Onların umursadığı şey, X hastaları ve X hastaları arasındaki farktır. Bu durumda, altta yatan tehlike gerçekten önemli değildir ve onu belirleme riski, onu bilmemenin sonuçlarından daha kötüdür.

Ancak bunun doğru olmadığı zamanlar da vardır. Altta yatan tehlike çünkü tamamen parametrik modeller ile çalışmayı yaptık oldu ilgi.


1
“... ve onu belirtme riski, onu bilmemenin sonuçlarından daha kötü.” Bu çok yardımcı oldu, teşekkür ederim.

Altta yatan tehlikenin ne zaman ilgi çekici olacağını bir örnek verebilir misiniz?
Dan Chaltiel

1
@DanChaltiel Matematiksel bir modele veya benzerine girmeyi amaçlayan herhangi bir tahmin bir örnek olabilir - temel tehlike fonksiyonu özel olarak ilgi çekmektedir.
Fomite
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.