Cox tehlike modeli hayatta kalma eğrisini nasıl yorumlayabilirim?


9

Cox orantılı tehlike modelinden sağkalım eğrisini nasıl yorumluyorsunuz?

Bu oyuncak örneğinde, verilerdeki agedeğişken üzerinde bir cox orantılı tehlike modelimiz olduğunu kidneyve hayatta kalma eğrisini oluşturduğumuzu varsayalım .

library(survival)
fit <- coxph(Surv(time, status)~age, data=kidney)
plot(conf.int="none", survfit(fit))
grid()

resim açıklamasını buraya girin

Örneğin, zamanında hangi ifade doğrudur? ya da her ikisi de yanlış mı?200

  • Bildirim 1:% 20 denek kaldı (örneğin, varsa , güne kadar , yaklaşık kalmalıyız), 1000200200

  • Bildirim 2: Belirli bir kişi için, günde hayatta kalma şansı .20%200


Girişim: İki ifadenin aynı olduğunu düşünmüyorum (yanlışsam beni düzeltin), çünkü iid varsayımımız yok (tüm insanlar için hayatta kalma süresi bağımsız olarak tek bir dağıtımdan değil). Buradaki sorumdaki lojistik regresyona benzer , her insanın tehlike oranı o kişi için bağlıdır .βTx


Modelinizin etkinlik süreleri arasında bağımsızlık kazandığını unutmayın.
ocram

sağkalım analizi bağımsızlık varsayımlarına sahip olabilir
Aksakal

bu yüzden soru saf istatistiklerden ziyade gerçekten R kodlamasıyla ilgili gibi görünüyor. kişinin sözdizimini ve örnekte kullanılan belirli işlevlerin özelliklerini bilmesi gerekir. durum böyleyse, bu konu dışından değil mi? aksi takdirde, R kullanmayanlara neler olduğunu açıklamanız gerekir
Aksakal

Yanıtlar:


5

Tehlike ortak değişkenlere bağlı olduğu için hayatta kalma işlevi de geçerlidir. Model eş değişken vektörü olan bir bireyin risk fonksiyonu olduğunu varsayar olan Bu nedenle, bu bireyin tehlikesi burada temel birikimli tehlike olarak tanımlayabiliriz . Değişken vektör sahip bir birey için hayatta kalma fonksiyonu sırayla burada yı temel hayatta kalma fonksiyonu olarak . x

h(t;x)=h0(t)eβ'x.
'H(t;x)=0th(u;x)du=0th0(u)eβ'xdu='H0(t)eβ'x,
'H0(t)=0th0(u)dux
S(t;x)=e-'H(t;x)=e-'H0eβ'x=S0(t)eβ'x
S0(t)=e-'H0(t)

Verilen tahminler ve regresyon katsayısı ve taban çizgisi yaşama fonksiyonu, bir tahmin eş değişken vektörü ile bağımsız bir hayatta kalma işlevi ile verilir .β^S^0(t)xS^(t;x)=S^0(t)eβ^'x

Bunu R'de hesaplayın, newdataargümandaki ortak değişkenlerinizin değerini belirtirsiniz . Örneğin, hayatta kalma işlevini = 70 yaştaki bireyler için istiyorsanız, R'de,

plot(survfit(fit, newdata=data.frame(age=70)))

Yaptığınız gibi, newdatabağımsız değişkeni atlarsanız, varsayılan değeri örnekteki ortak değişkenlerin ortalama değerlerine eşittir (bkz. ?survfit.coxph). Grafiğinizde gösterilen, ın bir tahminidir . S0(t)eβ'x¯


Size katılıyorum. Bu güzel yazılmış bir cevap. Hatam için OP'den özür dilerim ve OP'nin düzeltme şeklini takdir ediyorum.
Michael R.Chickick

@ hxd1101 Yardım sayfasını survfit.coxphdaha dikkatli okuduktan sonra cevabımdaki bir hatayı düzelttim, bkz. güncelleme.
Jarle Tufto

2

% 20 denek kaldı (örneğin, 1000 kişimiz varsa, 200. güne kadar 200 kalmamız gerekir)? veya Belirli bir kişi için, 200. günde hayatta kalma şansı% 20'dir?

En saf haliyle, örneğinizdeki Kaplan-Meier eğrisi yukarıdaki ifadelerden hiçbirini oluşturmaz.

İlk ifade, ileriye dönük bir projeksiyona sahip olacak . Temel sağkalım eğrisi sadece geçmişi, örneğinizi tanımlar. Evet, numunenizin% 20'si 200. günde hayatta kaldı.% 20'si önümüzdeki 200 gün içinde hayatta kalacak mı? Şart değil.

Bu ifadeyi yapabilmek için daha fazla varsayım eklemeniz, bir model oluşturmalısınız. Modelin lojistik regresyon gibi bir anlamda istatistiksel olması bile gerekmez. Örneğin, epidemiyoloji vb.

İkinci ifadeniz muhtemelen bir tür homojenlik varsayımına dayanmaktadır: tüm insanlar aynıdır.


İfade 2'nin doğru olduğunu düşünmüyorum, çünkü her insanın farklı x ve βTxtehlikeye katkıda bulunur. tüm insanların aynı olduğunu nasıl varsayabiliriz?
Haitao Du

@ hxd1011, modelinize bağlıdır. Araba parçalarını modelliyorsanız, aynı olduklarını varsayabilirsiniz. Öte yandan başarısızlıkları parti numarası ile ilişkilendirilebilir, o zaman aynı değildir vb.
Aksakal

Sorumumu cox modelinde daha spesifik olacak şekilde düzenledim, Kaplan_Meier eğrisindeki cevabınız hala geçerli mi?
Haitao Du

2

Jarle Tufto'nun cevabı için teşekkürler. Sanırım kendime cevap verebilmeliyim: her iki ifade de yanlış . Oluşturulan eğriS0(t) Ama değil S(t).

Temel hayatta kalma fonksiyonu S0(t) eşit olacak S(t) Yalnızca x=0. Bu nedenle eğri tüm popülasyonu veya herhangi bir bireyi tanımlamaz.


0

İlk seçeneğiniz doğrudur. Genellikle,S(t)=0.2 başlangıçtaki hastaların% 20'sinin güne kadar hayatta kaldığını gösterir t, Hesap sansür içine almadan . Sansürlü verilerde, bazılarının daha önce takipten kaybolduğu ve durumlarının bilinmediği için % 20'nin o gün hala hayatta olduğunu söylemek doğru değildir . Bunu koymanın daha iyi bir yolu, o gün hala hayatta olan hastaların fraksiyonunun% 20 olduğu tahmin edilmektedir .

İkinci seçenek (bir gün daha hayatta kalma şansı, t) dır-dir 1-h(t), ile h(t) tehlike fonksiyonunu gösterir.

Varsayımlarla ilgili olarak: Cox regresyon ortamındaki olağan katsayı testlerinin gözlenen ortak değişkenlere bağlı olarak bağımsızlık kazandığını düşündüm. Kaplan-Meier tahmini bile hayatta kalma süresi ile sansürleme arasında bağımsızlık gerektiriyor gibi görünmektedir ( referans ). Ama yanılmış olabilirim, bu yüzden düzeltmeler açıktır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.