Sağkalım fonksiyonlarına uyum iyiliği nasıl değerlendirilir


9

Sınıflandırma ve regresyon konusunda biraz bilgim olmasına rağmen, hayatta kalma analizine yeni başladım.

Regresyon için MSE ve R kare istatistiklerine sahibiz. Fakat hayatta kalma model A'nın bazı grafiksel grafiklerin (KM eğrisi) yanı sıra hayatta kalma modeli B'den daha üstün olduğunu nasıl söyleyebiliriz?

Mümkünse, lütfen farkı bir örnekle açıklayın (örneğin, R'deki rpart paketi). Bir CART hayatta kalma ağacının başka bir CART hayatta kalma ağacından daha iyi olduğunu nasıl gösterebilirsiniz? Hangi metrikler kullanılabilir?


3
Çeşitli vardır türlü sağkalım analizi. Bazıları gerçekten gerilemeye dayanıyor. KM gibi bazıları, hayatta kalma ile ilgili istatistikler için tahmin ediciler olarak daha kolay düşünülebilir.
Alexis

Sorunuzu geliştirmek için gösterdiğiniz çaba için teşekkür ederiz. Şimdi CV için sorumlu / uygun olduğundan şüpheleniyorum. Tekrar açmaya aday gösterdim. Başkalarının aynı fikirde olup olmadığını göreceğiz. İnsanların bu sorunları açıklamada kullanmaları için iki CART türü hayatta kalma modeli yayınlayabilirseniz yardımcı olabilir.
gung - Monica'yı eski

1
Ben, Temelde bir Cox Orantılı Tehlike Regresyonunda, uyumun iyiliğini değerlendirmenin (şimdiye kadar) iyi bir yolu olmadığını mı söylüyorsunuz? R-Square sansürlü gözlemleri ve sansürsüz gözlemleri doğru bir şekilde işleyemediği için iyi sonuçlara yol açmıyor mu? Harrells c'den bahsediyorsun, bu yöntemin Cox-PH Regresyonu için geçerli olmadığını doğru anladım mı?
Kosta S.17

Yanıtlar:


9

Cox modeli gibi istatistiklerle ilgili temel sorun R,2(başka bir cevapta açıklanmıştır) verilerinizin sansür dağılımına çok bağımlı olmasıdır. Null modele olasılık oranı gibi bakabileceğiniz diğer doğal şeyler de bu soruna sahiptir. (Bunun nedeni, sansürlenmiş bir veri noktasının katkısının olasılığa katkısının, olayın gözlemlendiği bir veri noktasının katkısından çok farklı olmasıdır, çünkü bunlardan biri PDF'den ve biri CDF'den gelir.) Çeşitli araştırmacılar bunun üstesinden gelmek için önerilen yollar, ancak gördüklerim genellikle sansür dağılımının bir modelini veya aynı derecede pratik olmayan bir şeyi gerektirir. Bu bağımlılığın uygulamada ne kadar kötü olduğuna bakmadım, bu yüzden sansürünüz oldukça hafifse, yine de olasılık oranına dayalı istatistiklere bakabilirsiniz. Hayatta kalma CART modelleri için,

Jenerik hayatta kalma modelleri için, sık kullanılan bir istatistik Harrell'in Kendall'ın analogu olan c endeksidir.τveya hayatta kalma modelleri için ROC AUC. Esasen, c , bir örneğin diğerinden sonra bir olay yaşadığını bildiğiniz tüm örneklerin , modelin doğru sıralandığı orandır. (Başka bir deyişle, burada paydaya bir çift örneğin dahil edilmesi için, en çok biri sansürlenebilir ve diğeri bir olay yaşandıktan sonra sansürlenmelidir .) C endeksi sansür dağılımına da bağlıdır, ancak Harrell'e göre, bağımlılık yukarıda bahsettiğim diğer istatistiklerden daha hafif. Ne yazık ki, Harrell'in cayrıca yukarıdaki istatistiklerden daha az duyarlıdır, bu nedenle aralarındaki fark küçükse buna dayalı modeller arasında seçim yapmak istemeyebilirsiniz; yorumlanabilir bir genel performans endeksi olarak farklı modelleri karşılaştırmanın bir yoludur.

(Son olarak, elbette modeller için aklınızda belirli bir amacınız varsa - yani, tahmin kaybı fonksiyonunuzun ne olduğunu biliyorsanız - bunları her zaman kayıp fonksiyonuna göre değerlendirebilirsiniz! Ama sanırım ' o kadar şanslı değilim ...)

Hem olasılık oranı istatistikleri hem de Harrell's c hakkında daha ayrıntılı bir tartışma için Harrell'in mükemmel Regresyon Modelleme Stratejileri ders kitabına bakmalısınız . Hayatta kalma modellerini değerlendirme bölümü §19.10, sf. 492-493'tür. Üzgünüm sana tek bir kesin cevap veremiyorum, ama bunun çözülmüş bir problem olduğunu düşünmüyorum!


5

Hayatta kalma verileri için Cox orantılı tehlike regresyonlarının, birçok açıdan standart regresyonlara karşılık geldiği düşünülebilir. Örneğin, Cox regresyonları, artık standart hatalar ve R-kare istatistikleri de sağlar. coxphR survivalpaketindeki işleve bakın . (KM eğrilerini standart istatistiklerde parametrik olmayan analizlere karşılık gelen olarak düşünebilirsiniz. Parametrik olmayan bir testi CART'a nasıl dahil edersiniz?) Klinik verilerle pratikte, artık standart hatalar yüksek ve R-kare değerleri düşük olma eğilimindedir. Cox regresyonunda.

Bu nedenle standart regresyonlar ve Cox regresyonları benzer gereksinimlere ve sınırlamalara sahiptir. Verilerin, Cox analizinde, karşılaştırılan tehlikelerin zamanla orantılı olduğu varsayımını da içeren temel varsayımlara uyduğunu doğrulamalısınız. Yine de fazla oturmamaktan kaçınmanız ve modelinizi doğrulamanız gerekecektir. Ve CART'ı anladığım kadarıyla, kendim kullanmama rağmen, yine de iç içe olmayan modelleri karşılaştırarak karşılaştığınız zorluklarla karşılaşacaksınız.


Cox regresyon ve regresyon arasındaki fark ve ilişkiler hakkındaki cevabınız için teşekkür ederiz. Ancak iki rpart (CART) karar ağacı hayatta kalma modelinin nasıl karşılaştırılacağını bilmek istiyorum.
taşkın

En bağlantılı açık erişimli kağıt projecteuclid.org/euclid.ssu/1315833185 oldukça yeni yorum ve bina ve dayalı, hayatta kalma ağaçları seçme yöntemleri karşılaştırmadır rpartdiğer R paketler ve kod ve.
EdM

Gazeteyi okuduğunuz için teşekkürler. Gazeteyi şimdi okuyacağım.
14'te
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.