Olay tahmini için hayatta kalma analizi


9

Veri kümelerimdeki her kayıt için aşağıdaki bilgilere sahibim

(X1 , ,Xm ,δ ,T )

nerede Xi özellikler, δ hedef olay meydana gelirse 1, aksi takdirde 0 olur ve Tgerçekleşen olayın zaman damgasıdır. Özellikle,T hiçbir etkinlik yoksa veya izlemin sona erme zamanına ayarlanmışsa eksik olabilir.

Veri kümemdeki her bir kayıt için bir risk endeksi hesaplamak istiyorum.

Ben özellikleri kullanan bir sınıflandırma modeli için gitmeyi düşünüyordum Xi sınıfı tahmin etmek δ. Ancak,T önemli: eğer olay δ Yakında ortaya çıkma riski daha yüksek olmalıdır.

Bu yüzden bir hayatta kalma analizi bu probleme uygun olmalıdır. Tam tahminine ihtiyacım yokS(t)=P(T>t) ancak yalnızca tek bir kayıt riskini temsil eden tek bir dizin.

Her kayıt için hesaplanabilecek ortalama sağkalım süresi hoş bir risk endeksi gibi görünüyor - risk ne kadar düşükse.

Sorum şu:

  1. Hayatta kalma analizi benim amacım için uygun mu?
  2. Modelimin performansını nasıl değerlendirebilirim?

Soru (2) hakkında: Harrell'i kullanmaya hevesliyim c-dizin gibi, ancak hesaplamak için hangi tahmini sonucun kullanıldığından emin değilim. Harrell'in Regresyon Modelleme Stratejileri kitabından sayfa 247:

cindeks [...] biri denek cevap verirken diğeri cevap vermeyecek şekilde olası tüm nesne çiftleri alınarak hesaplanır. Endeks, bu tip çiftlerin, cevap verenin cevap vermeyenlerden daha yüksek bir tahmin olasılığına sahip olduğu orandır.

Hayatta kalma analizi doğru bir seçim haline gelirse, zamanla değişen değişkenleri tanıtmak için bazı standart yöntemleri kullanmak kolay olmalı diye düşünüyorum. Xi(t).

Yanıtlar:


3

Hayatta kalma analizi benim amacım için uygun mu?

Bunu hayatta kalma analizi için daha az uygulanabilir yapan tek şey:

... TT hiçbir etkinlik yoksa veya izlemin sona erme zamanına ayarlanmışsa eksik olabilir.

Çoğu model için bireyin hayatta kaldığı son dönemi bilmeniz gerekir. Aksi takdirde, hayatta kalma analizini kullanmak basit ve uygulanabilir olmalıdır. Örneğin survival::coxph, R cinsinden Cox ile orantılı tehlike veya survival::survreg.

Her kayıt için hesaplanabilecek ortalama sağkalım süresi hoş bir risk endeksi gibi görünüyor - risk ne kadar düşükse.

Evet, önceki iki (sınıf sınıfı) model için ortalama hayatta kalma sürelerini veya sadece doğrusal öngörücüyü kullanabilirsiniz.

Modelimin performansını nasıl değerlendirebilirim?

cendeksi, AUC'nin "doğal" genellemesi olarak bana mantıklı bir seçim gibi geliyor. R ile örn Hmisc::rcorr.cens.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.