Lojistik regresyon modelini kullanarak ayrık bir zaman hayatta kalma analizi yapmaya çalışıyorum ve süreci tamamen anladığımdan emin değilim. Birkaç temel soruyla ilgili yardımı çok takdir ediyorum.
İşte kurulum:
Beş yıllık bir zaman diliminde bir gruba üyeliğe bakıyorum. Her üyenin üye olduğu her ay için aylık üyelik kaydı vardır. Üyeliği beş yıl boyunca başlayan tüm üyeleri düşünüyorum (daha önce katılan üyelerle "sol sansür" sorunlarından kaçınmak için). Her kayıt zamana göre dizine eklenir, bir zaman üye katıldığı aydır. Bu nedenle, iki buçuk yıl kalan bir üyenin otuz aylık kaydı olacak, bir ile otuz arasında sayılacak. Her kayda ayrıca, üyeliğin son ayı için bir değeri ve aksi takdirde sıfır olan bir ikili değişken verilecektir; ikili değişken için bir değeri, üyenin gruptan ayrıldığı olayı işaretler. Üyeliği beş yıllık analiz penceresinin ötesinde devam eden her üye için,
Dolayısıyla, lojistik regresyon modeli, ikili olay değişkeninin değerlerini tahmin etmek için inşa edilmiştir. Çok uzak çok iyi. İkili bir tahmin modelini değerlendirmenin tipik yollarından biri, bir ayırma örneği üzerindeki artışı ölçmektir. Üyelik sona erme olayını tahmin etmek için oluşturduğum lojistik regresyon modeli için, beşe bir olay olmayan olay oranına sahip bir tutma veri kümesindeki artışı hesapladım. Tahmin edilen değerleri ondalık sayılara sıraladım. En yüksek tahmin edilen değerlere sahip ondalık yüzde yetmiş, dörtten fazla bir kaldırma içerir. Birleştirilen ilk iki ondalık, dağıtımdaki tümlerin yüzde altmış beşini içerir. Bazı bağlamlarda bu oldukça iyi bir tahmin modeli olarak düşünülebilir, ancak bir hayatta kalma analizi yapmanın yeterli olup olmadığını merak ediyorum.
Let birey için tehlike fonksiyonu ay içinde ve izin ihtimali olması bireysel ay boyunca Survives .
İşte benim temel sorularım:
Ayrık tehlike fonksiyonu, , her ay hayatta kalmama (gruptan ayrılma) koşullu olasılığı mı?
Lojistik regresyon modeli tahminlerinden tahmin edilen değerler tehlike fonksiyonuna göre mi? (örneğin, bir ayrı model tahmin değerine eşit j ay içinde k risk fonksiyonu tahminlerinin elde edilmesi için yapılması gereken ya da daha fazla bir şey ihtiyacı vardır?)
Bireysel için q aya kadar hayatta kalma olasılığı, bir eksi aydan q'ya kadar olan tehlike fonksiyonuna eşittir , yani S [ j , q ] = ( 1 - h [ j , 1 ] ) ⋅ ( 1 - h [ j , 2 ] ) ⋅ … ⋅ ( 1 - h [ j , q ] ) ?
nin tüm bireyler üzerindeki ortalama değeri j her seferinde k genel popülasyon ortalama sağkalım olasılığı için makul bir tahmin midir?
Genel popülasyonun bir grafiğinin aylık hayatta kalma olasılığı aylık Kaplan-Meier grafiğine benzemesi gerekir mi?
Bu soruların herhangi birinin cevabı hayır ise, o zaman ciddi bir yanlış anlaşılmam var ve gerçekten biraz yardım / açıklama kullanabilirim. Ayrıca, doğru bir hayatta kalma profili oluşturmak için ikili tahmin modelinin ne kadar iyi olması gerektiğine dair bir kural var mı?