Cox orantılı tehlike modeli ve rastgele seçilmemiş örnek

9

Rastgele seçilmemiş numunenin neden olduğu Cox orantılı tehlike modelindeki sapmayı düzeltmek için herhangi bir yöntem var mı (Heckman'ın düzeltmesi gibi bir şey)?

Arka plan :
Durumun şöyle göründüğünü söyleyelim:
- İlk iki yıl boyunca tüm müşteriler kabul edilir.
- Bu iki yıldan sonra bir Cox PH modeli üretildi. Model, müşterilerin hizmetimizi ne kadar süre kullanacaklarını tahmin eder.
- Şirketin politikası şu andan itibaren sadece 3 ay 0,5'ten büyük hayatta kalma olasılığı bulunan müşteriler kabul edildiğinden diğerleri reddedildi.
- İki yıl sonra yeni bir model yapılması gerekiyor. Sorun şu ki, sadece kabul edilen müşteriler için hedefimiz var ve sadece bu istemcileri kullanmak ciddi önyargılara neden olabilir.

bias cox-model

— Tomek Tarczynski
kaynak

1

Bu analizin amacı nedir? Bir Cox PH modeli, bazı yumuşatma yöntemleri veya parametrik modelleme eklemediğiniz sürece açıkça başarısızlık süresini tahmin etmez. Bu modelde hangi tabakalaşma / ayarlama değişkenleri var?

— AdamO

4

Parametrik tehlike modellerine önerilen çözümler vardır. Bunlara bir göz atın:

Prieger, James, 2000. "Normal Olmayan Veriler için Genelleştirilmiş Parametrik Seçim Modeli," Çalışma Belgeleri 00-9, Davis Üniversitesi, Davis, Ekonomi Bölümü.

Boehmke, Frederick J., Daniel Morey ve Megan Shannon. 2006. "Seçim Yanlılığı ve Sürekli Zaman Süreli Modeller: Sonuçlar ve Önerilen Çözüm." Amerikan Siyaset Bilimi Dergisi 50 (1): 192-207.

"Dursel" paketinin Stata'daki sonraki makalesi için kod var

Ancak, yarı parametrik Cox modeli için bir çözümün farkında değilim.

— jorpppp
kaynak

Parametrik yaklaşımların yarı parametrik Cox Modeli ile hesaplanması sorunu, bu özel sorunun aslında eksik verilerle ilgili olmasıdır. Model parametrelerine (ve temel tehlike fonksiyon tahminlerine) dayalı bir risk tahminine sahip olduğumuz göz önüne alındığında, yazar bir Cox modelinden nasıl mutlak risk tahminleri elde ettiğini açıklamamış olsa da, verilerin ikinci aşamasında içerme olasılığı toplama orijinal risk tahminine bağlıdır, bu nedenle eksiklik gözlemlenen değişkenlere, yani rastgele verilerde eksikliğe bağlıdır.

— AdamO

2

Basit cevap ağırlıktır. Yani, "kabul edilen" gruptaki grupları ilgili popülasyona standardize etmek için ağırlıkları kullanabilirsiniz. Bu ağırlıkların, hem birinci hem de ikinci 2 yıllık fazları kullanarak birleştirilmiş bir analizde kullanılmasından kaynaklanan sorun, tahmini nüfus ağırlıklarının ve parametrelerin artık bağımlı olmasıdır. Örnek ağırlıklar ve parametre tahminleri arasındaki bağımlılığı göz ardı ettiğinizde, tipik olarak yalancı yaklaşım yaklaşımı kullanılır (bu durumda, bir tür sözde kısmi olasılık olabilir). Bununla birlikte, birçok pratik durumda (ve bu farklı değildir), bu bağımlılığın hesaplanması gereklidir. Tehlike oranlarının etkili bir tahmincisini yaratma sorunu zor ve bildiğim kadarıyla açık uçlu.

İki Fazlı Tabakalı Örneklerden Geliştirilmiş Horvitz-Thompson Model Parametrelerinin Tahmini: Epidemiyolojideki Uygulamalar .

Makale, tipik olarak lojistik regresyonda uygulanan anket yöntemlerini tartışmaktadır, ancak hayatta kalma verilerini de ağırlıklandırabilirsiniz. Bahsetmeyi ihmal ettiğiniz bazı önemli hususlar, tüm popülasyon için mi yoksa 2 yıllık tahminlere dayalı "niteleyici" popülasyon için mi, yoksa sonuçlara dayalı olarak "niteleyici" popülasyon için mi geçerli olduğuyla ilgilidir. modeli. Ayrıca, Cox modelinden takılan değerler risk olarak yorumlanamayacağından, böyle bir "tahmin" modelinin bir Cox modelinden nasıl yaratıldığından bahsetmediniz. Tehlike oranlarını tahmin ettiğinizi ve ardından temel tehlike işlevinin düzgün bir tahminini aldığınızı varsayıyorum.

— Adamo
kaynak