Cox orantılı tehlike modeli ve rastgele seçilmemiş örnek


9

Rastgele seçilmemiş numunenin neden olduğu Cox orantılı tehlike modelindeki sapmayı düzeltmek için herhangi bir yöntem var mı (Heckman'ın düzeltmesi gibi bir şey)?

Arka plan :
Durumun şöyle göründüğünü söyleyelim:
- İlk iki yıl boyunca tüm müşteriler kabul edilir.
- Bu iki yıldan sonra bir Cox PH modeli üretildi. Model, müşterilerin hizmetimizi ne kadar süre kullanacaklarını tahmin eder.
- Şirketin politikası şu andan itibaren sadece 3 ay 0,5'ten büyük hayatta kalma olasılığı bulunan müşteriler kabul edildiğinden diğerleri reddedildi.
- İki yıl sonra yeni bir model yapılması gerekiyor. Sorun şu ki, sadece kabul edilen müşteriler için hedefimiz var ve sadece bu istemcileri kullanmak ciddi önyargılara neden olabilir.


1
Bu analizin amacı nedir? Bir Cox PH modeli, bazı yumuşatma yöntemleri veya parametrik modelleme eklemediğiniz sürece açıkça başarısızlık süresini tahmin etmez. Bu modelde hangi tabakalaşma / ayarlama değişkenleri var?
AdamO

Yanıtlar:


4

Parametrik yaklaşımların yarı parametrik Cox Modeli ile hesaplanması sorunu, bu özel sorunun aslında eksik verilerle ilgili olmasıdır. Model parametrelerine (ve temel tehlike fonksiyon tahminlerine) dayalı bir risk tahminine sahip olduğumuz göz önüne alındığında, yazar bir Cox modelinden nasıl mutlak risk tahminleri elde ettiğini açıklamamış olsa da, verilerin ikinci aşamasında içerme olasılığı toplama orijinal risk tahminine bağlıdır, bu nedenle eksiklik gözlemlenen değişkenlere, yani rastgele verilerde eksikliğe bağlıdır.
AdamO

2

Basit cevap ağırlıktır. Yani, "kabul edilen" gruptaki grupları ilgili popülasyona standardize etmek için ağırlıkları kullanabilirsiniz. Bu ağırlıkların, hem birinci hem de ikinci 2 yıllık fazları kullanarak birleştirilmiş bir analizde kullanılmasından kaynaklanan sorun, tahmini nüfus ağırlıklarının ve parametrelerin artık bağımlı olmasıdır. Örnek ağırlıklar ve parametre tahminleri arasındaki bağımlılığı göz ardı ettiğinizde, tipik olarak yalancı yaklaşım yaklaşımı kullanılır (bu durumda, bir tür sözde kısmi olasılık olabilir). Bununla birlikte, birçok pratik durumda (ve bu farklı değildir), bu bağımlılığın hesaplanması gereklidir. Tehlike oranlarının etkili bir tahmincisini yaratma sorunu zor ve bildiğim kadarıyla açık uçlu.

İki Fazlı Tabakalı Örneklerden Geliştirilmiş Horvitz-Thompson Model Parametrelerinin Tahmini: Epidemiyolojideki Uygulamalar .

Makale, tipik olarak lojistik regresyonda uygulanan anket yöntemlerini tartışmaktadır, ancak hayatta kalma verilerini de ağırlıklandırabilirsiniz. Bahsetmeyi ihmal ettiğiniz bazı önemli hususlar, tüm popülasyon için mi yoksa 2 yıllık tahminlere dayalı "niteleyici" popülasyon için mi, yoksa sonuçlara dayalı olarak "niteleyici" popülasyon için mi geçerli olduğuyla ilgilidir. modeli. Ayrıca, Cox modelinden takılan değerler risk olarak yorumlanamayacağından, böyle bir "tahmin" modelinin bir Cox modelinden nasıl yaratıldığından bahsetmediniz. Tehlike oranlarını tahmin ettiğinizi ve ardından temel tehlike işlevinin düzgün bir tahminini aldığınızı varsayıyorum.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.