Üstel dağılımın ML tahmini (sansürlenmiş verilerle)


9

Hayatta Kalma Analizinde, bir rv hayatta kalma süresinin katlanarak dağıtıldığını . Ben şimdi düşünüldüğünde iid RV ait "çıktıları" . Bu sonuçların sadece bir kısmı aslında "tamamen gerçekleşir", yani geriye kalan gözlemler hala "canlıdır".Xix1,,xnXi

Dağılımın rate parametresi için bir ML tahmini yapmak istersem, gerçekleştirilmeyen gözlemleri tutarlı / uygun bir şekilde nasıl kullanabilirim? Tahmin için hala yararlı bilgiler içerdiklerine inanıyorum.λ

Birisi bana bu konuyla ilgili literatür konusunda rehberlik edebilir mi? Eminim var. Ancak konu için iyi anahtar kelimeler / arama terimleri bulmakta sorun yaşıyorum.


3
Eğer gelen söylüyoruz Yani bir ölçüm var olan rasgele değişkenler, demek (ilişkili rastgele değişkenler ölçüm zamanda "ölü" olduğunu, çünkü) gerisi ise gözlemler yaşam uzunlukları "kesinleşmiş" temsil gözlemler, ölçüm zamanında "hala canlı" olan rasgele değişkenlerin hayatta kalma uzunluklarıdır? ( )nn1<nn2<nn1+n2=n
Alecos Papadopoulos

1
bu, kesilmiş bir modeldir, "canlı" rasgele değişkenler, gözlem durduğunda kesilir.
Xi'an

1
Kesik veriler ve ilgili kaynaklar için Tobit modellerine göz atın (örn. Burada ).
Richard Hardy

2
Bazı insanların öldüğü yaşamlar gibi sansürlenmiş verileriniz var gibi görünüyor, ancak bazıları hala hayatta, böyle bilinen bir sabit için sadece olduğunu . xi>titi
kjetil b halvorsen

3
İki durum arasındaki bazen küçük farklara dikkat edin. Kesmenin sansürle karıştırılması nadir değildir, bunun tersi de geçerlidir.
Alecos Papadopoulos

Yanıtlar:


17

Yine de olasılığı doğrudan kullanarak parametreleri tahmin edebilirsiniz. Gözlemler ve bilinmeyen hızlı üstel dağılım ile . Yoğunluk işlevi , kümülatif dağılım işlevi ve kuyruk işlevi . İlk gözlemlerinin tamamen gözlemlendiğini varsayalım, için yalnızca bilinen bazı pozitif sabitler için olduğunu biliyoruz.x1,,xnλ>0f(x;λ)=λeλxF(x;λ)=1eλxG(x;λ)=1F(x;λ)=eλxrxr+1,,xnxj>tjtj. Her zaman olduğu gibi, tarafından verilen sansürlenen gözlemler için "gözlenen verilerin olasılığı" , bu nedenle tam olasılık işlevi Mantıksallık işlevi , ilk terimi hariç, olağan, tam olarak gözlemlenen durumun mantıksallığı ile aynı forma sahiptir . yeri . Yazma gözlem ve sansür kez ortalama için, maksimum olabilirlik tahmincisi olurP(Xj>tj)=G(tj;λ)

L(λ)=i=1rf(xi;λ)i=r+1nG(tj;λ)
l(λ)=rgünlükλ-λ(x1++xr+tr+1++tn)
rgünlükλngünlükλTλλ^=rnTTamamen gözlemlenen vaka ile karşılaştırabileceğiniz .
 EDIT   

Yorumdaki soruyu cevaplamaya çalışmak için: Tüm gözlemler sansürlendiyse, yani herhangi bir olayı (ölüm) gözlemlemek için yeterince beklemedik, ne yapabiliriz? Bu durumda, , bu log benzeri olur olduğuna göre, azalan lineer . Bu yüzden maksimum için olmalı ! Ancak sıfır, herhangi bir üstel dağılıma karşılık gelmediğinden rate parametresi için geçerli bir değer değildir. Bu durumda maksimum olabilirlik tahmin edicisinin mevcut olmadığı sonucuna varmalıyız! Belki için bir çeşit güven aralığı oluşturmaya çalışabilirizr=0

l(λ)=-nTλ
λλ=0λλbu mantıksallık işlevine dayanıyor mu? Bunun için aşağıya bakın.

Ancak, her durumda, bu durumda verilerden elde edilen gerçek sonuç, bazı olaylar alana kadar daha fazla zaman beklememiz gerektiğidir ...

Tüm gözlemlerin sansürlenmesi durumunda için nasıl (tek taraflı) bir güven aralığı oluşturabiliriz . Bu durumda olabilirlik fonksiyonu, tüm başarıları elde ettiğimiz bir binom deneyinden olabilirlik fonksiyonuyla aynı forma sahip olan 'dir ( (ayrıca bkz. Binom tahmini) 0 veya 1 ). Bu durumda , şeklindeki için tek taraflı bir güven aralığı istiyoruz . Sonra çözerek için bir aralık alırız .λe-λnTpnp[p¯,1]λgünlükp=-λT

Biz güven aralığını olsun çözerek , böylece . Bu, sonunda : için güven aralığını verirp

P(X=n)=pn0.95    (söyle)
ngünlükpgünlük0.95λ
λ-günlük0.95nT.

1
" Bütün gözlemler sadece olduğunu ve hiçbir gözlemin tam olarak gözlenmediğini bildiğimiz ikinci " diye düşündüm. Bu davayı cevabınıza bir uzantı olarak dahil etmek gerçekten yararlı olacaktır. xj>tj
Alecos Papadopoulos
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.