Kümülatif tehlike fonksiyonu için sezgi (sağkalım analizi)


17

Aktüeryal bilimdeki (özellikle Cox Orantılı Tehlikeler Modeli için) ana işlevlerin her biri için sezgi almaya çalışıyorum. Şimdiye kadar sahip olduğum şey:

  • f(x) : başlangıç ​​saatinden başlayarak, ne zaman öleceğinizin olasılık dağılımı.
  • F(x) : sadece kümülatif dağılım. zamanındaT, nüfusun yüzde kaçı ölecek?
  • S(x) :1F(x) . zamanındaT, nüfusun yüzde kaçı hayatta kalacak?
  • h(x) : tehlike fonksiyonu. Belirli bir zamanda (T , hala hayatta olan insanların, bir sonraki zaman aralığında kaç kişinin öleceğini tahmin etmek için veya -> 0, 'anlık' ölüm olasılığını tahmin etmek için kullanılabilir.
  • H(x) : kümülatif tehlike. Fikrim yok.

Tehlike değerlerini, özellikle de sürekli olduklarında birleştirmenin ardındaki fikir nedir? Dört mevsimde ölüm oranlarına sahip ayrı bir örnek kullanırsak ve tehlike işlevi aşağıdaki gibidir:

  • İlkbahardan itibaren herkes yaşıyor ve% 20'si ölecek
  • Şimdi Yazın, kalanların% 50'si ölecek
  • Şimdi Sonbaharda, kalanların% 75'i ölecek
  • Son sezon Kış. Kalanların% 100'ü ölecek

Sonra kümülatif tehlike% 20,% 70,% 145,% 245 ?? Bu ne anlama geliyor ve bu neden faydalı?


1
İşletme 's olmalıdır x s', ya da tam tersi. Tx
Glen_b

5
İlgili (çok yaygın karışıklık olmasına rağmen), bir hata var. "Aralık-> 0," anlık "ölüm olasılığı" yazarsınız. Doğru bir ifade 'anlık ölüm oranı ' olacaktır. Bu bir olasılık olamaz, çünkü d t'ye bölünen bir olasılıktır ; dahası,> 1 olabilir. h(x)dt
gung - Monica'yı eski durumuna getirin

Yanıtlar:


6

Öldüğünüz gibi ölmek oranlarını birleştirmek size kümülatif tehlike vermez. Sürekli zamanda tehlike oranı, çok kısa bir aralıkta bir olayın gerçekleşmesi için şartlı bir olasılıktır:

h(t)=limΔt0P(t<Tt+Δt|T>t)Δt

Kümülatif tehlike, yaş / zaman üzerindeki (anlık) tehlike oranını bütünleştirmektedir. Olasılıkları toplamak gibidir, ancak çok küçük olduğu için, bu olasılıklar da küçük sayılardır (örneğin, ölüm tehlikesi oranı 30 yaş civarında 0.004 civarında olabilir). Tehlike oranı, olayı t öncesi deneyimlememeye bağlıdır , bu nedenle bir popülasyon için 1'den fazla olabilir.Δtt

Bunun bir ayrık zamanlı formülasyonu olmasına rağmen, bazı insan ölüm hayat tablosuna bakacak ve birikir deneyebilirsiniz .mx

R kullanırsanız, bu işlevlerin her 1 yıllık yaş aralığındaki ölüm sayısından yaklaşık olarak küçük bir örneği:

dx <-  c(3184L, 268L, 145L, 81L, 64L, 81L, 101L, 50L, 72L, 76L, 50L, 
         62L, 65L, 95L, 86L, 120L, 86L, 110L, 144L, 147L, 206L, 244L, 
         175L, 227L, 182L, 227L, 205L, 196L, 202L, 154L, 218L, 279L, 193L, 
         223L, 227L, 300L, 226L, 256L, 259L, 282L, 303L, 373L, 412L, 297L, 
         436L, 402L, 356L, 485L, 495L, 597L, 645L, 535L, 646L, 851L, 689L, 
         823L, 927L, 878L, 1036L, 1070L, 971L, 1225L, 1298L, 1539L, 1544L, 
         1673L, 1700L, 1909L, 2253L, 2388L, 2578L, 2353L, 2824L, 2909L, 
         2994L, 2970L, 2929L, 3401L, 3267L, 3411L, 3532L, 3090L, 3163L, 
         3060L, 2870L, 2650L, 2405L, 2143L, 1872L, 1601L, 1340L, 1095L, 
         872L, 677L, 512L, 376L, 268L, 186L, 125L, 81L, 51L, 31L, 18L, 
         11L, 6L, 3L, 2L)

x <- 0:(length(dx)-1) # age vector

plot((dx/sum(dx))/(1-cumsum(dx/sum(dx))), t="l", xlab="age", ylab="h(t)", 
     main="h(t)", log="y")
plot(cumsum((dx/sum(dx))/(1-cumsum(dx/sum(dx)))), t="l", xlab="age", ylab="H(t)", 
     main="H(t)")

Bu yardımcı olur umarım.


H (t) * dt'nin t çevresinde uzunluk dt aralığında meydana gelen bir olayın olasılığı olduğunu söylemek doğru mu? bu nedenle, h (t) değeri, t etrafında merkezlenen 1 birim zaman içinde meydana gelen bir olayın olasılığıdır. Bu sadece h (t) <= 1
karga

10

Mario Cleves'in "Stata Kullanarak Hayatta Kalma Analizine Giriş" (2. Baskı) kitabının bu konuda iyi bir bölümü var.

Bu bölümü google kitaplarda bulabilirsiniz , s. 13-15. Ancak 2. bölümün tamamını okumanızı tavsiye ederim.

İşte kısa form:

  • "t zamanına kadar biriken toplam risk miktarını ölçer" (s. 8)
  • veri yorumunu say: "yalnızca başarısızlık olayı tekrarlanabilir olsaydı, belirli bir süre boyunca başarısızlıkları (veya diğer olayları) gözlemlememizi (matematiksel olarak) kaç kez beklediğimizi verir" (s. 13)

5

TEHLİKE , tanılama alanlarındaki kullanımı nedeniyle dikkate değer olduğunu tahmin ediyorum :

h(x)=eβTzh0(x)βzh0(x)logH(x)=βTz+H0(x)logH^(x)x

h(x)=αθ(xθ)α1θαlogH(x)=αlogxαlogθlogH^(x)logxα^α^logθ^, Weibull varsayımının doğru olması koşuluyla. Ve elbette 1'e yakın bir eğim, üstel bir modelin sığabileceğini gösterir.

H(x)x


3

@Scortchi'nin söylediklerini açıklarken, kümülatif tehlike işlevinin hoş bir yorumu olmadığını vurgulayacağım ve bu nedenle sonuçları yorumlamak için bir yol olarak kullanmaya çalışmayacağım; istatistiksel olmayan bir araştırmacıya kümülatif tehlikelerin farklı olduğunu söylemek büyük olasılıkla "mm-hm" cevabı ile sonuçlanacaktır ve daha sonra konuyu bir daha asla sormayacaklar, iyi bir şekilde değil.

Bununla birlikte, kümülatif tehlike işlevi, tehlike işlevini ve hayatta kalma işlevini bağlamanın genel bir yolu gibi, matematiksel olarak çok yararlı olduğu ortaya çıkmaktadır. Bu nedenle, kümülatif tehlikenin ne olduğunu ve çeşitli istatistiksel yöntemlerde nasıl kullanılabileceğini bilmek önemlidir. Ancak genel olarak, kümülatif tehlikeler açısından gerçek veriler üzerinde düşünmenin özellikle yararlı olduğunu düşünmüyorum.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.