Negatif Binom Dağılımı içindeki parametreleri anlama


37

Verilerimi çeşitli modellere sığdırmaya çalışıyordum ve fitdistrkütüphanedeki işlevin bana en iyi MASSsonucu Rverdiğini anladım Negative Binomial. Şimdi wiki sayfasından, tanım şöyle verilir:

NegBin (r, p) dağılımı, son denemede başarı ile sonuçlanan k + r Bernoulli (p) denemelerinde k başarısızlık ve r başarı olasılığını tanımlar.

RModel uydurma gerçekleştirmek için kullanmak bana iki parametre verir meanve dispersion parameter. Bunları nasıl yorumlayacağımı anlamıyorum çünkü bu parametreleri wiki sayfasında göremiyorum. Tek görebildiğim şu formül:

Negatif Binom Dağılım Formülü

nerede kgözlem ve sayısıdır r=0...n. Şimdi bunları bunları verilen parametrelerle nasıl ilişkilendirebilirim R? Yardım dosyası da fazla bilgi sağlamaz.

Ayrıca, sadece denemem hakkında birkaç söz söylemek gerekirse: Yaptığım sosyal bir denemede, her kullanıcının 10 günlük bir sürede temas ettiği kişi sayısını saymaya çalışıyordum. Deney için popülasyon büyüklüğü 100'dü.

Şimdi, model Negatif Binom'a uyarsa, bu dağılımı takip ettiğini açıkça söyleyebilirim ama bunun arkasındaki sezgisel anlamı gerçekten anlamak istiyorum. Test deneklerimle temas eden kişi sayısının negatif binom dağılımını takip ettiğini söylemek ne anlama geliyor? Birisi lütfen bunu netleştirmek için yardımcı olabilir mi?

Yanıtlar:


42

Sen görünmelidir NB Vikipedi'ye altındaki o "gama-Poisson karışım" diyor. İken ben genellikle size elde edene kadar yazı tura istediğinizi varsayalım" olarak sınıflar için tanımlamak beri "sikke saygısız" tanımını diyoruz sen alıntı tanımlı (k"" başlıkları türetme olasılığı veya matematiksel istatistik bağlamında daha kolay anlaşılır ve anlamlıdır, gamma-Poisson karışımı (benim deneyimime göre) uygulanan bağlamlardaki dağılım hakkında düşünmek için çok daha genel olarak yararlı bir yoldur. (Özellikle, bu tanım, dispersiyon / size parametresinin tamsayı olmayan değerlerine izin verir.) Bu bağlamda, dispersiyon parametreniz, verilerinizi temel alan ve kendi iç temas seviyelerindeki bireyler arasındaki gözlemlenmemiş varyasyonu tanımlayan hipotetik bir Gamma dağılımının dağılımını açıklar. Bu Gamma şekil parametresidir, ve bilmek için bu düşünerek de yararlı olabilir şeklinde bir Gama dağılımının varyasyon katsayısı parametresi isimli ; olarakθ1/θθ büyüdükçe gizli değişkenlik yok olur ve dağıtım Poisson'a yaklaşır.


7
hı. Nedenini beğenmedim acaba?
Ben Bolker

NB (ortalama, dağılım) formülasyonu, şimdi bu wiki sayfasında alternatif formülasyonlar ( en.wikipedia.org/wiki/… ) bölümünde de açıklanmaktadır .
mt1022 22.08.2018

10

Daha önceki görevimde de belirttiğim gibi, veriyi saymak için bir dağıtım hazırlamaya başlıyorum. İşte öğrendiklerim arasında:

Varyans ortalamanın üzerinde olduğunda, aşırı dağılma belirgindir ve bu nedenle negatif binom dağılımı muhtemelen uygun olur. Varyans ve ortalama aynıysa, Poisson dağılımı önerilmektedir ve varyans ortalamanın altındaysa, önerilen binom dağılımıdır.

Üzerinde çalıştığınız sayım verileriyle, R'deki Negatif Binom fonksiyonunun "ekolojik" parametreleştirmesini kullanıyorsunuz. Aşağıdaki serbestçe temin edilebilen kitabın 4.5.1.3 (Sayfa 165). R, az değil!) ve umarım, bazı sorularınızı ele alabilir:

http://www.math.mcmaster.ca/~bolker/emdbook/book.pdf

Verilerinizin sıfır kısaltılmış olduğu sonucuna varırsanız (yani, 0 gözlemin olasılığı 0'dır), o zaman R VGAM paketindeki NBD'nin sıfır kısaltılmış lezzetini kontrol etmek isteyebilirsiniz .

İşte uygulamasına bir örnek:

library(VGAM)

someCounts = data.frame(n = c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16),
                     freq = c(182479,76986,44859,24315,16487,15308,5736,
                              2843,1370,1115,1127,49,100,490,106,2))

fit = vglm(n ~ 1, posnegbinomial, control = vglm.control(maxit = 1000), weights=freq,
           data=someCounts)

Coef(fit)

pdf2 = dposnegbin(x=with(someCounts, n), munb=0.8344248, size=0.4086801)

print( with(someCounts, cbind(n, freq, fitted=pdf2*sum(freq))), dig=9)

Umarım bu yardımcı olur.


Sayfa 165 kitabın içinde.
SmallChess
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.