Iid olmayan Bernoulli değişkenlerinin bu rastgele toplamının olasılık dağılımı nedir?


9

Ben aynı dağılmamış değişkenlerin rastgele bir sayı olasılık dağılımını bulmaya çalışıyorum. İşte bir örnek:

John bir müşteri hizmetleri çağrı merkezinde çalışıyor. Sorunlu çağrılar alır ve çözmeye çalışır. Çözemedikleri, onları amirine iletir. Bir günde aldığı çağrı sayısının, ortalama ile bir Poisson dağılımını izlediğini varsayalım . Her sorunun zorluğu (kesinlikle başa çıkabileceği) oldukça basit şeylerden nasıl çözeceğini bilemeyeceği çok özel sorulara kadar değişir. i- problemini çözme olasılığının ve parametreleriyle bir Beta dağılımını izlediğini ve önceki problemlerden bağımsız olduğunu varsayın . Bir günde çözdüğü çağrı sayısının dağılımı nedir?μpiαβ

Daha resmi olarak, ben var:

Y=I(N>0)i=0NXi içini=0,1,2,...,N

burada , veNPoisson(μ)(Xi|pi)Bernoulli(pi)piBeta(α,β)

Şimdilik, bağımsız olduğunu varsaymaktan mutluluk duyuyorum . Ayrıca ve \ beta parametrelerinin birbirini etkilemediğini kabul ediyorum ancak \ mu büyük olduğunda bunun gerçek bir yaşam örneğinde, beta alfa ve \ beta parametreleri öyle ki Beta dağılımı düşük başarı oranları üzerinde daha fazla kütleye sahiptir s . Ama şimdilik görmezden gelelim.Xiμ,αβμαβp

hesaplayabilirim ama bu kadar. Ayrıca, dağılımının neye benzediğine dair bir fikir edinmek için değerleri simüle edebilirim (Poisson gibi görünüyor, ancak denediğim ve sayılarına mı düştüğünü veya genelleşip genelleşmediğini bilmiyorum, ve farklı parametre değerleri için nasıl değişebileceği). Bu dağılımın ne olduğu veya nasıl türetilebileceği hakkında herhangi bir fikrim var mı?P(Y=0)Yμ,αβ

Bu soruyu TalkStats Forum'a da gönderdiğimi lütfen unutmayın, ancak burada daha fazla dikkat çekebileceğini düşündüm. Çapraz gönderi için özür diler ve zaman ayırdığınız için şimdiden çok teşekkürler.

DÜZENLEME : Görüldüğü gibi (aşağıdaki çok yararlı cevaplara bakın - ve bunlar için teşekkürler!), Gerçekten bir dağıtımı, bir şey sezgilerime ve bazı simülasyonlara dayanarak tahmin ediyordum, ancak kanıtlayamadım. Şimdi şaşırtıcı bulduğum şey, Poisson dağılımının sadece dağılımının ortalamasına bağlı olduğu, ancak varyansından etkilenmediğidir.PÖbenssÖn(μαα+β)Betbir

Örnek olarak, aşağıdaki iki Beta dağılımı aynı ortalama fakat farklı varyansa sahiptir. Açıklık olması açısından, mavi pdf bir ve kırmızı olan .Betbir(2,2)Betbir(0.75,0.75)

Beta Dağılımları

Bununla birlikte, her ikisi de bana göre biraz sezgisel görünen aynı dağılımıyla sonuçlanır. (Sonucun yanlış olduğunu söylememek, sadece şaşırtıcı!)PÖbenssÖn(0.5μ)


Sabit için Poisson-binom dağılımı vardır, ancak probleminiz bundan daha karmaşıktır. N-
Tim

Teşekkürler, Poisson-binom dağılımını biliyorum ama burada rastgele. N-
Constantinos

Bileşik Poisson'a bir göz atabilirsiniz , ancak bunu yararlı hale getirmek için 0'larla biraz çalışmanız gerekebilir
Glen_b -Restate Monica

Yanıtlar:


6

Aramalar (yani ) bir Poisson sürecine göre gelir. Toplam çağrı sayısı bir Poisson dağılımını takip eder. Çağrıları iki türe ayırın, örneğin veya . Amaç saniyeyi üreten süreci belirlemektir . Bu önemsiz , sabit bir olasılık ile Poisson süreçlerinin süperpozisyon prensibi, tam işlem, sadece inceltilen: oranı ile, s da Poisson süreci olacaktır . Aslında durum böyle, oraya ulaşmak için ek bir adım gerekiyor.XiNXi=1Xi=01Xi=1p1pμ

üzerinde , böylece pi

Pr(Xi|α,β)=01piXi(1pi)1Xipiα1(1pi)β1B(α,β)dpi=B(Xi+α,1Xi+β)B(α,β)

Burada beta işlevidir. gerçeğini kullanarak yukarıdakiler basitleştirir;B(a,b)=Γ(a)Γ(b)Γ(a+b)Γ(x+1)=xΓ(x)

Pr(Xben=1|α,β)=Γ(1+α)Γ(β)Γ(1+α+β)Γ(α+β)Γ(α)Γ(β)=αα+β
Başka bir deyişle, . Süperpozisyon özelliğine göre, Poisson oranı ile dağıtılır .Xben~BernÖullben(αα+β)Yαμα+β

Şekilde sayısal bir örnek (R ile) ... dikey çizgiler simülasyondan ve kırmızı noktalar yukarıda türetilen pmf'dir:

draw <- function(alpha, beta, mu) 
{ N <- rpois(1, mu); p = rbeta(N, alpha, beta); sum(rbinom(N, size=1, prob=p)) }

pmf <- function(y, alpha, beta, mu)
  dpois(y, alpha*mu/(alpha+beta))

y <- replicate(30000,draw(4,5,10))
tb <- table(y)

# simulated pmf
plot(tb/sum(tb), type="h", xlab="Y", ylab="Probability")
# analytic pmf
points(0:max(y), pmf(0:max(y), 4, 5, 10), col="red")

resim açıklamasını buraya girin


3
  1. Dan beri pben bir ile rastgele bir değişkendir Beta(α,β) var E[pben]=αα+β ve bu aslında John'un bensorun, diğerlerinden bağımsız olarak.

  2. Bir gün içindeki toplam sorun sayısı parametreli bir Poisson dağılımına sahip olduğundan μ ve her biri olasılıkla çözülecek αα+β, John'un her gün çözdüğü sayının parametreli bir Poisson dağılımı vardır μαα+β

  3. Herhangi bir problemi çözmeme ihtimalini hesaplamanız P(Y=0)=e-μα/(α+β)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.