Sormakta olduğunuz dağıtıma , oldukça karmaşık pmf ile Poisson Binom dağılımı denir (daha geniş açıklama için Wikipedia'ya bakın)
Pr ( X= x ) = ∑A ∈ FxΠi ∈ ApbenΠj ∈ Ac( 1 - pj)
Genel olarak sorun, bu denklemi daha fazla sayıda deneme için kullanamamanızdır (genellikle deneme sayısı aştığında ). Ayrıca, pmf'yi hesaplamanın başka yöntemleri de vardır, örneğin özyinelemeli formüller, ancak bunlar sayısal olarak kararsızdır. Bu problemlerin en kolay yolu yaklaşıklama yöntemleridir (örneğin Hong, 2013 tarafından tanımlanmıştır ). Eğer tanımlarsakn = 30
μ = ∑i = 1npben
σ= ∑i = 1npben( 1 - pben)-----------√
γ= σ- 3Σi = 1npben( 1 - pben) ( 1 - 2 sben)
küçük sayılar kanunu veya Le Cams teoremi ile Poisson dağılımı ile pmf'ye yaklaşabiliriz
Pr ( X= x ) ≈ μxtecrübe( - μ )x !
ancak genellikle Binom yaklaşımının daha iyi davrandığını görür ( Choi ve Xia, 2002 )
Pr ( X= x ) ≈ B i n o m ( n , μn)
Normal yaklaşımı kullanabilirsiniz
f( x ) ≈ ϕ ( x + 0,5 - μσ)
veya cdf, rafine edilmiş Normal yaklaşım kullanılarak tahmin edilebilir (Volkova, 1996)
F( x ) ≈ maks. ( 0 , g ( x + 0,5 - μσ) )
burada .g( x ) = Φ ( x ) + γ( 1 - x2) ϕ ( x )6
Başka bir alternatif elbette Monte Carlo simülasyonudur.
Basit dpbinom
R fonksiyonu
dpbinom <- function(x, prob, log = FALSE,
method = c("MC", "PA", "NA", "BA"),
nsim = 1e4) {
stopifnot(all(prob >= 0 & prob <= 1))
method <- match.arg(method)
if (method == "PA") {
# poisson
dpois(x, sum(prob), log)
} else if (method == "NA") {
# normal
dnorm(x, sum(prob), sqrt(sum(prob*(1-prob))), log)
} else if (method == "BA") {
# binomial
dbinom(x, length(prob), mean(prob), log)
} else {
# monte carlo
tmp <- table(colSums(replicate(nsim, rbinom(length(prob), 1, prob))))
tmp <- tmp/sum(tmp)
p <- as.numeric(tmp[as.character(x)])
p[is.na(p)] <- 0
if (log) log(p)
else p
}
}
Yöntemlerin çoğu (ve daha fazlası) R poibin paketinde de uygulanır .
Chen, LHY (1974). Poisson Binomunun Poisson Dağılımlarına Yakınlaşması Üzerine. Yıllıklar Olasılık, 2 (1), 178-180.
Chen, SX ve Liu, JS (1997). Poisson-Binom ve koşullu Bernoulli dağılımlarının istatistiksel uygulamaları. Statistica Sinica 7,875-892.
Chen, SX (1993). Poisson-Binom dağılımı, koşullu Bernoulli dağılımı ve maksimum entropi. Teknik rapor. İstatistik Bölümü, Harvard Üniversitesi.
Chen, XH, Dempster, AP ve Liu, JS (1994). Entropiyi en üst düzeye çıkarmak için ağırlıklı sonlu popülasyon örneklemesi. Biometrika 81,457-469.
Wang, YH (1993). Bağımsız denemelerdeki başarıların sayısı. Statistica Sinica 3 (2): 295-312.
Hong, Y. (2013). Poisson binom dağılımının dağılım fonksiyonunun hesaplanmasında. Hesaplamalı İstatistik ve Veri Analizi, 59, 41-51.
Volkova, AY (1996). Bağımsız rastgele göstergelerin toplamı için merkezi limit teoreminin iyileştirilmesi. Olasılık Teorisi ve Uygulamaları 40, 791-794.
Choi, KP ve Xia, A. (2002). Bağımsız denemelerde başarı sayısına yaklaşmak: Binom ve Poisson karşılaştırması. Yıllık Uygulamalı Olasılık, 14 (4), 1139-1148.
Le Cam, L. (1960). Poisson Binom Dağılımı için Bir Yaklaşım Teoremi. Pasifik Matematik Dergisi 10 (4), 1181–1197.