Farklı olasılıklarla Bernoulli çalışmalarının başarısı


11

Her biri farklı başarı ve dolayısıyla başarısızlık olasılığı olan 20 bağımsız Bernoulli çalışması yapılırsa. 20 denemeden tam olarak n başarılı olma olasılığı nedir?

Başarı ve başarısızlık olasılıklarının kombinasyonlarını bir araya getirmek yerine bu olasılıkları hesaplamanın daha iyi bir yolu var mı?

Yanıtlar:


12

Sormakta olduğunuz dağıtıma , oldukça karmaşık pmf ile Poisson Binom dağılımı denir (daha geniş açıklama için Wikipedia'ya bakın)

Pr(X=x)=ΣbirFxΠbenbirpbenΠjbirc(1-pj)

Genel olarak sorun, bu denklemi daha fazla sayıda deneme için kullanamamanızdır (genellikle deneme sayısı aştığında ). Ayrıca, pmf'yi hesaplamanın başka yöntemleri de vardır, örneğin özyinelemeli formüller, ancak bunlar sayısal olarak kararsızdır. Bu problemlerin en kolay yolu yaklaşıklama yöntemleridir (örneğin Hong, 2013 tarafından tanımlanmıştır ). Eğer tanımlarsakn=30

μ=Σben=1npben

σ=Σben=1npben(1-pben)

γ=σ-3Σben=1npben(1-pben)(1-2pben)

küçük sayılar kanunu veya Le Cams teoremi ile Poisson dağılımı ile pmf'ye yaklaşabiliriz

Pr(X=x)μxtecrübe(-μ)x!

ancak genellikle Binom yaklaşımının daha iyi davrandığını görür ( Choi ve Xia, 2002 )

Pr(X=x)BbennÖm(n,μn)

Normal yaklaşımı kullanabilirsiniz

f(x)φ(x+0.5-μσ)

veya cdf, rafine edilmiş Normal yaklaşım kullanılarak tahmin edilebilir (Volkova, 1996)

F(x)maksimum(0, g(x+0.5-μσ))

burada .g(x)=Φ(x)+γ(1-x2)φ(x)6

Başka bir alternatif elbette Monte Carlo simülasyonudur.

Basit dpbinomR fonksiyonu

dpbinom <- function(x, prob, log = FALSE,
                    method = c("MC", "PA", "NA", "BA"),
                    nsim = 1e4) {

  stopifnot(all(prob >= 0 & prob <= 1))
  method <- match.arg(method)

  if (method == "PA") {
    # poisson
    dpois(x, sum(prob), log)
  } else if (method == "NA") {
    # normal
    dnorm(x, sum(prob), sqrt(sum(prob*(1-prob))), log)
  } else if (method == "BA") {
    # binomial
    dbinom(x, length(prob), mean(prob), log)
  } else {
    # monte carlo
    tmp <- table(colSums(replicate(nsim, rbinom(length(prob), 1, prob))))
    tmp <- tmp/sum(tmp)
    p <- as.numeric(tmp[as.character(x)])
    p[is.na(p)] <- 0

    if (log) log(p)
    else p 
  }
}

Yöntemlerin çoğu (ve daha fazlası) R poibin paketinde de uygulanır .


Chen, LHY (1974). Poisson Binomunun Poisson Dağılımlarına Yakınlaşması Üzerine. Yıllıklar Olasılık, 2 (1), 178-180.

Chen, SX ve Liu, JS (1997). Poisson-Binom ve koşullu Bernoulli dağılımlarının istatistiksel uygulamaları. Statistica Sinica 7,875-892.

Chen, SX (1993). Poisson-Binom dağılımı, koşullu Bernoulli dağılımı ve maksimum entropi. Teknik rapor. İstatistik Bölümü, Harvard Üniversitesi.

Chen, XH, Dempster, AP ve Liu, JS (1994). Entropiyi en üst düzeye çıkarmak için ağırlıklı sonlu popülasyon örneklemesi. Biometrika 81,457-469.

Wang, YH (1993). Bağımsız denemelerdeki başarıların sayısı. Statistica Sinica 3 (2): 295-312.

Hong, Y. (2013). Poisson binom dağılımının dağılım fonksiyonunun hesaplanmasında. Hesaplamalı İstatistik ve Veri Analizi, 59, 41-51.

Volkova, AY (1996). Bağımsız rastgele göstergelerin toplamı için merkezi limit teoreminin iyileştirilmesi. Olasılık Teorisi ve Uygulamaları 40, 791-794.

Choi, KP ve Xia, A. (2002). Bağımsız denemelerde başarı sayısına yaklaşmak: Binom ve Poisson karşılaştırması. Yıllık Uygulamalı Olasılık, 14 (4), 1139-1148.

Le Cam, L. (1960). Poisson Binom Dağılımı için Bir Yaklaşım Teoremi. Pasifik Matematik Dergisi 10 (4), 1181–1197.


0

Bir yaklaşım üretme fonksiyonlarını kullanmaktır. Probleminizin çözümü polinomdaki katsayısıdırxn

Πben=120(pbenx+1-pben).

Bu, Tim'in cevabından (üstel zaman olacak) Poisson Binom dağılımındaki toplamı yapmanın dinamik programlama eşdeğeri (Bernoulli değişkenlerinin sayısında kuadratik süre).

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.