Bernoulli örneklemesi için güven aralığı


42

Ben, Bernoulli rastgele değişken rasgele bir biçimde numûne sahip burada, X, i iidrv ve vardır P ( x i = 1 ) = p ve p bilinmeyen bir parametredir.X1...XNXiP(Xi=1)=pp

Açıktır ki, bir an için tahmin bulabilirsiniz : p : = ( X 1 + + x K ) / N .pp^:=(X1++XN)/N

Sorum şu, için nasıl bir güven aralığı oluşturabilirim ?p


2
Wikipedia, bernoulli örneklemesi için güven aralıklarının nasıl hesaplanacağına dair detaylara sahiptir .

Yanıtlar:


52
  • Eğer p değil, yakın 1 ya da 0 ve örnek büyüklüğü , n (yani yeterince büyük , n p > 5 ve n, ( 1 - p ) > 5 , güven aralığı normal dağılım ile tahmin edilebilir ve Böylece oluşturulan güven aralığı:p^10nnp^>5n(1p^)>5

    p^±z1α/2p^(1p^)n
  • Eğer p = 0 ve n, > 30 , 95 % güven aralığı yaklaşık [ 0 , 3p^=0n>3095%(Javanovic ve Levy, 1997); tersi için de geçerlidir , p =1. Referans aynı zamandan+1ven+b kullanarak(önceki bilgileri içerecek şekilde)kullanmayı tartışır.[0,3n] p^=1n+1n+b

  • np^

R fonksiyonları sağlar binconf {Hmisc}ve binom.confint {binom}bu, aşağıdaki şekilde kullanılabilir:

set.seed(0)
p <- runif(1,0,1)
X <- sample(c(0,1), size = 100, replace = TRUE, prob = c(1-p, p))
library(Hmisc)
binconf(sum(X), length(X), alpha = 0.05, method = 'all')
library(binom)
binom.confint(sum(X), length(X), conf.level = 0.95, method = 'all')

Agresti, Alan; Coull, Brent A. (1998). "Yaklaşık değeri, binom oranlarının aralık tahmini için" kesin "den daha iyidir. Amerikan İstatistiği 52: 119-126.

Jovanoviç, BD ve PS Levy, 1997. Üç Kuralına Bir Bakış. Amerikan İstatistiği Vol. 51, No. 2, sayfa 137-139

Ross, TD (2003). Msgstr "Binom oranı ve Poisson oranı tahmini için doğru güven aralıkları". Biyoloji ve Tıpta Bilgisayarlar 33: 509–531.


3
(+1) Güzel cevap. Bu, gelecekte benzer soruların referansı olacak. Bununla birlikte, çapraz gönderme olağan değildir; Aslında, kaşlarını çattığına inanıyorum, çünkü geri bildirim / referans / konu / yorumlama sisteminin birçok yönünü mahvetti. Lütfen kopyalardan birini çıkarmayı ve bir yorumdaki bağlantıyı değiştirmeyi düşünün.
whuber

@whuber Geri bildiriminiz için teşekkür ederiz. Diğer kopyayı kaldırdım.
David LeBauer

İlk formülde, z1 ve alfa nedir?
Cirdec

z1α/21α/2α

3/n

7

Maksimum olabilirlik güven aralığı

p

β^0=log(p^/(1p^))

αβ0

CI(β0)α=β^0±Zα/21/(np^(1p^)

p

CI(p)α=1/(1+exp(CI(β0)α)

Bu CI, oranların 0 veya 1 arasındaki aralıkta olması ve CI'nin her zaman normal seviyeden doğru seviyede olmasına rağmen daha dar olması gibi ek bir avantaja sahiptir. Bunu belirterek, R'yi çok kolay bir şekilde elde edebilirsiniz:

set.seed(123)
y <- rbinom(100, 1, 0.35)
plogis(confint(glm(y ~ 1, family=binomial)))

    2.5 %    97.5 % 
0.2795322 0.4670450 

Tam binom güven aralıkları

Y=np^(n,p)p^

CIα=(Fp^1(0.025),Fp^1(0.975))

p

qbinom(p = c(0.025, 0.975), size = length(y), prob = mean(y))/length(y)
[1] 0.28 0.47

Medyan tarafsız güven aralıkları

pp1α/2

p1α/2:P(Y=0)/2+P(Y>y)>0.975

Bu aynı zamanda bir hesaplama rutinidir.

set.seed(12345)
y <- rbinom(100, 1, 0.01) ## all 0
cil <- 0
mupfun <- function(p) {
  0.5*dbinom(0, 100, p) + 
    pbinom(1, 100, p, lower.tail = F) - 
    0.975
} ## for y=0 successes out of n=100 trials
ciu <- uniroot(mupfun, c(0, 1))$root
c(cil, ciu)

[1] 0.00000000 0.05357998 ## includes the 0.01 actual probability

Son iki yöntem epitoolsR'deki pakette uygulanır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.