0 veya 1'in binomik tahmini etrafındaki güven aralığı


36

Tahmininiz (veya benzer şekilde p = 1 ) ve numune büyüklüğünün göreceli olarak küçük olması durumunda, örneğin n = 25 ise, binomal bir deneyin güven aralığını hesaplamak için en iyi teknik hangisidir?p=0p=1n=25


Nasıl sıfıra yakın olmaktadır p ? Sıfır mı, yoksa 0,001 veya 0,01 mertebesinde mi, yoksa ... Peki ne kadar veriniz var? p^
jbowman

Genelde 800 den fazla denememiz var. Biz genellikle için 0.1 0 bekliyoruz pp^
AI2.0

Bağladığınız Clopper – Pearson aralığını kullanın. Genel ilke: Önce Clopper – Pearson aralığını deneyin. Bilgisayar cevap alamıyorsa, normal yaklaşım gibi yaklaşık yaklaşım yöntemini deneyin. Şu anki bilgisayar hızına göre, çoğu durumda yaklaştırmaya ihtiyacımız olduğunu sanmıyorum.
kullanıcı158565

Yalnızca (1- güven düzeyi ile olan güven aralığı üst sınırını almak için , yalnızca B (1− α ; x + 1, n − x) kullanacağız , burada x başarıların sayısı (veya başarısızlık), n . örnek boyutu python'da, sadece kullanmak bu TRUE ise biz 1- olduğu sonucuna varabiliriz. α biz den hesaplamak üst sınır değeri tarafından sınırlanan emin ?ααscipy.stats.beta.ppf(1−$\alpha$;x+1,n−x) αscipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
AI2.0

1
800 denemeyle, normal Normal yaklaşımı yaklaşık kadar oldukça iyi çalışacaktır (simülasyonlarım% 95 güven aralığında% 94,5 fiili kapsama alanı gösterdi.) 1000 denemede ve p = 0,01 , fiili kapsam% 92,7 idi (hepsi 100.000 kopyaya dayanıyor.) Bu yüzden , deneme sayınız göz önüne alındığında, bu sadece çok düşük puanlar için bir sorun . p=0.015p=0.01p
jbowman

Yanıtlar:


53

Normal yaklaşımı kullanmayın

Bu sorun hakkında çok şey yazıldı. Genel bir öneri, korkunç kapsama özelliklerine sahip olduğundan normal yaklaşımı (yani, asimptotik / Wald güven aralığı) asla kullanmamaktır. Bunu göstermek için R kodu:

library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")

Binom oranı için asimptotik güven aralıkları için kapsam olasılıkları.

Küçük başarı olasılıkları için% 95 güven aralığı isteyebilirsiniz, ancak gerçekte% 10 güven aralığı elde edebilirsiniz!

öneriler

Yani ne olmalıdır Kullandığımız? Ben şimdiki önerileri kağıt listelenen olanlardır inanıyoruz bir Binom oran için aralık tahmini Brown, Cai ve dasgupta tarafından İstatistiksel Science 2001, vol. 16, hayır. 2, sayfa 101–133. Yazarlar güven aralıklarını hesaplamak için çeşitli yöntemler incelemiş ve aşağıdaki sonuca ulaşmıştır.

[W] e Wilson aralığını veya eşit kuyruklu Jeffrey'lerin küçük n için önceki aralığı ve Agresti ve Coull'da daha büyük n için önerilen aralığı önerir .

Wilson aralığına bazen puan aralığı da denir , çünkü bir puan testinin tersine çevrilmesine dayanır.

Aralıkları hesaplama

Bu güven aralıklarını hesaplamak için, bu çevrimiçi hesap makinesini veya R paketindeki binom.confint()işlevi kullanabilirsiniz. binomÖrneğin, 25 denemede 0 başarı için, R kodu şöyle olacaktır:

> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
  type="central")
         method x  n  mean  lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2         bayes 0 25 0.019  0.000 0.073
3        wilson 0 25 0.000  0.000 0.133

İşte bayesJeffreyler aralığı. ( Eşit kuyruklu aralığı type="central"elde etmek için bu argüman gereklidir .)

Aralık hesaplanmadan önce hangi üç yöntemden birini kullanmak istediğinize karar vermelisiniz . Üçüne de bakmak ve en kısa olanı seçmek doğal olarak size çok küçük bir kapsama alanı sağlayacaktır.

Hızlı, yaklaşık bir cevap

Son bir not olarak, n denemelerinizde tam olarak sıfır başarı gözlemlerseniz ve sadece çok hızlı bir yaklaşık güven aralığı istiyorsanız , üç kuralını kullanabilirsiniz . Basitçe 3 sayısını n'ye bölün . Yukarıdaki örnekte n , 25'tir, bu nedenle üst sınır 3/25 = 0.12'dir (alt sınır elbette 0'dır).


Cevabınız için çok teşekkürler. Bu gerçek yaşam örneğini hayal edin: Bir tavandaki tüm yalıtım panelleri doğru takılmışsa bir gökdeleni test etmek zorundadır. Rastgele bir zemin seçiminde 25 tavan paneli açar ve tüm bu tavan panelleri yalıtımını bulur. Böylece, bir yalıtım paneline sahip olma ihtimalinin, Wilson puan aralığına göre CI [0.867 - 1] arasında% 95 kesinlikte olduğu sonucuna varabiliriz.
Kasper

2
Bunu '% 95 kesinlik' ile tamamlayabileceğinizi söyleyemem ('güven aralıklarının doğru yorumlanması için Google'). Ayrıca, bu, gerçekçi olamayacak eşit başarı olasılıkları olan bağımsız çalışmaların varsayımına dayanmaktadır . Belki de monte edilen son panellerin yanlış monte edilme riski daha yüksekti (onları yerleştiren kişi yoruluyor / sıkılıyordu). Ya da belki o zamanlar, o zamanlar o kadar az deneyimli olduğundan beri. Her neyse, mimara tüm panellerin doğru yerleştirilip yerleştirilmediğini test etmesi söylendiyse , sadece bir örnek sınamak için işini yapmalı!
Karl Ove Hufthammer

5
bayesHer iki şekil parametresi de 1 olduğunda üniforma önceliğini (Jeffrey yerine) kullanır. Binom paketinin bekçisine, Jeffrey'in (üniforma) avantajlarından bahseden meraktan önce e-postayla gönderdim ve yeni bir sürümün kullanacağını söyledi. varsayılan olarak üniforma önceki. Dolayısıyla, sonuçların gelecekte biraz değişip değişmediğini merak etmeyin.
cbeleites, Monica

3
Bu mükemmel bir cevap. Konuyla ilgili makalelerde okuyabileceğiniz tüm önemli bilgileri aktarır, ancak çok net ve net bir şekilde. İki kere oy kullanabilseydim, yapardım.
SigmaX

6
Buradaki binconfyöntem Hmiscaynı zamanda bu aralıkları da hesaplar. Wilson yöntemine varsayılandır.
SigmaX

0

p±zα/2p(1p)/nπ0π0π0

|pπ0|p(1p)/n=0
(1+z02/n)π02+(2pz02/n)π0+p2=0


1
π0

π0pn

Bu Agresti.
Nick Cox

@NickCox farklı bir iştir
Jay Schyler Raadt

1
Alan Agresti çeşitli metinler yayınladı. Sanırım kategorik veri analizine giriş (2. baskı 2007; 3. baskı ekim 2018 yayınlanması planlanmış ve 2019 tarihini taşıyabilir).
Nick Cox
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.