Adaletini güvenle değerlendirmek için kaç kere ölmeliyim?


22

(İstatistiksel dilden ziyade lay dilin kullanımı için şimdiden özür dileriz.)

Belirli bir fiziksel altı taraflı kalıbın her iki tarafının yuvarlanma olasılığını makul bir güvende, yaklaşık% +/- 2 aralığında ölçmek istersem, kaç örnek kalıp rulosuna ihtiyaç duyulur?

Yani, her bir sonucu sayarak% 98'in% 14,6 -% 18,7 arasında olduğundan emin olmak için kaç kez bir kalıbı yuvarlamalıyım ki, her sonucu sayarak,% 98 olması gerekirdi? (Ya da yaklaşık% 98'in olacağı bazı benzer kriterler, kalıbın% 2 içinde adil olduğundan emin olur.)

(Bu simülasyon oyunları zar kullanılarak ve emin belli zar tasarımları her numara haddeleme 1/6 şans yakın kabul edilebilir olan olmak istedikleri için, gerçek dünyadaki bir husustur. Orada iddialar birçok ortak zar tasarımları ile 29% 1'leri haddeleme ölçülen edildiğini Her biri 1000 kez bu tür birkaç zar haddeleme.)


1
Bu, bir binom için güven aralığını bulmaktan daha zordur, çünkü tüm olasılıkları kontrol altında tutmak istersiniz. Hsiuying Wang'ın makalesine multinom dağılımlar için eşzamanlı güven aralıkları hakkında bir göz atın (Çok Değişkenli Analiz Dergisi 2008, 99, 5, 896-911). Bu blog gönderisinde bazı kodlar bulabilirsiniz; bu , bu konuda yapılan çalışmaların bazıları hakkında kısa bir özet de verir.
idnavid

1
Unutmayın ki, sadece 1'lerin adil bir süre olup olmadığını kontrol etmekle ilgileniyorsanız, bu soruyu çok kolaylaştırır.
Dennis Jaheruddin

2
"Güven aralığı" nın size "doğru olma yüzdesi olasılığını" vermediğini not etmek önemlidir. "% 98 kesin" teriminin çok makul bir şekilde kullanıldığından şüpheleniyorsunuz, ancak birisinin% 98 olasılıkla
BrianH

1
@BrianH Teşekkürler! Sadece konuşma ifadesini kastetmedim, aynı zamanda testin ima ettiği kesinliği ölçmeye çalışıyorum. Bana öyle geliyor ki, aynı şekilde, bazı kalıp sonuçlarını almayı beklediğimi hesaplamanın zamanın hesaplanabilir bir yüzdesini, sonuçların ne kadar muhtemel olacağına dair benzer (ancak daha karmaşık) bir hesaplamanın olacağını söyleyebilirim. n kez yuvarlandığımda belli bir hata payı olduğunu, ki Xiamoi'nin cevabını anladığımı düşünüyorum (ve takip yorumu). Evet?
Dronz

1
@Dronz Adil olmak gerekirse, bu aslında göründüğünden daha yalındır olacağını düşündüğünüz şeylerden biri. Aslında şeytani bir şekilde zor. İşte size hiçbir inanılmaz düz ileri cevap var nasıl hakkında bir fikir vermek başka yerde yardım için bazı anahtar ile ilgili sorular var: frequentist math.stackexchange.com/questions/1578932/... Bayes math.stackexchange.com/questions/1584833/... ve eğlenceli: rpg.stackexchange.com/questions/70802/…
BrianH

Yanıtlar:


18

TL; DR: = 1/6 ise ve % 98 olması gerektiğini bilmek istiyorsanız , zarın adil olduğundan (% 2'ye kadar) emin olmanız gerekiyorsa , en az ≥ 766 olmalıdır .pnnn


Let rulo sayısı olmak ve rulo sayısı bazı Belirtilen tarafında arazi. Sonra , Binom (n, p) dağılımını takip eder; , belirtilen tarafı elde etme olasılığıdır.nXXp

Merkezi limit teoremi ile bunu biliyoruz.

n(X/np)N(0,p(1p))

Yana örnek ortalaması olan Bernoulli rastgele değişkenler. Bu nedenle, büyük için, için güven aralıkları ,X/nn(p)np

Xn±Zp(1p)n

Yana bilinmiyor, biz örnek ortalama ile değiştirebilirsiniz p = X / n ve çeşitli yakınsama teoremleri, biz çıkan güven aralığı asimptotik geçerli olacak biliyorum. Böylece formun güven aralıklarını alıyoruzpp^=X/n

p^±Zp^(1p^)n

p^=X/nZZ=1.96α

p^±Zαp^(1p^)n

Cαnα

Zαp^(1p^)nαCα2

Daha sonra elde etmek için çözüldü

nα(2ZαCα)2p^(1p^)

ZαCαp^nαpn


3
Teşekkürler. On yıllardır kolej tipi matematik yapmadığım için sayıları girmenize ve bir tamsayı olarak kalıp atmaya ihtiyaç duyduğum birkaç kez bir basketbol sahası vermenize sorun olabilir mi?
Dronz

9
p=1/6nnn766Cα

4
Multinom dağılımına bakmak daha ilginç olabilir, çünkü şimdi her iki taraf için ayrı ayrı test ediyoruz. Bu sorunla ilgili elimizdeki tüm bilgileri dikkate almaz. Bir intiuitive açıklama görünüm için stat.berkeley.edu/~stark/SticiGui/Text/chiSquare.htm
Ocak

5
@Jan ile aynı fikirdeyim: Bu cevap soruyu ele almıyor. Dahası, altı test birbirine bağlı olduğundan, yanıtı altı yüze ayrı ayrı uygulayarak kolayca uyarlanamaz.
whuber

3
Bu güzel bir cevap, ama @Jan, Whuber ile tamamen aynı fikirdeyim. Bu soru ki-kare istatistik ve multinom dağılımına dayanan bir cevabı hak ediyor.
asukasz Grad
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.