Binom rastgele değişkenlerin bir örneğinin ortalaması için standart hata


43

2 sonucu olan bir deneme çalıştırdığımı ve 2 sonucun altında yatan "doğru" dağılımın ve : parametreleriyle binom bir dağılım olduğunu farz ediyorum .npBinomial(n,p)

standart hatasını, varyansı biçiminden hesaplayabilirim : burada . Öyleyse,SEX=σXnBinomial(n,p)

σX2=npq
q=1pσX=npq . Standart hata için alıyorum:SEX=pq , fakat bir yerlerdeSEX= olduğunu gördüm.SEX=pqn . Neyi yanlış yaptım?

Bu makale, ortalama standart hatasını anlamak için çok yararlıdır influentialpoints.com/Training/...
Sanghyun Lee

Benim googlingimden, binom dağılımı için güven aralıklarını alma konusuyla yakından ilgili olan konu oldukça karmaşık ve karmaşık görünüyor. Özellikle, bu formülden elde edilen ve "Wald Intervals" (bakınız en.wikipedia.org/wiki/Binomial_proportion_confidence_interval ) olan güven aralıkları gibi görünüyor , oldukça zayıf davranıyor ve kaçınılması gerekiyor. Daha fazla bilgi için jstor.org/stable/2676784?seq=1#metadata_info_tab_contents adresini ziyaret edin.
aquirdturtle

Yanıtlar:


58

Kullandığınız gibi görünüyor n iki farklı şekilde iki kez - örnek büyüklüğü olarak ve Binom rasgele değişkeni oluşturan bernoulli denemelerin sayısı olarak hem; Herhangi bir belirsizliği ortadan kaldırmak için, ikincisine atıfta bulunmak için kullanacağım k.

Eğer varsa n bir bağımsız numune Binomial(k,p) dağılımı, örnek ortalaması varyansını

var(1ni=1nXi)=1n2i=1nvar(Xi)=nvar(Xi)n2=var(Xi)n=kpqn

burada ve ¯ X aynı ortalamasıdır. Bu beriq=1pX¯

(1) ,var(cX)=c2var(X) bir rastgele değişkenin için , herhangi bir sabit c .Xc

(2) bağımsız rastgele değişkenlerin toplamının varyansı, varyansların toplamına eşittir .

standart hatası , varyansın kareköküdür: X¯ . Bu nedenle,kpqn

  • Ne zaman , size işaret formülü olsun: k=npq

  • Ne zaman ve Binom değişkenler sadece olan bernoulli denemeleri , size başka bir yerde gördüğüm formülü olsun: k=1pqn


3
Zaman a, Bernoulli rastgele değişkenler, daha sonra v bir r ( x ) = p q . Tüm X göre bir rasgele değişken sahip N başarı olasılığı ile yapılan denemelerde , p , o zaman v bir r ( x ) = n- p qXvar(X)=pqXnpvar(X)=npq
Makro

2
Teşekkürler! Kafamı karıştırdın. Çok basit olduğu için üzgünüm, hala öğreniyorum :-)
Frank

6
Öyleyse, Frank için herhangi bir c sabit (cX) = c 2 Var (x) sabitinin kullanıldığı gerçeğini kullandığımız açık mı? Oran örnek tahmini olduğu, X / n Yeni Var (x / n) = Var (x) / n olan 2 = NPQ / n 2 =-q / n ve CİNSEL bu kare köküdür. Tüm adımları hecelersek herkes için daha net olduğunu düşünüyorum. 222
Michael Chernick

1
@MichaelChernick, bahsettiğiniz detayları açıklığa kavuşturdum. Sorunun tanımına dayanarak Frank'in bu gerçekleri bildiğini, ancak gelecekteki okuyucular için ayrıntıları içermesinin daha eğitici olacağına karar verdim.
Makro

2
Sol Lago - Bu durumda k = 1. Bir madeni parayı 50 kez çevirdiyseniz ve başarı sayısını hesapladıktan sonra deneyi 50 kez tekrarladıysanız, k = n = 50 olur. Bir madeni para çevirme 1 veya 0 sonuçlanır. Bir Bernoulli rv
B_Miner

9

İki binom dağılımını karıştırmak çok kolaydır:

  • başarı sayısının dağılımı
  • başarı oranının dağılımı

npq, başarıların sayısıdır, npq / n = pq ise başarıların oranıdır. Bu, farklı standart hata formülleriyle sonuçlanır.


6

Buna şu şekilde bakabiliriz:

nYY=i=1nXiXi

XiY

YY

pqpq=1p

YV(Y)=V(Xi)=V(Xi)V(Xi)=pqnV(Y)=V(Xi)=npqYnpq

p^=Ynn

V(Yn)=(1n2)V(Y)=(1n2)(npq)=pq/n

p^pq/n


$x$x

V(Xi)=V(Xi)

Son kesintide yazım hatası var, V (Y / n) = (1 / n ^ 2) * V (Y) = (1 / n ^ 2) * npq = pq / n doğru kesinti olmalı.
Tarashankar

Özür dilerim, dizgi yaparken bunu tanıttım. Umarım şimdi sıralanır.
Silverfish,

1
Xi

2

Ayrıca ilk hatada standart hata ile standart sapma arasında bir karışıklık olduğunu düşünüyorum. Standart sapma bir dağılımın varyansının sqrt'idir; Standart hata, bir numunenin tahmini ortalamasının, bu dağılımdan elde edilen standart sapması, yani, eğer o numuneyi sonsuz defa yaparsanız, gözlemleyeceğiniz araçların yayılmasıdır. İlki, dağıtımın kendine özgü bir özelliğidir; İkincisi, dağıtımın bir özelliği (ortalama) tahminine ilişkin kalitenizin bir ölçüsüdür. Başarısızlığın bilinmeyen olasılığını tahmin etmek için bir N Bernouilli denemesi yaptığınız zaman, k başarılarını gördükten sonra tahmin edilen p = k / N belirsizliğiniz, kestirilmiş oranın standart bir hatasıdır, burada sqrt (pq / N), q = 1 -p. Gerçek dağılım, bir P parametresidir, başarının gerçek olasılığı.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.