Belirli bir n için oranın standart hatası neden 0,5 için en büyüktür?


10

Bir oranın standart hatası, söz konusu oran 0,5 olduğunda belirli bir N için olabileceği en büyük olacaktır ve oran 0,5'ten daha küçük olduğunda küçülür. Bir oranın standart hatası denklemine baktığımda bunun neden böyle olduğunu anlayabiliyorum, ancak bunu daha fazla açıklayamıyorum.

Formülün matematiksel özelliklerinin ötesinde bir açıklama var mı? Öyleyse, neden 0 veya 1'e yaklaştıkça tahmini oranlar (belirli bir N için) etrafında daha az belirsizlik var?

Yanıtlar:


8

Arka Plan ve Terminoloji

Neler tartıştığımızı tam olarak açıklığa kavuşturmak için, bazı kavramlar ve terminoloji oluşturalım. Oranlar için güzel bir model ikili urn'dur: gümüş ("başarı") veya fuşya ("başarısızlık") renkli topları içerir. Uçtaki gümüş topların oranıp (ama bu konuşacağımız "oran" değildir).

Bu urn, bir Bernoulli Denemesini modellemek için bir yol sağlar . Bir farkındalık elde etmek için , topları iyice karıştırın ve rengini gözlemleyerek körü körüne dışarı çekin. Ek gerçekleştirmeler elde etmek için, önce çizilmiş topu iade ederek kutuyu sulandırın, daha sonra prosedürü önceden belirlenmiş sayıda tekrarlayın. Dizisin gerçekleşmeler başarılarının sayısı ile özetlenebilir, X. Özellikleri tamamen tarafından belirlenen rastgele bir değişkendir.n ve p. DağılımıX Binom denir(n,p)dağılımı. (Deneysel veya "örnek") oranı ,X/n.

şekil

Bu rakamlar, çeşitli binom oranları için olasılık dağılımlarının barplotlarıdır. X/n. En dikkat çekici olanı,n, burada dağılımlar daha dar hale gelir (ve çubuklar buna göre daha yüksek) p -den hareket ediyor 1/2 aşağı.

Standart sapması X/nolduğu oran standart hata söz konusu bahsetti. Herhangi biri içinn, bu miktar sadece p. Haydi diyelimse(p). Topların rollerini değiştirerek - gümüş olanlara "başarısızlık" ve fuşya olanlara "başarı" deyin - bunu görmek kolaydırse(p)=se(1p). Böylece durumunp=1p--yani, p=1/2- özel olmalı. Soru,se(p) olarak değişir p uzaklaşır 1/2 gibi daha aşırı bir değere doğru 0.

Bilgi ve Anlama

Herkes eğitiminin başlarında böyle rakamlar gösterdiği için, herkes arazilerin genişliklerini " se(p)- olarak azalmalıdır p uzaklaşır 1/2. Ancak bu bilgi gerçekten sadece deneyimdir, oysa soru daha derin bir anlayış ister. Bu anlayış, yaklaşık 300 yıl önce Abraham de Moivre gibi Binom dağılımlarının dikkatli bir analizinden elde edilebilir. ( Merkez Limit Teoreminin tartışmasında sunduğum kişilere ruhsal açıdan benziyorlardı .) Bununla birlikte, genişliklerin en yakın olması gerektiği noktasını belirtmek için nispeten basit bazı hususların yeterli olabileceğini düşünüyorum.p=1/2.

Basit Sezgisel Bir Analiz

Deneydeki başarıların oranının aşağıdakilere yakın olmasını beklememiz gerektiği açıktır: p. Standart hata, bu beklentiden gerçek sonucun ne kadar makul olduğunu varsayabilirizX/nYalan söyleyecek. Varsayalım ki, hiçbir genel kayıp olmadan,p arasında 0 ve 1/2, artırmak için ne gerekir X/n itibaren p? Genellikle,pn bir deneyde çizilen topların gümüşü (dolayısıyla) (1-p)nfuşya idi. Daha fazla gümüş top elde etmek için, bunlardan bazılarıpnfuşya sonuçları farklı olmalıydı. Bu şansın bu şekilde işlemesi ne kadar olası? Açık cevap şu kipküçük, gümüş bir top çizeceğimiz asla muhtemel değildir. Böylece, fuşya yerine gümüş top çekme şansımız her zaman düşüktür. Saf şansla, bir oranınpfuşya sonuçları farklı olabilirdi, ama bundan daha fazlasının değişmesi olası görünmüyor. Bu nedenle,X daha fazla değişmez px(1-p)n. eşdeğer,X/n daha fazla değişmez p(1p)n/n=p(1p).

akıbet

Böylece sihirli kombinasyon p(1-p)belirir. Bu neredeyse şu soruyu çözüyor: açıkçası bu miktarp=1/2 ve sıfıra düşer p=0 veya p=1. Bildiğimiz şeyi tanımlamak için “bir uçtan diğerinden daha sınırlayıcı” olduğu iddiası için sezgisel ama nicel bir gerekçe sunar.

Ancak, p(1-p) tam olarak doğru değer değildir: sadece yolu gösterir, bize yayılmayı tahmin etmek için hangi miktarın önemli olması gerektiğini söyler X. Biz şans da bize karşı harekete eğiliminde olduğu gerçeğini gözardı etmişlerdir: fuşya topları bazı tıpkı olabilirdi gümüş olmuştur, gümüş topların bazı olabilirdi fuşya olmuştur. Tüm olasılıkların titizlikle muhasebeleştirilmesi karmaşıklaşabilir, ancak sonuç, kullanmak yerinep(1-p)n ne kadar makul bir sınır olarak X beklentisinden sapabilir pn, olası tüm sonuçları doğru bir şekilde hesaba katmak için karekök almak zorundayız. p(1-p)n. (Nedeninin daha dikkatli bir açıklaması için lütfen ( https://stats.stackexchange.com/a/3904 adresini ziyaret edin .)n, oranın rastgele değişimlerinin X/n kendisi, p(1-p)n/n=p(1-p)n, standart hata olan X/n.


3

0 <= p <= 1 için p (1-p) fonksiyonunu düşünün. Matematik kullanarak p = 1 / 2'de maksimum değer olan 1/4 olduğunu görebilirsiniz. Bunun, sqrt (p (1-p) / n) olan oranın tahmininin standart sapması ile ilgili binom için olduğunu görebiliyorsanız, o zaman p = 1/2 maksimumdur. P = 1 veya 0 olduğunda standart hata 0'dır, çünkü her zaman sırasıyla 1'lerin tümünü veya 0'ların tümünü alırsınız. Böylece 0 veya 1'e yaklaştıkça bir süreklilik argümanı standart hatanın p 0 veya 1'e yaklaşırken 0'a yaklaştığını söyler. Aslında p 0 veya 1'e yaklaştıkça monoton olarak azalır. Büyük n için tahmini oran gerçek değere yakın olmalıdır. oran.


3
OP zaten "Oranın standart hatası denklemine baktığımda bunun neden böyle olduğunu görebiliyorum" dedi. Bu nedenle formülün analizini istemediklerini düşünüyorump(1-p)bunun yerine, formülün - ne olursa olsun - neden en üst düzeye çıkarılması gerektiği konusunda daha derin bir anlayış içinp=1/2.
whuber

1
@whuber yaptığım yanıtı verdim, çünkü formülün varyansın neden p = 1 / 2'de en büyük ve p 0 veya 1'e yakın olduğunda çok küçük olduğunu anlamak için temel olduğunu görüyorum. Belki orada en iyisi formülden tamamen yoksun bir açıklama değildir.
Michael R. Chernick

1

binom dağılımı için büyük (kabaca simetriktir eğiliminbunun yaklaşık olarak normal ).

Oran 0 ile 1 arasında olması gerektiğinden, belirsizlik bu sınırlar tarafından kısıtlanacaktır. Ortalama oran tam olarak ortada değilse, bu sınırlardan biri diğerinden daha sınırlayıcı olacaktır.

Merkezinde simetrik tek mododa çan eğrisi için p birim aralığına sığması için, yarım genişliği min[p,1-p].


Evet - ama diğer sınır daha az sınırlayıcı olacak! İki efekt neden iptal edilmiyor?
whuber

@whuber simetriden tartışıyordum (yani basit "büyük n"durum, simetrik çan eğrisi aralığa uymalıdır, bu nedenle yarım genişliği daha sıkı tarafından sınırlandırılır, min[p,1-p])
GeoMatt22
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.