Bu soruya zaten bazı mükemmel cevaplar var, ama neden standart hatanın ne olduğunu, neden en kötü durumda kullandığımızı ve standart hatanın ile nasıl değiştiğini cevaplamak istiyorum .np = 0.5n
Diyelim ki sadece bir seçmen anketi seçelim, onu seçmen 1 olarak adlandıralım ve "Mor Parti için oy verir misiniz?" Cevabı "evet" için 1, "hayır" için 0 olarak kodlayabiliriz. Diyelim ki "evet" olasılığı . Şimdi bir ikili rastgele değişkenimiz varx 1 p 1 - p x 1 p x 1 ~ B e r n O u ı l l ı ( p ) X, 1 e ( X 1 ) = Σ x P ( x 1 = x ) x x 1pX1 olasılık ile 1 olan olasılığı ile ve 0 . Biz söylemek başarı olasılığı olan bir Bernoulli değişkendir yazabiliriz, . Beklenen veya ortalamap1−pX1pX1∼Bernouilli(p)X1E(X1)=∑xP(X1=x)xX1. Ancak sadece iki sonucu, olasılık 0 vardır olasılığı ile, 1 toplamı, sadece, bu yüzden . Dur ve düşün. Bu tamamen makul gözüküyor - Mor Partiyi destekleyen% 30 seçmen 1 şansı varsa ve "evet" diyorlarsa değişkeni 1 ve "hayır" diyorlarsa 0 olarak kodladık. ortalama olarak 0.3 olmasını bekliyoruz .p E ( X 1 ) = 0 ( 1 - p1−ppx 1E(X1)=0(1−p)+1(p)=pX1
Ne olacağını düşünelim . Eğer sonra ve eğer daha sonra . Yani aslında her iki durumda da . Aynı olduklarından, beklenen aynı değere sahip olmaları gerekir, yani . Bu bana bir Bernouilli değişkeninin varyansını hesaplamanın kolay bir yolunu sunar: ve böylece standart sapma .X 1 = 0 X 2 1 = 0 X 1 = 1 X 2 1 = 1 X 2 1 = X 1 E ( X 2 1 ) = p V a r ( X 1 ) = E ( X 2X1X1=0X21=0X1=1X21=1X21=X1E(X21)=pσ X 1 = √Var(X1)=E(X21)−E(X1)2=p−p2=p(1−p)σX1=p(1−p)−−−−−−−√
Açıkçası diğer seçmenlerle konuşmak istiyorum - seçmen 2, seçmen 3, seçmen . Diyelim hepsi aynı olasılık var sayıyorum Mor Parti'yi destekleme. Şimdi biz , Bernoulli değişkenleri , üzerine her biri, için 1 ila . Hepsinde aynı ortalama, ve varyans, .p , n x 1 X 2 X N X i ~ B e r n O u l l I ( p ) ınpnX1X2XnXi∼Bernoulli(p)ip p ( 1 - p )npp(1−p)
Örnekteki kaç kişinin "evet" dediğini bulmak istiyorum ve bunu yapmak için tüm ekleyebilirim . Ben yazacağım . ortalama veya beklenen değerini, eğer bu beklentiler varsa kuralını kullanarak hesaplayabilir ve genişletebilirim. edilene . Fakat bu beklentilerden ekliyorum ve her biri , dolayısıyla toplamda X = ∑ n i = 1 X i X E ( X + Y ) = E ( X ) + E ( Y ) E ( X 1 + X 2 + … + X n ) = E ( X 1 )XiX=∑ni=1XiXE(X+Y)=E(X)+E(Y)E(X1+X2+…+Xn)=E(X1)+E(X2)+…+E(Xn)p E ( X ) = n p n pnpE(X)=np. Dur ve düşün. 200 kişiyi yoksaydıysam ve her birinin Mor Parti'yi desteklediğini söyleme şansı% 30'dur, tabii ki 0.3 x 200 = 60 kişinin “evet” demesini beklerdim. Yani formülü doğru görünüyor. Daha az "açık" varyansın nasıl ele alınacağıdır.np
Orada olduğunu söyleyen bir kural
ama sadece bunu kullanabilirsiniz benim rastgele değişkenler birbirinden bağımsız ise . Öyleyse, bu varsayımı yapalım ve görmeden önce benzer bir mantıkla olduğunu görelim . Eğer bir değişkeni , bağımsız Bernoulli denemelerinin toplamı ise , aynı başarı olasılığı , o zaman bir binom dağılımına sahip olduğunu söylüyoruz , . Az önce böyle bir binom dağılımının ortalamasının ve varyansın .V a r ( X ) = n p ( 1 - p ) X, n, p X X ~
Var(X1+X2+…+Xn)=Var(X1)+Var(X2)+…+Var(Xn)
Var(X)=np(1−p)Xn pXX∼Binomial(n,p), n p ( 1 - p )npnp(1−p)
Asıl sorunumuz, örneklemden tahmin etmekti . Tahmincimizi tanımlamanın mantıklı yolu . Örneğin, 200 kişiden 64'ünün “evet” olduğunu belirttiğimiz için 64/200 = 0.32 = insanların% 32'sinin Mor Parti'yi desteklediğini söylediklerini tahmin ediyoruz. Bunu görebilirsiniz evet-seçmen toplam sayısının yalnızca bir "küçültülmüş" versiyonu . Bu, hala rastgele bir değişken olduğu anlamına gelir, ancak artık binom dağılımını izlememektedir. Ortalamasını ve varyansını bulabiliriz, çünkü rastgele bir değişkeni sabit bir faktörü ile ölçeklendirdiğimizde aşağıdaki kuralları yerine getirir: (yani ortalama ölçekler) aynı faktörle ) vep = X / n- p x K E ( K x ) = k E ( x ) k V bir R ( k x ) = k 2 v bir r (pp^=X/np^XkE(kX)=kE(X)kk 2 C m 2Var(kX)=k2Var(X) . Varyansın nasıl ölçeklendiğine dikkat edin . Burada çok uygulanamaz, ama bizim rasgele değişken cm yükseklik olsaydı o zaman varyans olacaktır: Eğer genel olarak varyans değişkeni olarak ölçülür olursa olsun birimleri karesi ölçülür biliyoruz o zaman mantıklı Farklı ölçeklendirme - eğer iki katına çıkarsanız, alanı dört katına çıkarırsınız.k2cm2
Burada ölçek . Bu bize . Bu harika! Ortalama olarak, tahmincimiz tam olarak "olması gerektiği", rastgele bir seçmenlerin Mor Parti için oy kullanacaklarını söyledikleri gerçek (veya nüfus) olasılıktır. Tahmincimizin tarafsız olduğunu söylüyoruz . Ancak ortalama olarak doğru olsa da, bazen çok küçük ve bazen çok yüksek olacaktır. Varyansına bakarak ne kadar yanlış olabileceğini görebiliriz. . Standart sapma , E( p )=11n p V, birR( p )=1E(p^)=1nE(X)=npn=pp^ √Var(p^)=1n2Var(X)=np(1−p)n2=p(1−p)np(1−p)n−−−−−√ve bize tahmin edicimizin ne kadar kötü olacağına dair bir fikir veriyor (etkili bir şekilde kök ortalama kare hatası , pozitif ve negatif hataları eşit olarak kötü olarak değerlendiren ortalama hatayı ortalamadan önce bunları karıştırarak hesaplamanın bir yolu) , genellikle standart hata denir . Büyük Örnekler için iyi sonuç veren ve ünlü Central Limit Teoremini kullanarak daha titizlikle ele alınabilen iyi bir kural, çoğu zaman (yaklaşık% 95) tahminin iki standart hatadan daha az yanlış olacağı yönündedir.
Kesir paydasında göründüğü için, - daha büyük örneklerin daha yüksek değerleri - standart hatayı daha küçük yapar. Bu harika bir haber, sanırım küçük bir standart hata istiyorum, sadece örneklem büyüklüğünü yeterince büyütüyorum. Kötü haberse karekök içinde olduğu, bu nedenle örneklem büyüklüğünü dört katına çıkarırsam, sadece standart hatayı yarıya indireceğim. Çok küçük standart hatalar çok çok büyük ve dolayısıyla pahalı numuneleri içerecektir. Başka bir sorun daha var: Belirli bir standart hatayı hedeflemek istiyorsanız,% 1, sonra ben ne değerini bilmek gerekir ki benim hesaplamada kullanım için. Geçmiş veri oylama geçmişim varsa, geçmiş değerleri kullanabilirim, ancak mümkün olan en kötü durum için hazırlık yapmak istiyorum. değerin p pnnppen sorunlu mu? Bir grafik öğreticidir.
En kötü durum (en yüksek) standart hata olduğunda ortaya çıkar . Hesabı kullanabileceğimi kanıtlamak için, ancak bazı lise cebirleri " kareyi nasıl tamamlayacağımı " bildiğim sürece, hile yapacak . p=0.5
p(1−p)−−−−−−−√=p−p2−−−−−√=14−(p2−p+14)−−−−−−−−−−−−−−√=14−(p−12)2−−−−−−−−−−−√
İfade, köşeli ayraçların karelidir, bu yüzden her zaman sıfır veya olumlu bir cevap döndürür, bu da daha sonra çeyrek saatten uzaklaştırılır. En kötü durumda (büyük standart hata) mümkün olduğunca az uzaklaştırılır. En az çıkarılabilecek şeyin sıfır olduğunu ve olduğunda, olduğunda ortaya çıkacağını biliyorum . Bunun bir sonucu, örneğin oyların% 50'sine yakın siyasi partilere yönelik desteği tahmin etmeye çalışırken daha büyük standart hatalar elde etmem ve büyük ölçüde daha fazla veya büyük ölçüde daha az popüler olan önerilere yönelik desteği tahmin etmek için standart hataları düşürmem. Aslında grafiğimin ve denklemimin simetrisi,% 30 halk desteği veya% 70'i olsa da, Mor Parti’yi desteklediklerine dair tahminlerim için aynı standart hatayı alacağımı gösteriyor.p−12=0p=12
Peki standart hatayı% 1'in altında tutmak için kaç kişiyi sorgulamam gerekiyor? Bu, zamanımın büyük çoğunluğunun tahminimin doğru oranın% 2'sinde olacağı anlamına gelir. Artık, en kötü durum standart hata olduğunu biliyoruz bana verir çok ve . Bu, neden anketlerde binlerce kişiyi gördüğünü açıklar.0.25n−−−√=0.5n√<0.01nn−−√>50n>2500
Gerçekte düşük standart hata iyi bir tahminin garantisi değildir. Yoklamadaki birçok problem teorik nitelikten çok pratiktir. Mesela, örneğin her birinin olasılıklı olan rastgele seçmen olduğunu varsaydım , fakat gerçek hayatta "rastgele" bir örnek almak zorlukla dolu. Telefonla veya çevrimiçi oylamayı deneyebilirsiniz - ancak yalnızca herkesin bir telefonu veya internet erişimi yok, aynı zamanda isteyenler için çok farklı demografik bilgileri (ve oy verme niyetleri olmayan) var. Sonuçlarına önyargı vermekten kaçınmak için, yoklama şirketleri aslında basit bir ortalama değil, örneklerinin her türlü karmaşık ağırlığını yaparlar∑p∑XinAldığım. Ayrıca insanlar anketörlere yalan söylüyor! Anketörlerin bu olasılığı telafi ettiği farklı yollar açık bir şekilde tartışmalıdır. Anket firmalarının İngiltere'de sözde Shy Tory Factor ile nasıl başa çıktığı konusunda çeşitli yaklaşımlar görebilirsiniz . Düzeltme yöntemlerinden biri, geçmişte insanların oy kullanma niyetlerinin ne kadar makul olduğunu değerlendirmek için nasıl oy kullandıklarına bakmayı içermekteydi, ancak yalan söylemedikleri zaman bile, çoğu seçmenlerin seçim tarihlerini hatırlayamadıklarını ortaya koydu . Bu gibi şeyler olduğunda, açıkçası çok düşük bir noktaya değin "standart hata"% 0.00001.
Son olarak, basit örnekleme göre gerekli örnek büyüklüğünün istenen standart hatadan nasıl etkilendiğini ve "en kötü durum" değerinin daha uygun oranlarla karşılaştırıldığında ne kadar kötü olduğunu gösteren bazı grafikler . Unutmayın ki, için eğri , önceki grafiğinin simetrisi nedeniyle, için aynı olacaktır.p = 0.7 p = 0.3 √p=0.5p=0.7p=0.3p(1−p)−−−−−−−√