Büyük bir nüfusu yoklarken örneklem büyüklüğüne nasıl karar veriyorsunuz?


15

Avustralya şu anda bir seçim yapıyor ve anlaşılır bir şekilde medya her gün yeni siyasi anket sonuçları bildiriyor. 22 milyonluk bir ülkede, istatistiksel olarak geçerli bir sonuç elde etmek için nüfusun yüzde kaçının örneklenmesi gerekir?

Çok büyük bir örnek kullanmanın sonuçları etkileyebileceği veya istatistiksel geçerliliğin örneklem büyüklüğü ile monoton olarak artması mümkün müdür?

Yanıtlar:


13

Örneklem büyüklüğü, birçok kişiye karşı sezgisel olan nüfus büyüklüğüne bağlı değildir.

Yoklama şirketlerinin çoğu örneklerinde 400 veya 1000 kişi kullanıyor.

Bunun bir sebebi var:

400'lük bir örneklem büyüklüğü 20'de (% 95) +/- 5% 19 güven aralığı verecektir

1000 örneklem büyüklüğü, 20'de (% 95) +/-% 3% 19 güven aralığı verecektir

Yine de% 50'ye yakın bir oran ölçerken.

Bu hesap makinesi kötü değil:

http://www.raosoft.com/samplesize.html


6
Ancak bunların hepsinin homojen bir popülasyondan alınan örneklemeye dayandığını unutmayın. Heterojen bir popülasyonunuz varsa (örneğin, farklı alt gruplar için farklı oranlar, popülasyonların nadir kısımlarını örnekleme), o zaman bu varyans tahmini o kadar güvenilir değildir. Burada gerçekten hesapladığınız tahminler (sanırım) numunenizin temsil ettiği bir popülasyon için. Soru şu: Bu nüfus aslında ilgilendiğiniz kişi mi?
olasılık olasılığı

9

Belirli bir aday için insanların yüzde kaçının oy kullanacağını bilmek istediğinizi varsayalım (örneğin, , tanım gereği π'nin 0 ile 100 arasında olduğunu unutmayın ). N seçmenlere nasıl oy verdiklerini öğrenmek için rastgele örnek veriyorsunuz ve bu N seçmenlerle ilgili anketiniz yüzde p olduğunu söylüyor . Böylece, gerçek yüzde için bir güven aralığı oluşturmak istersiniz.ππNNp

Eğer olduğunu varsayarsak normalde (veya ne 'büyük' bağlı haklı olmayabilir bir varsayımda dağıtılır N ardından için güven aralığı olan) tt aşağıdaki biçimde olacaktır: C I = [ p - k * lar d ( p ) , p + k s d ( p ) ] burada kpNπ

CI=[pksd(p),  p+ksd(p)]
k istediğiniz güven derecesine bağlı bir sabittir (yani% 95 veya% 99 vb.).

Yoklama açısından, güven aralığınızın genişliğinin 'düşük' olmasını istiyorsunuz. Genellikle, anket yapanlar temelde CI'nın yarısı olan bir hata payı ile çalışırlar. Başka bir deyişle, MoE=ksd(p) .

Burada hesaplanması ile ilgili gider nasıl : tanım, tarafından p = Σ X i / K , X, i = 1 , seçmen ise i aday ve oy veren 0sd(p)p=Xi/NXi=1i0 , aksi.

Xi

Var(P)=V(XiN)=V(Xi)N2=Nπ(1π)N2=π(1π)N.
sd(p)=π(1π)N
πsd(p)π=0.5
sd(p)=0.50.5/N=0.5/N
NN

k=1.96N=1000

[p1.960.51000,  p+1.960.51000]=[p0.03,  p+0.03]
NN 1000'de , çünkü bu onlara mümkün olan en kötü varsayım altında makul bir marj hatası verir.π=50%.

2

Kaba bir genelleme olarak, bir popülasyondaki insanların bir kısmını örneklediğinizde, aynı sayıyı tekrar örneklemekten (ama muhtemelen farklı kişilerden) farklı bir cevap alırsınız.

Dolayısıyla, Avustralya'da kaç kişinin> = 30 yaşında olduğunu öğrenmek istiyorsanız ve gerçek kesir (Tanrı bize söyledi) tam olarak 0.4 oldu ve 100 kişiye sorarsak, ortalama sayı diyelim ki> = 30, 100 x 0.4 = 40'tır ve bu sayının standart sapması +/- sqrt (100 * 0.4 * 0.6) = sqrt (24) ~ 4.9 veya% 4.9'dur (Binom dağılımı).

Bu kare kök orada olduğundan, örnek boyutu 100 kat arttığında, standart sapma 10 kat azalır. Bu nedenle, genel olarak, böyle bir ölçümün belirsizliğini 10 kat azaltmak için 100'den fazla insanı örneklemeniz gerekir. Dolayısıyla, 100 x 100 = 10000 kişiye sorarsanız, standart sapma 49'a veya yüzde olarak% 0,49'a düşer.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.