Tüm popülasyondan elde edilen veriler olduğunda güven aralıklarını hesaplamak ve hipotezleri test etmek mantıklı mıdır?


10

Tüm popülasyondaki veriler mevcut olduğunda güven aralıklarını hesaplamak ve hipotezleri test etmek mantıklı mıdır? Bence cevap hayır, çünkü parametrelerin gerçek değerlerini doğru bir şekilde hesaplayabiliriz. Ancak, orijinal popülasyondan yukarıda belirtilen teknikleri kullanmamıza izin veren maksimum veri oranı nedir?


3
Doğru sonlu örnekleme yöntemlerini kullanırsanız, örneklem popülasyon boyutuna çarptığında varyans sıfıra gider. Yani, maksimum boyut yoktur; uygun formüller kadar olması gerektiği gibi çalışır . n=N
Glen_b

Sorunun "örnek = nüfus" durumu veya "sonlu popülasyondan örnek" durumu ile ilgili olup olmadığını daha net belirtmeniz gerektiğini düşünüyorum.
ttnphns

Sorunun ilk kısmı örneklem = popülasyon, ikincisi popülasyondan örneklemdir (örneklem büyüklüğü <nüfus büyüklüğü).
Miroslav Sabo

Yanıtlar:


9

İlk soru, genel olarak cevap üzerinde anlaşmaya varılmamış sorudur. Kendi görüşüm sizinkine benziyor, ancak diğerleri bir popülasyonun, bir süper popülasyonun kesin doğasının bağlama bağlı olarak değiştiği bir "süper popülasyon" dan bir örnek olarak görülebileceğini savundu: Örneğin, yaşayan tüm insanların sayımı bir bina benzer binalarda yaşayan tüm insanlardan örnek olarak görülebilir; ABD nüfusunun sayımı (hiç bir zaman tam olarak tamamlanamayacağı gibi değil), bir gün var olabilecek Amerikalıların (ya da bunun gibi bir şeyin) süper popülasyonundan bir örnek olarak görülebilir. Bence bu genellikle p-değerlerini kullanmak için bir bahane; önemli alanlardaki birçok bilim adamı, p değerine sahip değillerse rahat olmazlar. (Ama bu benim görüşüm ).

İkinci soru genel olarak cevaplamak biraz tuhaf görünüyor. Nüfusun yarısından bile fazlası olan bir örneği ne zaman alırsınız?

Daha büyük bir sorun yanlılık olacaktır. ABD Nüfus Sayımına geri dönersek, sorun sadece insanları özlediği değil, özlediği insanların toplam nüfusun rastgele bir örneği olmadığı; bu nedenle, nüfus sayımı tüm insanların% 95'inden (bir sayı seçmek için) cevap alsa bile, kalan% 5'i oldukça farklıysa, sonuçlar taraflı olacaktır.


1
Bir nüfus istatistiği için güven aralıkları hesaplayıp hesaplamamanız, gerçek popülasyon veya varsayımsal "süper popülasyon" için çıkarım yapmak isteyip istemediğinize bağlıdır. Devlet sağlık borçlu geçmiş bir işte, çok düşük doğum ağırlığı yüzdeleri ve yıldan yıla zıplayan intihar oranları gibi yıllık istatistikler bildirdik. Evet, tüm nüfusu raporluyorduk, ancak devletin sağlık ilerlemesini (ve finansmanını!) Nüfusun sağlığında tam bir değişim olarak bu ve diğer sağlık göstergelerindeki her artış veya azalmaya bağlı tutmak aptalca olurdu.
RobertF

7

12 komite üyesinin sadece 2'sinin kadın olduğunu varsayalım.

oranı , tüm nüfusun (komite) istatistik bir tanımlayıcısı olarak alınabilir. Belki nasıl ortaya çıktığından bağımsız olarak dengesizliği düzeltmek için bir şeyler yapılmalıdır.16

Ya da bir kadının komite için seçilme olasılığının bir tahmini olarak kabul edilebilir - seçim sürecinin bir özelliği. Etrafına güven aralıkları koyabilir, yarıdan (veya ilgili başka bir boş hipotezden) önemli ölçüde farklı olup olmadığını test edebilirsiniz, vb. Belki de sürecin adil olması için değiştirilmesi gerekir.

Tanımlayıcı ve çıkarımsal olan iki görüş çelişkili değil, oldukça farklıdır.

İkinci sorunun cevabı, sadece tek bir birey örneklenmemiş olsa bile, bir popülasyon parametresi ile ilgili hipotezlerin güven aralıklarını hesaplamanın mantıklı olmasıdır. CI'lerin ve testlerin, nüfusun örneklenmesinin önemli bir kısmını dikkate alması gerektiğini unutmayın: sonlu nüfus düzeltmesine bakın .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.