Örneklem popülasyonda “olduğunda” istatistiksel çıkarım


47

Yıllık olarak belirli bir sınava giren adayların sayısını bildirmek zorunda olduğunuzu hayal edin. Hedef popülasyonun niteliği nedeniyle, daha geniş bir popülasyonda, örneğin, gözlenen başarının% 'sini anlamak oldukça zor görünüyor. Yani bu verilerin tüm popülasyonu temsil ettiğini düşünebilirsiniz.

Erkek ve kadın oranlarının farklı olduğunu gösteren testlerin sonuçları gerçekten doğru mu? Gözlemlenen ve teorik oranların karşılaştırıldığı bir test, bütün bir popülasyonu düşündüğünüzden (bir örnek değil) düşündüğünüzden, doğru görünüyor mu?

Yanıtlar:


31

Bununla ilgili çeşitli görüşler olabilir, ancak popülasyon verilerini örnek olarak ele alıp varsayımsal bir popülasyon kabul ediyorum, sonra her zamanki gibi çıkarımlarda bulunacağım. Bunu düşünmenin bir yolu, toplanan verilerden, "nüfus" dağılımından sorumlu altta yatan bir veri oluşturma süreci olduğudur.

Özel bir durumda, gelecekte kohotlarınız olacağından bu daha mantıklı olabilir. O zaman popülasyonunuz gerçekten gelecekte bile sınava giren kohorttur. Bu şekilde, bir yıldan fazla veriye sahipseniz zamana bağlı varyasyonları hesaba katabilir veya hata modeliniz aracılığıyla gizli faktörleri hesaba katmayı deneyebilirsiniz. Kısacası, daha fazla açıklayıcı gücü olan daha zengin modeller geliştirebilirsiniz.


4
Bu yayına A Gelman'dan daha yeni rastladım, bir örneklem yerine tüm popülasyonu analiz ederken istatistiksel analiz nasıl farklılık gösterir? , j.mp/cZ1WSI . “Süper nüfus” kavramı üzerine fikirlerin farklılaşması konusunda iyi bir başlangıç ​​noktası.
chl

2
@chl: interesting - Gelman'ın ANOVA'daki makalesinde sabit / rastgele etkilerle karşılaştırılabilir sınırlı / süper popülasyon çıkarımı tartışması olduğunu hatırlatıyor [ stat.columbia.edu/~gelman/research/published/econanova3.pdf ].
ars

+1 Buna tekrar geri döndüm (google üzerinden). Bence cevabınız çok açık.
Shane,

25

Aslında, eğer gerçekten olumluysanız, tüm nüfusa sahipseniz, istatistiklere girmenize bile gerek yok. O zaman farkın tam olarak ne kadar büyük olduğunu biliyorsunuz ve daha fazla test etmek için hiçbir neden yok. Klasik bir hata "anlamlı" anlamlılık olarak istatistiksel önemi kullanıyor. Nüfusu örneklediyseniz, aradaki fark budur.

Öte yandan, hipotezinizi yeniden biçimlendirirseniz, adaylar istatistiksel testlere izin verecek olası adayların bir örneği olarak görülebilir. Bu durumda, genel olarak kadın ve erkeklerin testteki farklı olup olmadığını test edersiniz.

Söylediği gibi, çok yıllı testleri kullanabilir ve rastgele bir faktör olarak zaman ekleyebilirsiniz. Ancak ilginiz gerçekten bu belirli sınavdaki bu adaylar arasındaki farklar ise, genellemeyi kullanamazsınız ve sınav anlamsızdır.


15

Geleneksel olarak, istatistiksel çıkarım olasılık örnekleri ve örnekleme hatasının niteliği bağlamında öğretilir. Bu model, önem testinin temelidir. Bununla birlikte, sistematik kalkışları şanstan modellemenin başka yolları da var ve parametrik (örnekleme tabanlı) testlerimizin bu alternatiflerin iyi bir yaklaşımı olduğu ortaya çıktı.

Hipotezlerin parametrik testleri, olası hata tahminlerini üretmek için örnekleme teorisine dayanmaktadır. Belirli bir büyüklükteki örneklem bir popülasyondan alındığında, örneklemenin sistematik doğası bilgisi test ve güven aralıklarını anlamlı kılar. Bir popülasyonla, örnekleme teorisi sadece konuyla alakalı değildir ve testler geleneksel anlamda anlamlı değildir. Çıkarımın faydası yok, çıkarılacak bir şey yok, sadece bir şey var ... parametrenin kendisi.

Bazıları, mevcut nüfus sayımının temsil ettiği süper nüfuslara hitap ederek bunu atlatıyor. Bu itirazları ikna edici bulmuyorum - parametrik testler olasılık örneklemesi ve özellikleri üzerine kuruludur. Belirli bir zamanda bir popülasyon, zaman ve mekan içinde daha büyük bir popülasyonun bir örneği olabilir. Ancak, bunun yasal olarak bunun rastgele (veya daha genel olarak herhangi bir olasılık biçiminin herhangi bir formu) örneği olduğunu iddia edebileceği bir yol görmüyorum. Bir olasılık örneği olmadan, örnekleme teorisi ve geleneksel test mantığı basitçe geçerli değildir. Kolaylık örneği bazında test de yapabilirsiniz.

Açıkça, bir popülasyon kullanılırken testi kabul etmek için, örnekleme prosedürlerindeki bu testlerin temelini kullanmamız gerekir. Bunu yapmanın bir yolu, örnek teorik testlerimiz arasındaki - t, Z ve F gibi - ve randomizasyon prosedürleri arasındaki yakın bağlantıyı tanımaktır. Randomizasyon testleri eldeki numuneye dayanmaktadır. Erkeklerin ve kadınların gelirleri hakkında veri toplarsam, olasılık modeli ve hata tahminlerimizin temeli, gerçek veri değerlerinin rasgele tahsisleridir. Gruplar arasındaki gözlenen farklılıkları bu randomizasyona dayanan bir dağılımla karşılaştırabilirim. (Bunu, popülasyon modelinden rastgele örneklemenin nadiren uygun olduğu yerlerde, deneylerde hep yapıyoruz).

Şimdi, örnek-teorik testlerin genellikle rastgele testlerin iyi yaklaşımları olduğu ortaya çıktı. Sonuçta, sonuçta, popülasyonlardan yapılan testlerin bu çerçevede yararlı ve anlamlı olduğunu düşünüyorum ve sistematik olanı örneklemeli testlerde olduğu gibi tesadüfi farklılıklardan ayırt etmeye yardımcı olabileceğini düşünüyorum. Oraya ulaşmak için kullanılan mantık biraz farklı, ancak testlerin pratik anlamı ve kullanımı üzerinde pek bir etkisi yoktur. Tabii ki, tüm modern hesaplama gücümüzle kolayca ulaşılabiliyorsa, doğrudan randomizasyon ve permütasyon testlerini kullanmak daha iyi olabilir.


3
Mantıklı tartışma için +1; Yine de birkaç puan. Çıkarımsal makine nüfus analizi için kullanılamaz, ancak birçok modelleme durumlarda, ben kimse olup olmadığını sorgulamaya ediyorum başlamak için nüfus verileri - genellikle, bu delik aç çok zor değil. Bu nedenle, her zaman bir çıkarıma yol açmanın bir aracı olarak süper bir topluma hitap değildir . "Süper nüfus" yerine, daha iyi bir yol, örneğin söz konusu kohortları alarak yıldan yıla teste geçen bir veri üretme sürecini üstlenmektir. Stokastik bileşenin ortaya çıktığı yer burasıdır.
ars

2
Nüfus analizi için çıkarımsal makinelerin olmaması dışında, burada herhangi bir anlaşmazlık olduğunu düşünmüyorum. Rastgeleleştirme testleri popülasyonlara uygulanabilir ve veri üretme sürecinin sistematik bir üretme işlemine karşı rastgele bir üretme işleminden kaynaklanıp kaynaklanmadığını makul bir şekilde test edebilir. Rastgele örnekleme almazlar ve sistematik varyasyona karşı doğrudan bir şans testidirler. Geleneksel testlerimiz onlar için oldukça iyi durumda.
Brett,

Bu doğru yeniden: "çıkarımsal makine eksikliği". Benim açımdan dikkatsiz ifadeler, özellikle de cevabınızdaki randomizasyon testleriyle ilgili olarak dikkatinizi çektiğimden beri.
ars

üzgünüm. İzinleri nasıl hesaplayacağımı ve onlar için ne gibi sonuçlar çıkarabileceğimi anlamakta zorluk çekiyorum.
pbneau

Önyükleme geçerli bir alternatif değil mi? Önyükleme bu varsayımlardan herhangi birini yapma ihtiyacını çözmede nasıl başarısız olur?
Chernoff

3

Sonuçların, adayların cinsiyet çizgisi boyunca farklı olduğunu gösterdiğini varsayalım. Örneğin, testleri tamamlayanların oranı şöyledir:% 40 kadın ve% 60 erkek. Açıkça düşünmek gerekirse,% 40% 60'tan farklıdır. Şimdi önemli olan karar vermektir: 1) ilgilendiğiniz nüfus; 2) Gözlemlerinizin ilgi popülasyonuyla ilgisi. İşte bu iki konu hakkında bazı detaylar:

  1. İlgilendiğiniz nüfus yalnızca gözlemlediğiniz adaylarsa (örneğin, 2016'da bir üniversiteye başvuran 100 aday), istatistiksel önem testlerini rapor etmeniz gerekmez. Bunun nedeni, ilgilendiğiniz popülasyonun tamamen örneklenmiş olmasıdır ... ... tek umursadığınız şey, üzerinde tam bilgi sahibi olduğunuz 100 aday. Yani,% 60,% 40'tan farklı tam duraktır. Bu cevapların nasıl bir soru olduğu, programa başvuran 100 nüfusun cinsiyet farklılıkları var mıydı? Bu betimleyici bir soru ve cevap evet.

  2. Ancak, birçok önemli soru farklı ortamlarda neler olacağı ile ilgilidir. Bu, birçok araştırmacı, geçmişle ilgili geleceği tahmin etmemize (ve sonra planlamamıza) yardımcı olacak eğilimler bulmak istemektedir. Bu bağlamda örnek bir soru şu olacaktır: Gelecekteki adayların cinsiyet çizgileri boyunca farklı olması muhtemel testlerinin olasılığı nedir? İlgi popülasyonu daha sonra yukarıdaki senaryo 1'den daha geniştir. Bu noktada sorulması gereken önemli bir soru şudur: Gözlemlenen verilerinizin gelecekteki eğilimleri temsil etmesi muhtemel midir? Bu çıkarımsal bir sorudur ve orijinal poster tarafından sağlanan bilgilere dayanarak cevap: Bilmiyoruz.

Özetle, hangi istatistikleri bildirdiğiniz yanıtlamak istediğiniz sorunun türüne bağlıdır.

Temel araştırma tasarımı hakkında düşünmek çok yararlı olabilir (burada deneyin: http://www.socialresearchmethods.net/kb/design.php ). Süper popülasyonlar hakkında düşünmek daha fazla bilgi edinmek istiyorsanız yardımcı olabilir (işte size yardımcı olabilecek bir makale: http://projecteuclid.org/euclid.ss/1023798999#ui-tabs-1 ).


2

Neyi rasgele bir işlem olarak ölçtüğünüzü düşünürseniz, evet, istatistiksel testler önemlidir. Örneğin, adil olup olmadığını görmek için yazı turayı 10 kez çevirerek atın. 6 kafa ve 4 kuyruk elde edersiniz - ne elde edersiniz?


1
Madeni para atma konusunda vardığınız sonucun, sorulan soru ile nasıl ilişkili olduğunu gerçekten anlamıyorum. Belki bu noktada biraz genişleyebilirsin? İstatistiksel testler, ister referans ister genel nüfus olsun, daha geniş bir popülasyona gözlemlenen sonuçları çıkarmaya yardımcı olmaları ile ilgili görünmektedir. Buradaki soru şu gibi görünüyor: Örneklemin belirli bir süre boyunca sınav katılımcılarının popülasyonuna yakın olduğu göz önüne alındığında (burada bir yıl), klasik çıkarım bireysel düzeyde olası farklılıklar hakkında bir karara varmanın doğru yolu mu?
chl

1
@chl Evet, ancak OP'nin başarının altında yatan bir olasılık olduğunu ortaya çıkarmaya çalışıyor gibi görünüyor. Testler, belirli bir güven düzeyi için bir fark olup olmadığını belirlemek için gözlemlenen oranları teorik dağılımla karşılaştırır. Sadece hata rastgele örnekleme değil, rastgele bir form için test yapıyorsunuz.
James
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.