-statistics ve -statistics ne zaman kullanılacağı konusunda karışıklık


15

Güven aralığını hesaplamak için bu video dersinden bahsediyordum . Ancak, bazı karışıklıklarım var. Bu adam hesaplama için istatistiklerini kullanıyor . Ancak, bunun istatistik olması gerektiğini düşünüyorum . Bize nüfusun gerçek standart sapması verilmiyor. Doğru olanı tahmin etmek için örnek standart sapmayı kullanıyoruz.zt

Peki neden yerine güven aralığı için normal dağılım aldı ?t



Sadece referans olarak, bir ile video üzerinde maruz sorun çalışma dışarı t doğuracak istatistik: n <- 36; diff <- 12; sd <- 40; 2 * (pt(diff/(sd/sqrt(n)), df = n - 1) - 0.5) = 0.9195145.
Antoni Parellada

Yanıtlar:


10

Haklısın, bu bir t-dağılımı olmalı. Ancak numune boyutu 36 (yani> 20) olduğundan az dağılım da uygun olacaktır. Unutmayın, örneklem büyüklüğü büyüdükçe, t-dağılımı şekil olarak z-dağılımına daha çok benzer hale gelir.


21

İlk istatistik dersimi aldığımda (dinozorlardan sonra, ancak gerçek bilgisayarlar hala tüm bir odayı aldığında), kısmen kitaptaki t masası nedeniyle 30'dan fazla serbestlik olsaydı z tablosunu kullanmamız öğretildi. sadece 30 dereceye kadar özgürlüğe yükseldi ve t-tablosuna bakarsanız, 28 derecelik bir serbestlikte bir yerde z tablosuyla aynı sonuçları 2 önemli basamağa kadar elde ettiğinizi göreceksiniz (ve tüm bunları elle yaptığımızda daha sık yuvarlamak için). Belki de sunucu hala o okuldadır.

Eğer bir test için örnek standart sapmayı kullanıyorsanız, ortalama boyutta (bu günlerde yapmak çok daha kolay) bağımsız olarak t dağılımını kullanmanız ve yalnızca z (standart normal) kullanmanız gerekir. popülasyon standart sapmasını bilin, ancak pratik amaçlar için örnek büyüklüğü büyükse genellikle anlamlı bir fark görmezsiniz.


1
Great anecdote :)
swiecki

Z-aralıklarının kullanılmasının bazen uygun olmasının talihsiz bir yan etkisi, bazı tanıtım metinlerinin t-aralıkları yerine z-aralıklarını sunmasıdır. Örneklerin rutin olarak z aralıklarının tamamen uygun olmayacağı kadar küçük olduğu birçok bilim alanı vardır. Öğrencilerime bunu her yıl açık talimatlarla anlatıyorum, ancak hala önemli sayıda z-aralıklarını kullanıyor :-(
Michael Lew

4

Khan'ın videodaki basitleştirilmiş şeyleri biraz daha fazla mı yoksa yanlış mı olduğunu anlamakta zorlanıyorum. İkincisini söylemek zorundayım, ama sorun z veya t sorusunda değil. Güven aralığını hesapladığı şeyi çağırıyor ve daha sonra popülasyon ortalamasının verilen aralığa düştüğünden% 92 emin olduğunu söylüyor. Bu sadece bir güven aralığından çıkardığınız bir şey değil ... maalesef.

Sonra t vs. z sorusuna geri dönüp orada bir hata yapıp yapmadığını merak etmeye başladım . Belki de örnek küçükse bir düzeltme yapmanız gerektiğini belirttiği için değil diye düşünüyorum. Yani diğer cevap verenler muhtemelen doğrudur. Sadece z kullanıyor çünkü zaten tanıttı ve 36 n ile yeterince yakın. Tüm videolardan geçmeyi planlamıyorum, ancak t dağıtımını daha sonra, umarım bir sonraki videoyu tanıtacağını hayal ediyorum .

Khan Academy'nin pek çok istatistik alanında yanlış olması gerçekten talihsiz bir durum ... ama belki de böyle hissediyorum çünkü sadece sorunlu videolara yöneliyorum.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.