Bir T istatistiği neden normal dağılımı izlemek için verilere ihtiyaç duyar?


11

Bu deftere bakıyordum ve şu ifadeden şaşkınım:

Normallik hakkında konuştuğumuzda, demek istediğimiz, verilerin normal bir dağılım gibi görünmesi. Bu önemlidir, çünkü birkaç istatistik testi buna dayanmaktadır (örneğin, t-istatistikleri).

Bir T istatistiğinin normal dağılımı izlemek için neden verilere ihtiyacı olduğunu anlamıyorum.

Aslında Wikipedia da aynı şeyi söylüyor:

Öğrencinin t-dağılımı (veya basitçe t-dağılımı), normal olarak dağılmış bir popülasyonun ortalamasını tahmin ederken ortaya çıkan sürekli olasılık dağılımları ailesinin herhangi bir üyesidir

Ancak, bu varsayımın neden gerekli olduğunu anlamıyorum.

Formülünden hiçbir şey bana verilerin normal bir dağılım izlemesi gerektiğini göstermez:

resim açıklamasını buraya girin

Tanımına biraz baktım ama durumun neden gerekli olduğunu anlamıyorum.

Yanıtlar:


17

İstediğiniz bilgiler Wiki sayfasının "Karakterizasyon" bölümünde . Bir özgürlük dereceleri ile -Dağıtım cyclotron frekansının rastgele değişken dağılımı olarak tanımlanabilir T bu şekilde , T = ZtνT Burada Z, bir standart normal dağılım rasgele değişkendir ve V a, χ 2 serbestlik derecesi ile rastgele değişken cyclotron frekansının . Ayrıca, Z ve V bağımsız olmalıdır. Yukarıdaki tanımı izleyenherhangi bir Z ve V verildiğinde, t dağılımınasahip rastgele bir değişkeneulaşabilirsiniz.

T=ZV/ν,
ZVχ2νZVZVt

Şimdi bir F dağılımına göre dağıtıldığını varsayın . Let F ortalama var ^ ı ve varyans σ 2 . Let ˉ X örnek ortalaması olabilir ve G 2 örnek varyans olabilir. Daha sonra formüllere bakacağız:X1,X2,...,XnFFμσ2X¯S2

X¯-μS/n=X¯-μσ/n(n-1)S2(n-1)σ2.

Eğer, , normal dağılımını göstermektedir, daha sonra ˉ X ~ N ( μ , σ 2 / n ) ve böylece ˉ X - μFX¯~N-(μ,σ2/n). Ayrıca,(n-1)S2X¯-μσ/n~N-(0,1)Cochran Teoremitarafından σ 2χ 2 n - 1 . Son olarak,Basu teoremininbir uygulamasıyla, ˉ X veS2bağımsızdır. Bu daha sonra ortaya çıkan istatistiğinn-1serbestlik derecesindet-dağılımına sahip olduğunu gösterir.(n-1)S2σ2~χn-12X¯S2tn-1

Orijinal veri dağılımı normal değilse, o zaman pay ve payda'nın kesin dağılımı sırasıyla standart normal ve χ 2 olmayacaktır ve bu nedenle sonuçta elde edilen istatistiklerde t dağılımı bulunmayacaktır.Fχ2t


3
Matematik istatistiklerinde bu temel sonuçlara ne kadar matematiksel teknolojinin girdiğini her zaman oldukça ilginç buldum.
Matthew Drury

3
X¯Sχ2

2

İstatistik ve formülü ile dağılım ve formülü arasında bir karışıklık olabileceğini düşünüyorum. Herhangi bir veri kümesine t-istatistik formülünü uygulayabilir ve bir "t-istatistik" elde edebilirsiniz, ancak veriler normal bir dağılımdan gelmedikçe (veya en azından, olmayacaksa) bu istatistik student-t dağılımına göre dağıtılmaz. Tahminimce, normal olmayan dağılımlar, t istatistik formülü uygulandığında student-t dağılımı üretmeyecek, ancak bundan emin değilim). Bunun nedeni, t-istatistiğinin dağılımının, onu oluşturan verilerin dağılımından hesaplanmasıdır, bu nedenle farklı bir temel dağılımınız varsa, türetilmiş istatistikler için aynı dağılıma sahip olduğunuz garanti edilmez.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.