F-testi normallik varsayımı için neden bu kadar hassas?

16

Varyans farkı için F testi neden büyük için bile normal dağılım varsayımına karşı bu kadar hassastır ? $N$

Web'de arama yapmaya çalıştım ve kütüphaneyi ziyaret ettim, ancak hiçbiri iyi cevap vermedi. Testin normal dağılım varsayımının ihlali için çok hassas olduğunu söylüyor, ancak nedenini anlamıyorum. Bunun için iyi bir cevabı olan var mı?

normality-assumption f-test

— Magnus Johannesen
kaynak

6

Hangi

F

$F$ testi ile ilgileniyorsunuz?

— Stephan Kolassa

Varyans farkını ölçmek için F testi.

— Magnus Johannesen

35

Eşitlik için bir çift örnek varyansı test ederken varyans oranı için F testi anlamına geldiğini varsayıyorum (çünkü normalliğe oldukça duyarlı olan en basit olanı; ANOVA için F testi daha az hassastır)

Örnekleriniz normal dağılımlardan alınmışsa, örnek varyansının ölçeklendirilmiş bir ki kare dağılımı vardır

Normal dağılımlardan alınan veriler yerine, normalden daha ağır kuyruklu dağıtımınız olduğunu düşünün. Ardından, bu ölçekli ki-kare dağılımına göre çok fazla büyük varyans elde edersiniz ve örnek varyansın en sağ kuyruğa çıkma olasılığı, verilerin çekildiği dağılımın kuyruklarına çok duyarlıdır =. (Çok fazla küçük sapma da olacaktır, ancak etki biraz daha az belirgindir)

Şimdi her iki numune de daha ağır kuyruklu dağılımdan çekilirse, pay üzerindeki büyük kuyruk fazladan büyük F değerleri üretecek ve paydadaki büyük kuyruk fazladan küçük F değerleri üretecektir (ve sol kuyruk için tersi )

Her iki örnek de aynı varyansa sahip olsa da , bu etkilerin her ikisi de iki kuyruklu bir testte reddedilmeye yol açacaktır . Bu, gerçek dağılım normalden daha ağır kuyruklu olduğunda, gerçek önem seviyelerinin istediğimizden daha yüksek olma eğiliminde olduğu anlamına gelir.

Bunun tersine, daha açık kuyruklu bir dağılımdan bir örnek çizmek, çok kısa bir kuyruğa sahip örnek varyanslarının bir dağılımını üretir - varyans değerleri, normal dağılımlardan alınan verilerle elde ettiğinizden daha "orta" olma eğilimindedir. Yine, etki üst üst kuyrukta alt kuyruktan daha güçlüdür.

Şimdi her iki numune de daha açık kuyruklu dağılımdan çekilirse, bu durum medyan yakınında F değerlerinin fazla olmasına ve her iki kuyrukta çok azın olmasına neden olur (gerçek anlamlılık seviyeleri istenenden daha düşük olacaktır).

Bu etkilerin daha büyük örneklem büyüklüğü ile birlikte çok fazla azaldığı görülmemektedir; bazı durumlarda kötüleşiyor gibi görünüyor.

(Kısmi Örnekleme yoluyla, buradan 10000 örnek sapma olan $n=10$ ), normal, $t_5$ ve homojen dağılımlar, bir aynı ortalama olacak şekilde ölçeklendirilir $\chi^2_9$ :

Zirveye kıyasla nispeten küçük olduğu için uzak kuyruğu görmek biraz zor (ve $t_5$ için kuyruktaki gözlemler, çizdiğimiz yerde adil bir şekilde uzanıyor), ancak etkisinin bir kısmını görebiliriz varyans dağılımı. Bunları ki-kare cdf'nin tersi ile dönüştürmek belki de daha öğreticidir,

ki bu normal durumda (olması gerektiği gibi) homojen görünüyor, t-durumunda üst kuyrukta (ve alt kuyrukta daha küçük bir tepe) büyük bir tepe var ve tekdüze durumda daha tepe benzeri ama geniş 0,6 ila 0,8 civarında zirve yapar ve uç uçlar normal dağılımlardan örnek alıyor olmamız gerektiğinden çok daha düşük bir olasılığa sahiptir.

Bunlar da daha önce tarif ettiğim varyans oranının dağılımı üzerinde etkiler yaratır. Yine, kuyruklar üzerindeki etkisini görme yeteneğimizi geliştirmek için (ki bu görmek zor olabilir), cdf'in tersine dönüştüm (bu durumda $F_{9,9}$ dağılımı için):

İki kuyruklu bir testte, F dağılımının her iki kuyruğuna bakarız; çizim yaparken her iki kuyruk aşırı temsil edilir $t_5$ ve her iki alt-temsil edilen bir standart olmaktan çizilirken bulunmaktadır.

Tam bir çalışma için araştırılacak başka birçok vaka olacaktır, ancak bu en azından etkinin türü ve yönü ile nasıl ortaya çıktığı hakkında bir fikir verir.

— Glen_b-Monica'yı eski durumuna döndür
kaynak

1

Gerçekten güzel bir demo

— shadowtalker

3

As Glen_b Simülasyonlarından zekice ilişkin tasvir, sapmaların bir oranı için F-testi dağılımının uçlarına karşı duyarlıdır. Bunun nedeni, bir örnek varyansının varyansının basıklık parametresine bağlı olmasıdır ve bu nedenle altta yatan dağılımın basıklığının, örnek varyanslarının oranının dağılımı üzerinde güçlü bir etkisi vardır.

$S_N^2$ $S_n^2$ $n<N$ $^\dagger$

\frac{S_{N}^{2}}{S_{n}^{2}} \overset{Approx}{\sim} \frac{n - 1}{N - 1} + \frac{N - n}{N - 1} \cdot F (D F_{C}, D F_{n}),

$\frac{S_N^2}{S_n^2} \overset{\text{Approx}}{\sim} \frac{n-1}{N-1} + \frac{N-n}{N-1} \cdot F(DF_C, DF_n),$

$\kappa$

D F_{n} = \frac{2 n}{κ - (n - 3) / (n - 1)} D F_{C} = \frac{2 (N - n)}{2 + (κ - 3) (1 - 2 / N + 1 / N n)} .

$DF_n = \frac{2n}{\kappa - (n-3)/(n-1)} \quad \quad \quad DF_C = \frac{2(N-n)}{2+(\kappa-3)(1-2/N+1/Nn)}.$

$\kappa=3$ $DF_n = n-1$ $DF_C = N-n$

$\hat{\kappa}$

$^\dagger$ $N-1$ $N$

— Monica'yı eski durumuna getir
kaynak

+1 Bu çok ilginç bir gönderi. Kesinlikle mezokurtik dağılımlarda, varyans oranı dağılımının F'den olabildiğince uzak bir dağıtım yelpazesi ile mümkün olduğunca uzakta olmasını sağlamak daha zordur, ancak vakaları tanımlamak o kadar zor değildir (cevabımdaki örnek boyutunda, 10 ve 10) gerçek tip I hata oranının nominal 0.05 oranından biraz daha uzak olması. Denediğim ilk 3 vakanın (popülasyon kurtozu = 3 - hepsi simetrik dağılımları) 0.0379, 0.0745 ve 0.0785 tip I ret oranları vardı. ...

— ctd

ctd ... Yaklaşımı nasıl daha da kötüleştireceği hakkında biraz düşünerek daha aşırı vakaların tespit edilebileceğinden şüphe duymuyorum. Yine de (önem düzeyinin çok fazla etkilenmeyeceğini) daha büyük örneklerde daha iyi tutabileceğini hayal ediyorum.

— Glen_b