Eşitlik için bir çift örnek varyansı test ederken varyans oranı için F testi anlamına geldiğini varsayıyorum (çünkü normalliğe oldukça duyarlı olan en basit olanı; ANOVA için F testi daha az hassastır)
Örnekleriniz normal dağılımlardan alınmışsa, örnek varyansının ölçeklendirilmiş bir ki kare dağılımı vardır
Normal dağılımlardan alınan veriler yerine, normalden daha ağır kuyruklu dağıtımınız olduğunu düşünün. Ardından, bu ölçekli ki-kare dağılımına göre çok fazla büyük varyans elde edersiniz ve örnek varyansın en sağ kuyruğa çıkma olasılığı, verilerin çekildiği dağılımın kuyruklarına çok duyarlıdır =. (Çok fazla küçük sapma da olacaktır, ancak etki biraz daha az belirgindir)
Şimdi her iki numune de daha ağır kuyruklu dağılımdan çekilirse, pay üzerindeki büyük kuyruk fazladan büyük F değerleri üretecek ve paydadaki büyük kuyruk fazladan küçük F değerleri üretecektir (ve sol kuyruk için tersi )
Her iki örnek de aynı varyansa sahip olsa da , bu etkilerin her ikisi de iki kuyruklu bir testte reddedilmeye yol açacaktır . Bu, gerçek dağılım normalden daha ağır kuyruklu olduğunda, gerçek önem seviyelerinin istediğimizden daha yüksek olma eğiliminde olduğu anlamına gelir.
Bunun tersine, daha açık kuyruklu bir dağılımdan bir örnek çizmek, çok kısa bir kuyruğa sahip örnek varyanslarının bir dağılımını üretir - varyans değerleri, normal dağılımlardan alınan verilerle elde ettiğinizden daha "orta" olma eğilimindedir. Yine, etki üst üst kuyrukta alt kuyruktan daha güçlüdür.
Şimdi her iki numune de daha açık kuyruklu dağılımdan çekilirse, bu durum medyan yakınında F değerlerinin fazla olmasına ve her iki kuyrukta çok azın olmasına neden olur (gerçek anlamlılık seviyeleri istenenden daha düşük olacaktır).
Bu etkilerin daha büyük örneklem büyüklüğü ile birlikte çok fazla azaldığı görülmemektedir; bazı durumlarda kötüleşiyor gibi görünüyor.
(Kısmi Örnekleme yoluyla, buradan 10000 örnek sapma olan n=10 ), normal, t5 ve homojen dağılımlar, bir aynı ortalama olacak şekilde ölçeklendirilir χ29 :
Zirveye kıyasla nispeten küçük olduğu için uzak kuyruğu görmek biraz zor (ve t5 için kuyruktaki gözlemler, çizdiğimiz yerde adil bir şekilde uzanıyor), ancak etkisinin bir kısmını görebiliriz varyans dağılımı. Bunları ki-kare cdf'nin tersi ile dönüştürmek belki de daha öğreticidir,
ki bu normal durumda (olması gerektiği gibi) homojen görünüyor, t-durumunda üst kuyrukta (ve alt kuyrukta daha küçük bir tepe) büyük bir tepe var ve tekdüze durumda daha tepe benzeri ama geniş 0,6 ila 0,8 civarında zirve yapar ve uç uçlar normal dağılımlardan örnek alıyor olmamız gerektiğinden çok daha düşük bir olasılığa sahiptir.
Bunlar da daha önce tarif ettiğim varyans oranının dağılımı üzerinde etkiler yaratır. Yine, kuyruklar üzerindeki etkisini görme yeteneğimizi geliştirmek için (ki bu görmek zor olabilir), cdf'in tersine dönüştüm (bu durumda F9,9 dağılımı için):
İki kuyruklu bir testte, F dağılımının her iki kuyruğuna bakarız; t 5'ten çizim yaparken her iki kuyruk aşırı temsil edilirt5 ve her iki alt-temsil edilen bir standart olmaktan çizilirken bulunmaktadır.
Tam bir çalışma için araştırılacak başka birçok vaka olacaktır, ancak bu en azından etkinin türü ve yönü ile nasıl ortaya çıktığı hakkında bir fikir verir.