ANOVA varsayımlarını kontrol etme


16

Birkaç ay önce SO'daki R'de homoscedasticity testleri hakkında bir soru yayınladım ve Ian Fellows bunu yanıtladı (cevabını çok gevşek bir şekilde açıklayacağım):

Homossedastisite testleri, modelinizin uygunluğunu test ederken iyi bir araç değildir. Küçük örneklerde, homoscedasticity'den çıkışları tespit etmek için yeterli gücünüz yoktur, büyük örneklerde ise "bol miktarda güç" vardır, bu nedenle eşitlikten önemsiz kalkışları bile tarama olasılığınız daha yüksektir.

Onun büyük cevabı yüzüme bir tokat olarak geldi. ANOVA'yı her çalıştırdığımda normallik ve homoscedastisite varsayımlarını kontrol ederdim.

Sizce ANOVA varsayımlarını kontrol ederken en iyi uygulama nedir?

Yanıtlar:


11

Uygulamalı ortamlarda, varsayım ihlallerinin herhangi bir çıkarım için sorunlu olup olmadığını bilmek genellikle daha önemlidir.

Anlamlılık testlerine dayanan varsayım testleri büyük örneklerde nadiren ilgilenir, çünkü çoğu çıkarımsal testler hafif varsayım ihlallerine karşı sağlamdır.

Varsayımların grafiksel değerlendirmelerinin hoş özelliklerinden biri, dikkatleri herhangi bir ihlalin istatistiksel önemine değil, ihlal derecesine odaklamalarıdır.

Bununla birlikte, verilerinizin istatistiksel anlamlılığı değil, varsayımların ihlali derecesini belirleyen sayısal özetleri üzerinde odaklanmak da mümkündür (örneğin, çarpıklık değerleri, basıklık değerleri, en büyük / en küçük grup varyanslarının oranı, vb.). Ayrıca, daha büyük örneklerle daha da küçülecek olan bu değerlerde standart hatalar veya güven aralıkları alabilirsiniz. Bu bakış açısı, istatistiksel anlamlılığın pratik öneme eşdeğer olmadığı genel fikri ile tutarlıdır.


1
Her şeyi tamamlayan harika yanıt için +1. Bahsedilen sayısal prosedürlerin nasıl uygulanacağı Tabachnik ve Fidell'in Çok Değişkenli İstatistikleri Kullanma (SPSS ve SAS için) bölümünde güzel ve uygulanabilir bir şekilde tanımlanmıştır: amazon.com/Using-Multivariate-Statistics-Barbara-Tabachnick/dp/… (Ancak web sayfası)
Henrik

Bence, çarpıklık ve basıklık gibi çoğu zaman özetler çok az değerlidir, örnekleme varyasyonları çok büyüktür. Bununla birlikte, bunların yerine L_skewness ve L-basıklık gelebilir.
kjetil b halvorsen

@kjetilbhalvorsen Genellikle ne tür örnek boyutları ile çalıştığınıza bağlıdır. Deneyimlerime göre, araziler ve çarpıklık istatistikleri verilerin dağılımını anlamada çok yardımcıdır.
Jeromy Anglim

@Jeromy Anglim: Tamam. Sonra genellikle çok büyük örnek boyutları var sanırım! Çarpıklık / basıklık katsayılarınızı önyüklemeye çalıştınız mı?
kjetil b halvorsen

9

Birkaç grafik genellikle bir normallik veya homoskedastisite testinden elde edilen p değerinden çok daha aydınlatıcı olacaktır. Gözlemlenen bağımlı değişkenleri bağımsız değişkenlere göre çizin. Uyumlara karşı gözlemleri çizin. Kalıntıları bağımsız değişkenlere göre çizin. Bu arazilerde garip görünen her şeyi araştırın. Bir şey garip görünmüyorsa, önemli bir varsayım testi için endişelenmezdim.


Çoğu zaman iyi bir tavsiye, ancak tüm verileri manuel olarak el ile inceleyemediğiniz büyük veri kümeleri durumunda ne olacak?
dsimcha

1
@dsimcha Aynı zamanda grup başına örnek büyüklüğüne de bağlıdır. Örneğin, numuneler eşit büyüklükte olduğunda, t-testinin homossedastisite varsayımından ayrılmaya karşı sağlam olduğu bilinmektedir; Eğern1n2<ασ2

2
@ dsimcha re büyük veri setleri: "büyük" ile ne demek istediğinize bağlıdır. Birçok gözlem? İyi grafikler kullanın (kutu grafiği, gerilmiş nokta grafikleri, ayçiçeği grafikleri). Birçok bağımsız değişken? Evet, orada bir noktanız var ... Ama DV'yi her IV'e karşı çizemeyeceğiniz çok fazla IV'ünüz varsa, bir ANOVA kullanarak soru soracağım - herhangi bir yorum yapmak zor olabilir gibi görünüyor durum. Bazı akıllı makine öğrenimi yaklaşımları daha iyi olabilir (Brian D. Ripley: "Kışkırtıcı bir şekilde yorum yapmak için," makine öğrenimi istatistik eksi modellerin ve varsayımların kontrol edilmesi eksi "dir.")
Stephan Kolassa

İyi yorum, +1. Bu özel soru ANOVA ile ilgili olmasına rağmen, cevabımı yazdığımda arsalar ve testler sorusu hakkında daha genel bir seviyede düşünüyordum.
dsimcha

4

ANOVA varsayımlarını kontrol etmek için bazı çok iyi web kılavuzları ve başarısız olursa ne yapmalı. İşte bir tane. Bu başka.

Esasen gözünüz en iyi yargıçtır, bu yüzden bazı keşifsel veri analizi yapın . Bu, verileri çizmek anlamına gelir - histogramlar ve kutu grafikleri, normallik ve homoscedascity'yi değerlendirmek için iyi bir yoldur. Ve ANOVA'nın bunların küçük ihlallerine karşı sağlam olduğunu unutmayın.


4

QQ grafikleri normalliksizliği tespit etmek için oldukça iyi yollardır.

Homoscedasticity için Levene testini veya Brown-Forsythe testini deneyin. Her ikisi de benzer, ancak BF biraz daha sağlam. Normal olmayanlara Bartlett'in testinden daha az duyarlıdırlar, ancak yine de, küçük örnek boyutları ile en güvenilir olmadığını gördüm.

QQ grafiği

Brown-Forsythe testi

Levene testi


Göreceli dağılım grafikleri (veya normal dağılıma kıyasla örnek) iyi bir yedek olabilir, çünkü yorumları yeni başlayanlar için daha açık olabilir.
kjetil b halvorsen

3

Varsayımlar için önem testinin sorunlu olduğu konusunda başkalarına katılıyorum.

kk

Wilcoxon ve Kruskal-Wallis testleri gibi yarı parametrik (sıralama) yöntemler çok daha az varsayım yapar. Wilcoxon-Kruskal-Wallis testlerinin maksimum güce sahip olması için ECDF logitinin paralel olması gerekir (tip I hatası onlar için asla sorun değildir). Doğrusallık gerekli değildir . Sıralama testleri, farklı grupların dağılımlarının diğeriyle nasıl ilişkili olduğu konusunda varsayımlar yapar, ancak herhangi bir dağılımın şekli hakkında varsayımlar yapmaz.


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.