ANOVA'da normallik varsayımından ayrılma: basıklık veya çarpıklık daha önemli mi?


12

Kutner ve ark. ANOVA modellerinin normallik varsayımından ayrılma ile ilgili olarak şunları ifade eder: Hata dağılımının basıklığı (normal bir dağılımdan daha fazla veya daha az zirve) çıkarımlar üzerindeki etkiler açısından dağılımın çarpıklığından daha önemlidir .

Bu ifadeden biraz şaşkınım ve kitapta veya çevrimiçi olarak ilgili herhangi bir bilgi bulmayı başaramadım. Kafam karıştı, çünkü ağır kuyruklu QQ parsellerinin normallik varsayımının lineer regresyon modelleri için "yeterince iyi" olduğunun bir göstergesi olduğunu öğrendim, oysa çarpık QQ parselleri daha fazla endişe kaynağı (yani bir dönüşüm uygun olabilir) .

ANOVA için aynı akıl yürütmenin geçerli olduğu ve kelime seçiminin ( çıkarımlar üzerindeki etkiler açısından daha önemli ) doğru seçilmediğinden emin miyim? Çarpık bir dağılımın daha ciddi sonuçları vardır ve bundan kaçınılmalıdır, ancak az miktarda basıklık kabul edilebilir.

EDIT: rolando2 tarafından adresse gibi, her durumda birinin diğerinden daha önemli olduğunu belirtmek zor, ama ben sadece bazı genel içgörü arıyorum. Benim asıl meselem, basit doğrusal regresyonda, daha ağır kuyruklu (= basıklık?) QQ-parsellerinin iyi olduğu, çünkü F-testinin buna karşı oldukça sağlam olduğu öğretildi. Öte yandan, çarpık QQ grafikleri (parabol şeklinde) genellikle daha büyük bir endişe kaynağıdır. Bu, ANOVA modelleri regresyon modellerine dönüştürülebilmesine ve aynı varsayımlara sahip olmalarına rağmen, ders kitabımın ANOVA için sağladığı yönergelere doğrudan benziyor.

Bir şeye bakmadığımdan ya da yanlış bir varsayımdan emindiğime ikna oldum, ama ne olabileceğini anlayamıyorum.


3
Basıklık incelemesinde, DeCarlo (1997) bunun tam tersini, ANOVA ve diğer araç eşitliği testlerinde daha önemli olduğunu öne sürdü. 297. sayfadaki alıntıları yararlı bulabilirsiniz: columbia.edu/~ld208/psymeth97.pdf
Anthony

1
"Çıkarma için çıkıntılar için bastozdan çok daha önemlidir, çünkü ___ çarpıklığı ___ seviyesindeki çarpıklık, genellikle ___ seviyesindeki kurtoz kadar çarpıtacaktır. ." Böyle bir nicelik olmadan, sadece birinin ya da diğerinin daha önemli olduğunu söylemek bize çok yardımcı olmaz.
rolando2

Bu simülasyon emis.de/journals/HOA/ADS/Volume7_4/206.pdf Khan ve Rayner (2003) tarafından UYGULAMALI MATEMATİK VE KARAR BİLİMLERİ DERGİSİ'ndeki "Hem ANVA hem de Kruskal-Wallis testlerinin basıklıktan çok daha fazla etkilendiğini belirtir. hata dağılımından ziyade hata dağılımının "(s. 204).
bsbk

İki örnekli t-testi ile ilgili son derece yakından ilişkili bir soru - faktörde iki seviyeli etkili bir şekilde tek yönlü bir ANOVA - stats.stackexchange.com/questions/38967/… ... Şu anda orada eklenen bir lütuf var mevcut cevapların hiçbiri atıf içermediğinden referanslar olduğundan, bu soruya cevap verenler bir göz atmak isteyebilir.
Silverfish

@ Rolando2: "çarpıklık basıklıktan daha kötüdür" ya da tam tersi çarpıklık / basıklık derecesinden bahsetmeden oldukça boş bir ifadedir. Ancak daha fazlasının da dikkate alınması gerekiyor! Örneğin, bu tür normallik ihlallerine karşı sağlamlık kısmen grup boyutlarının eşit olup olmadığına bağlıdır ve çarpıklığa karşı sağlamlık çarpıklık yönüne bağlı olabilir - bir grup bir şekilde çarpıksa ve diğer grup çarpıksa daha kötüdür tersine, her iki grubun da aynı yöne çarpık olmasına göre. (Bu hafıza ve yeniden t-testlerinden ama bu bir ANOVA türüdür.)
Silverfish

Yanıtlar:


6

Zorluk, çarpıklık ve basıklığın bağımlı olmasıdır; etkileri tamamen ayrılamaz.

Sorun şu ki, yüksek bir çarpıklık dağılımının etkisini incelemek istiyorsanız , yüksek basıklık ile bir dağılımınız da olmalıdır .

2+1

* (sıradan ölçekli dördüncü moment basıklık, fazla basıklık değil)

Khan ve Rayner (önceki cevapta bahsedilmektedir), çarpıklık ve basıklık etkisinin biraz araştırılmasına izin veren bir aile ile çalışırlar, ancak bu sorunu önleyemezler, bu yüzden onları ayırma girişimleri, etkisinin derecesini ciddi ölçüde sınırlar. çarpıklık araştırılabilir.

β2β21

Örneğin, yüksek çarpıklığın etkisini görmek istiyorsanız - çarpıklık> 5 deyin, bastosis ile 26'dan daha az bir dağılım elde edemezsiniz !

Bu nedenle, yüksek çarpıklığın etkisini araştırmak isterseniz, yüksek basıklığın etkisini araştırmaktan kaçınamazsınız. Sonuç olarak, bunları ayırmaya çalışırsanız, aslında çarpıklığın yüksek seviyelere çıkmasının etkisini değerlendiremediğinizi iddia edersiniz.

Bununla birlikte, en azından düşündükleri dağıtım ailesi için ve aralarındaki ilişkinin ortaya koyduğu sınırlar içinde, Khan ve Rayner tarafından yapılan soruşturma, basıklığın ana sorun olduğunu düşündürmektedir.

>2


11

Bu sorun, Khan ve Rayner tarafından "Çok Örneklemeli Yer Problemi için Ortak Testlerin Normalliklerine Sağlamlığı" konusuna değinilmiştir .

ANOVA testlerinin basıklıktan çarpıklıktan çok daha fazla etkilendiğini ve çarpıklığın etkisinin yönü ile ilgisiz olduğunu bulmuşlardır.

Normallikten sapmalardan şüpheleniliyorsa, Kruskal-Wallis testi daha iyi bir seçim olabilir. Kruskal-Wallis testi normallikten sapmalara karşı daha dayanıklıdır, çünkü tedavi medyanlarının aynı olduğu hipotezini inceler . ANOVA, tedavi araçlarının aynı olduğu hipotezini inceler .


Bu aynı zamanda QQ grafiklerini doğrusal regresyon ve ANOVA için farklı yorumlamam gerektiğini de gösteriyor mu? Yaptığım dönüşümlerin çoğu çarpıklığı azalttı, ancak biraz ağır kuyruklar bıraktı (= basıklık?). F-testinin, ikincisiyle başa çıkmak için yeterince sağlam olduğu izlenimini edindim. Yoksa bu "ağır kuyruklar iyi" benim için bir yanlış anlama mı? ANOVA modelleri de doğrusal regresyon modelleri olarak yeniden yazılabildiğinden ikisi arasında böyle temel bir fark olduğunu hayal edemiyorum.
Zenit
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.