Neden normallik testi yapmalısınız?
Doğrusal regresyonda standart varsayım, teorik artıkların bağımsız ve normal olarak dağılmış olmasıdır. Gözlenen artıklar teorik artıkların bir tahminidir, fakat bağımsız değildir (bazı bağımlılığı ortadan kaldıran ancak hala gerçek artıkların yaklaşık bir değerini veren artıklarda dönüşümler vardır). Dolayısıyla, gözlemlenen artıklar üzerinde yapılan bir test, teorik artıkların eşleşeceğini garanti etmez.
Teorik artıklar normalde tam olarak dağılmamışsa, ancak örneklem büyüklüğü yeterince büyükse, Merkezi Limit Teoremi normal çıkarımın (normallik varsayımına dayanan test sonuçları ve güven aralıkları, ancak mutlaka tahmin aralıkları değil) hala doğru olacağını söyler. .
Ayrıca, normallik testlerinin kural dışı testler olduğunu unutmayın, verilerin normal bir dağıtımdan gelme ihtimalinin düşük olduğunu söyleyebilirler. Ancak test, verilerin normal bir dağılımdan geldiği anlamına gelmeyen anlamlı değilse, farkı görmeniz için yeterli gücünüzün olmadığı anlamına da gelebilir. Daha büyük örneklem büyüklükleri normal olmayanlığı tespit etmek için daha fazla güç verir, ancak daha büyük örnekler ve CLT normal olmayanlığın en az önemli olduğu anlamına gelir. Bu nedenle küçük örneklem büyüklükleri için normallik varsayımı önemlidir ancak testler anlamsızdır, büyük örneklem büyüklükleri için testler daha kesin olabilir, fakat kesin normallik sorunu anlamsız hale gelir.
Bu yüzden yukarıdakilerin hepsini birleştirerek, kesin bir normallik testinden daha önemli olan, nüfusun normale yeterince yakın olup olmadığını anlamak için verilerin arkasındaki bilimi anlamaktır. Qqplot gibi grafikler iyi bir teşhis olabilir, ancak bilimi anlamak da gereklidir. Aykırı değerler için çok fazla çarpıklık veya potansiyel olduğuna dair bir endişe varsa, normalite varsayımını gerektirmeyen parametrik olmayan yöntemler kullanılabilir.