Doğrusal regresyon varsayımlarının ne olduğu konusunda biraz kafam karıştı.
Şimdiye kadar:
- açıklayıcı değişkenlerin tümü yanıt değişkeni ile doğrusal olarak ilişkilidir. (Durum böyleydi)
- açıklayıcı değişkenler arasında herhangi bir eşzamanlılık vardı. (çok az eşzamanlılık vardı).
- Cook'un modelimin veri noktalarındaki mesafeleri 1'in altındadır (bu durumda, tüm mesafeler 0,4'ün altındadır, bu nedenle etki noktası yoktur).
- kalıntılar normal olarak dağıtılır. (Durum bu olmayabilir)
Ama sonra aşağıdakileri okudum:
normallik ihlalleri genellikle ortaya çıkar, çünkü (a) bağımlı ve / veya bağımsız değişkenlerin dağılımlarının kendileri önemli ölçüde normal değildir ve / veya (b) doğrusallık varsayımı ihlal edilir.
Soru 1 Bu, bağımsız ve bağımlı değişkenlerin normal olarak dağıtılması gerektiği gibi görünmesini sağlar, ancak bildiğim kadarıyla durum böyle değildir. Bağımlı değişkenim ve bağımsız değişkenlerimden biri normalde dağılmaz. Olmalılar mı?
Soru 2 Kalanların QQnormal grafiğim şöyle:
Bu normal bir dağılımdan biraz farklıdır ve aynı shapiro.test
zamanda artıkların normal bir dağılımdan olduğuna dair sıfır hipotezini de reddeder:
> shapiro.test(residuals(lmresult))
W = 0.9171, p-value = 3.618e-06
Kalan değerler ve takılan değerler:
Artıklarım normal olarak dağıtılmazsa ne yapabilirim? Doğrusal modelin tamamen yararsız olduğu anlamına mı geliyor?