Başlangıç olarak " doğrusal regresyon modeli teşhisi " ile ilgili kısa bir araştırma önereceğim . Ama kontrol etmenizi önerebileceğim bazıları:
Varsayımların tatmin edici bir şekilde karşılandığından emin olun
Bağımsız öngörücü (ler) ve bağımlı değişken arasındaki doğrusal ilişkiyi incelemek için dağılım grafiği veya bileşen artı artık grafik kullanın.
Standartlaştırılmış kalıntı ile öngörülen değere sahip bir arsa oluşturun ve çok yüksek kalıntı ile aşırı bir nokta olmadığından emin olun ve tortunun yayılması, tahmin edilen değer boyunca büyük ölçüde benzer ve aynı zamanda artık ortalamanın üstünde ve altında yayılır, sıfır.
Ayrıca, y eksenini artık . Bu grafik eşit olmayan varyansın tanımlanmasına yardımcı olur.2
Bağımsızlık varsayımının makul olmasını sağlamak için çalışma tasarımını yeniden inceleyin.
Olası eşbiçimliliği incelemek için varyans enflasyon faktörünü (VIF) veya tolerans istatistiklerini alın.
Potansiyel etki noktalarını inceleyin
- Belirli bir veri noktasının regresyon sonuçlarınızı önemli ölçüde değiştirip değiştirmediğini öğrenmek için Cook'un D, DFits veya DF Beta gibi istatistiklerini kontrol edin. Burada daha fazlasını bulabilirsiniz .
ve Düzeltilmiş istatistiklerindeki değişikliği inceleyinR 2R2R2
- Karelerin regresyon toplamının karelerin toplamına oranı olan , bağımlı değişkeninizdeki değişkenliğin% kaçının model tarafından açıklandığını söyleyebilir.R2
- Düzeltilmiş , ek öngörücüler (ler )im için getirilen fazladan karelerin gerçekten alacağı özgürlük derecesine değip değmediğini kontrol etmek için kullanılabilir.R2
Gerekli etkileşimi kontrol edin
- Ana bağımsız bir öngörücü varsa, bağımsız etkisinin herhangi bir yorumunu yapmadan önce, diğer bağımsız değişkenlerle etkileşime girip girmediğini kontrol edin. Etkileşim, ayarlanmadan bırakılırsa, tahmininizin yanlılığına neden olabilir.
Modelinizi başka bir veri kümesine uygulayın ve performansını kontrol edin
- Regresyon formülünü diğer ayrı verilere de uygulayabilir ve ne kadar iyi tahmin ettiğini görebilirsiniz. Dağılım grafiği gibi grafik ve gözlenen değerden% farkı gibi istatistikler iyi bir başlangıç olabilir.
r-squared
Etikete ve etikete bakmak isteyebilirsinizgoodness-of-fit
..