Yanıtlar:
Doğrusal regresyon aslında sonucunuzun koşullu beklenen değerlerini modeller. Bunun anlamı: Eğer regresyon parametrelerinin gerçek değerlerini bilse (söylemek ve denklemi o out doldurarak, sizin belirleyicisi X değeri göz önüne alındığında,) olacak için verilen bu değere sahip tüm (olası) gözlemlerde için beklenen değeri hesaplarsanız .
Ancak , verilen değeri için tek bir değerinin (koşullu) ortalamaya tam olarak eşit olmasını beklemezsiniz . Modeliniz yanlış olduğu için değil, hesaba katmadığınız bazı etkiler olduğu için (örneğin ölçüm hatası). Dolayısıyla , belirli bir değerleri için bu değerleri ortalama değerin etrafında dalgalanır (yani geometrik olarak: o için regresyon çizgisinin noktası etrafında ).
Normallik varsayımı, şimdi, arasındaki fark söylüyor ler ve bunların eşleme sıfır ortalamalı normal dağıtılması esasına dayanmaktadır. Bir varsa, bu araçlar, değeri, daha sonra bir örnek olabilir birinci hesaplama değerini (yani, tekrar , bir sonraki numune regresyon doğrusu üzerindeki nokta,) bundan normal dağılım ve ekleme:
Kısacası: Bu normal dağılım , modelin açıkladığı değişkenliğin üstünde sonucunuzdaki değişkenliği temsil eder .
Not: Çoğu veri kümesinde, belirli bir için birden fazla değeriniz yoktur (tahmin kümeniz kategorik olmadıkça), ancak bu normallik sadece veri kümenizdeki gözlemler için değil, tüm popülasyon için geçerlidir.
Not: Doğrusal regresyonun nedenini bir öngörücü ile yaptım, ama aynı şey daha fazlası için de geçerli: sadece yukarıdaki "line" i "hyperplane" ile değiştirin.
Çok şey ifade edebilir ya da hiçbir şey ifade etmeyebilir. En yüksek R-Kare'yi elde etmek için bir model takarsanız, aptal olduğunuz anlamına gelebilir. Bir modeli, değişkenlerin gerekli ve ihtiyaç duyulduğu ve aykırı değerlerin tanımlanmasına özen gösterdiği için cimri olacak şekilde yerleştirirseniz, iyi bir iş yaptınız. Bu http://www.autobox.com/cms/index.php?option=com_content&view=article&id=175 hakkında daha fazla bilgi için buraya göz atın.
Kalıntıların normalliği, doğrusal bir modelin çalıştırıldığı varsayımıdır. Dolayısıyla, artıklarınız normalse, varsayımınızın geçerli olduğu ve model çıkarımının (güven aralıkları, model tahminleri) de geçerli olduğu anlamına gelir. Bu kadar basit!