Bunu basit terimlerle açıklamaya çalışacağım.
Regresyon modeli, bağımlı bir değişken ile bir dizi bağımsız değişken arasındaki ilişkiye odaklanır . Bağımlı değişken, bir veya daha fazla bağımsız değişken kullanarak tahmin etmeye çalıştığınız sonuçtur.
Bunun gibi bir modeliniz olduğunu varsayın:
Ağırlık_i = 3,0 + 35 * Yükseklik_i + ε
Şimdi açık olan sorulardan biri: bu model ne kadar iyi çalışıyor? Başka bir deyişle, ne kadar iyi yükseklik bir kişinin doğru tahmin - ya açıklıyor - kilo o kişinin?
Bu soruya cevap vermeden önce , insanların ağırlıklarında ne kadar dalgalanma gözlemlediğimizi anlamamız gerekir . Bu önemlidir, çünkü burada yapmaya çalıştığımız şey, farklı insanlar arasındaki ağırlıklardaki dalgalanmayı (varyasyonu) yüksekliklerini kullanarak açıklamaktır. İnsanların boyu kilodaki bu varyasyonu açıklayabiliyorsa, iyi bir modelimiz var.
Varyans o sayıların kümesi (kendi ortalama değerinden) dışarı yayılır ne kadar ölçer olarak, bu amaç için kullanılacak metrik bir iyidir.
Ne kadar varyans kişinin içinde: Bu bize özgün soruyu başka bir şekilde ifade yardımcı olur ağırlığı onun / onu açıklanabilir yüksekliği ?
“Açıklanan% varyans” buradan geliyor. Bu arada, regresyon analizi için, R-kare korelasyon katsayısına eşittir .
Yukarıdaki modeli biz böyle bir açıklama yapmak mümkün olabilir İçin: regresyon analizi kullanılarak, kullanarak bir tahmin modeli kurmak mümkündü yüksekliği açıklamak bir kişinin varyansın% 60 içinde ağırlık ”.
Şimdi,% 60 ne kadar iyi? Bu konuda nesnel bir yargıya varmak zor. Ancak başka rakip modelleriniz varsa (örneğin, bir kişinin kilosunu tahmin etmek için yaşını kullanan başka bir regresyon modeli), farklı modelleri kendileri tarafından ne kadar varyansın açıklandığına ve hangi modelin daha iyi olduğuna karar vermeye dayalı olarak karşılaştırabilirsiniz. (Bu konuda bazı uyarılar var, bkz. 'Regresyonu Yorumlama ve Kullanma' - Christopher H. Achen http://www.sagepub.in/books/Book450/authors )