Regresyon Modelinin Varyansını Açıklamak


13

Bu basit bir açıklama olabilir (yine de umuyorum).

Regresyon araç kutusunu kullanarak Matlab'da bazı regresyon analizleri yaptım. Ancak, bunu belirten bir çalışma ile karşılaştım:

"Regresyon analizi kullanılarak, varyansın% 60'ını açıklayan sadece dört sonik özellik kullanılarak bir öngörücü model oluşturmak mümkün oldu"

Makaleye link gerekirse: Makale

Bunun ne anlama geldiğinden% 100 emin değilim, ama bunun basit bir şey olmasını umuyorum. Ayrıca% 60 iyi bir şey mi? Ben bunu aramaya çalıştım ama her zaman 'varyans' kelimesinden önce bir yüzde olduğundan, cevap bulmak zor.

Yanıtlar:


9

Bunu basit terimlerle açıklamaya çalışacağım.

Regresyon modeli, bağımlı bir değişken ile bir dizi bağımsız değişken arasındaki ilişkiye odaklanır . Bağımlı değişken, bir veya daha fazla bağımsız değişken kullanarak tahmin etmeye çalıştığınız sonuçtur.

Bunun gibi bir modeliniz olduğunu varsayın:

Ağırlık_i = 3,0 + 35 * Yükseklik_i + ε

Şimdi açık olan sorulardan biri: bu model ne kadar iyi çalışıyor? Başka bir deyişle, ne kadar iyi yükseklik bir kişinin doğru tahmin - ya açıklıyor - kilo o kişinin?

Bu soruya cevap vermeden önce , insanların ağırlıklarında ne kadar dalgalanma gözlemlediğimizi anlamamız gerekir . Bu önemlidir, çünkü burada yapmaya çalıştığımız şey, farklı insanlar arasındaki ağırlıklardaki dalgalanmayı (varyasyonu) yüksekliklerini kullanarak açıklamaktır. İnsanların boyu kilodaki bu varyasyonu açıklayabiliyorsa, iyi bir modelimiz var.

Varyans o sayıların kümesi (kendi ortalama değerinden) dışarı yayılır ne kadar ölçer olarak, bu amaç için kullanılacak metrik bir iyidir.

Ne kadar varyans kişinin içinde: Bu bize özgün soruyu başka bir şekilde ifade yardımcı olur ağırlığı onun / onu açıklanabilir yüksekliği ?

“Açıklanan% varyans” buradan geliyor. Bu arada, regresyon analizi için, R-kare korelasyon katsayısına eşittir .

Yukarıdaki modeli biz böyle bir açıklama yapmak mümkün olabilir İçin: regresyon analizi kullanılarak, kullanarak bir tahmin modeli kurmak mümkündü yüksekliği açıklamak bir kişinin varyansın% 60 içinde ağırlık ”.

Şimdi,% 60 ne kadar iyi? Bu konuda nesnel bir yargıya varmak zor. Ancak başka rakip modelleriniz varsa (örneğin, bir kişinin kilosunu tahmin etmek için yaşını kullanan başka bir regresyon modeli), farklı modelleri kendileri tarafından ne kadar varyansın açıklandığına ve hangi modelin daha iyi olduğuna karar vermeye dayalı olarak karşılaştırabilirsiniz. (Bu konuda bazı uyarılar var, bkz. 'Regresyonu Yorumlama ve Kullanma' - Christopher H. Achen http://www.sagepub.in/books/Book450/authors )


1
Bu kesinlikle sorumun büyük bir kısmını yanıtladı. Yazarların bunu neden büyük öneme sahip olduğunu söyledikleri açısından bilmiyorum. Yani, bu R-kare değeri ise ve örneğinize geri dönersek:% 80 varyansa sahip 'yaş' için bir model kullandığımızı ve 85 varyansa sahip 'yükseklik' için model kullandığımızı varsayalım Bir kişinin kilosunu tahmin etmek için, ikinci modelin daha anlamlı olacağını düşünürüm? Kitap bağlantısı için teşekkürler, önümüzdeki gece regresyon kullanacağım için dün gece satın aldım.
user1574598

1
Evet, ikinci modelin bir kişinin kilosunu, ceteris paribus ağırlığını tahmin etme (veya açıklama) yeteneğinde daha iyi olduğu sonucuna varabilirsiniz. BTW, bunu "modelin% ​​80'lik bir varyansa sahip" olduğunu söylediniz, ancak "model varyansın% 80'ini açıklıyor" olmalıdır.
Vishal

4

R,2

Σben=1n(y^ben-y¯)2Σben=1n(yben-y¯)2

ybeny^benbeninciy¯R,2

Σben=1n(yben-y¯)2=Σben=1n(y^ben-y¯)2+Σben=1n(yben-y^ben)2,

R,2

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.