“Belirleme katsayısı” ile “ortalama kare hatası” arasındaki fark nedir?


32

Regresyon sorunu için, insanların model seçimini yapmak için "tayin katsayısı" (aka R kare) kullandığını gördüm, örneğin, normalleştirme için uygun ceza katsayısını bulmak.

Bununla birlikte, regresyon doğruluğunun bir ölçüsü olarak "ortalama kare hatası" veya "kök ortalama kare hatası" kullanımı da yaygındır.

Peki bu ikisi arasındaki temel fark nedir? "Düzenleme" ve "regresyon" görevleri için birbirlerinin yerine kullanılabilir mi? Ve makine öğrenimi, veri madenciliği görevleri gibi pratikte her birinin temel kullanımı nelerdir?

Yanıtlar:


40

,SSE(regresyon çizgisinden artıkları veya sapmalar) karesel hata toplamıdır veen bağımlı gelen kare sapmaların toplamıdırortalama.R2=1SSESSTSSESSTY

MSE=SSEnm , ki burada örnek büyüklüğüdür ve modeldeki parametre sayısıdır (varsa, kesişme dahil).nm

R2 , numunede öngörülen veya öngörülen derecenin standart bir ölçüsüdür. , artıkların popülasyondaki veya uyumsuzluklarındaki varyansın tahminidir. İki ölçüm, düzeltilmiş ( popülasyon için tahmini) için en yaygın formülde görüldüğü gibi açıkça ilişkilidir :MSE R2R2

Radj2=1(1R2)n1nm=1SSE/(nm)SST/(n1)=1MSEσy2.


2
I thought MSE is the avg of the errors, which means MSE = SSE/n, on what occasions do we use MSE=SSE/(n-m)? Please explain. Thanks
Sincole Brans

@SincoleBrans Please see en.wikipedia.org/wiki/Mean_squared_error, section "Regression".
ttnphns

I'm a bit confused. The results in martin-thoma.com/regression show that a model can be good (compared to some other models) with R^2, but at the same time bad with MSE. Could you explain that?
Martin Thoma
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.