Kök ortalama kare hatası (RMSE) ve standart sapma nasıl yorumlanır?


21

Diyelim ki bana öngörülen değerleri veren bir modelim var. Bu değerlerin RMSE'sini hesaplıyorum. Ve sonra gerçek değerlerin standart sapması.

Bu iki değeri (varyanslar) karşılaştırmak anlamlı mı? Bence, eğer RMSE ve standart sapma benzer / aynı ise modelimin hatası / sapması gerçekte olanla aynıdır. Ancak bu değerleri karşılaştırmak mantıklı değilse, bu sonuç yanlış olabilir. Eğer düşüncem doğruysa, bu modelin varyansa neden olan şeyi atfedemeyeceği için olabildiğince iyi olduğu anlamına mı geliyor? Bence son bölüm muhtemelen yanlış ya da en azından cevap vermek için daha fazla bilgiye ihtiyaç duyuyor.

Yanıtlar:


22

En tepkilerimiz olduğunu varsayalım ve öngörülen değerler y 1 , ... , y n .y1,...,yny^1,...,y^n

(Kullanarak örnek varyans yerine n - 1 basitlik için) olduğu 1nn-1MSE1iken n n i = 1 (yi- ˉ y )21nΣben=1n(yben-y¯)2. Bu nedenle, örnek varyans cevapların ortalama etrafında ne kadar değiştiğini verirken, MSE cevapların tahminlerimiz etrafında ne kadar değiştiğini verir. Biz genel ortalama düşünürseniz ˉ y biz hiç dikkate alacağını bu en basit belirleyicisi olarak, daha sonra tepkilerin örnek varyans için MSE karşılaştırarak bizler modeli ile izah ettik ne kadar fazla varyasyon görebilirsiniz. Bu tam olarak neR2değeri lineer regresyon yapar.1nΣben=1n(yben-y^ben)2y¯R,2

Aşağıdaki resmi göz önünde bulundurun: örnek sapması , yatay çizgi etrafındaki değişkenliktir. Tüm verileri Y eksenine yansıtırsak, bunu görebiliriz. MSE regresyon çizgisine ortalama kare uzaklık, gerileme çizgilerinin çevresinde, yani değişkenliği (yani y i ). Dolayısıyla, örnek varyans tarafından ölçülen değişkenlik, görebildiğimiz yatay çizgiye olan ortalama kare mesafedir, regresyon çizgisine ortalama kare mesafeden önemli ölçüde daha fazladır. ybenYy^benresim açıklamasını buraya girin


5

Σben(yben-y^ben)2n-p,
tahmin için ) parametrenin tahmin edildiğine , yani, serbestlik derecesinin kaybı (DF).

Σben(yben-y¯)2n-1,
y¯yben .

y^ben=y¯y¯

y^ben

Σben(yben-y^ben)2n,

hesaplaması en kolay olanıdır.


@Chaconne'nin cevabı hakkında yorum yapma ayrıcalığım yok, ancak son ifadesinde bir yazım hatası varsa şüphe ediyorum: "Örnek varyans tarafından ölçülen değişkenlik, yatay çizgiye göre ortalama kare mesafedir. bkz. çizgiye ortalama kare mesafeden önemli ölçüde daha azdır ". Ancak cevabındaki şekilde, y değerlerinin çizgi ile tahmini oldukça doğrudur, yani MSE küçüktür, en azından ortalama bir değere sahip "tahminden" daha iyidir.
Xiao-Feng Li

3

1nΣben=1n(yben-y¯)2çünkü hedef değişken normal olarak dağıtıldığında SD, çan şeklinde (Gauss) bir dağıtım yapma özelliğine sahiptir. Dolayısıyla, SD, hedef değişkenin tahminlerinde doğal olarak oluşan hata miktarı olarak düşünülebilir. Bu, onu herhangi bir modelin yenmek için denemesi gereken kriter haline getirir.

Bir model tahmininin hatasını ölçmenin çeşitli yolları vardır ; aralarında bahsettiğiniz Kök Ortalama Kare Hatası (RMSE) ,1nΣben=1n(yben-y^ben)2, en popüler olanlardan biridir. Kavramsal olarak SD'ye oldukça benzer: gerçek bir değerin ortalamadan ne kadar uzakta olduğunu ölçmek yerine, gerçek bir değerin modelin bu değer için öngörüsünden ne kadar uzakta olduğunu ölçmek için temel olarak aynı formülü kullanır. İyi bir model, ortalama olarak, tüm tahminler için ortalamanın naif tahmininden daha iyi tahminlere sahip olmalıdır. Bu nedenle, varyasyonun ölçüsü (RMSE), rasgeleliği SD'den daha iyi azaltmalıdır.

Bu argüman sadece RMSE için değil, diğer hata ölçümleri için de geçerlidir, ancak RMSE özellikle SD ile doğrudan karşılaştırma için caziptir çünkü matematiksel formülleri benzerdir.


Bu en iyi cevaptır, çünkü karşılaştırmanın sadece farklılıkları tanımlamak yerine nasıl yararlı olabileceğini açıklar.
Hans
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.