Ortalama mutlak hata VEYA kök ortalama kare hatası?


58

Neden Ortalama Mutlak Hata (MAE) yerine Kök Ortalama Karesi Hatası (RMSE) kullanılır?

Selam

Hesaplamada oluşan hatayı araştırıyorum - İlk başta hatayı Ortalama Ortalama Karelenmiş Hata Hatası olarak hesapladım.

Biraz daha yakından bakıldığında, hata karelerinin etkisinin, küçük hatalardan daha büyük hatalara daha fazla ağırlık verdiğini ve hata tahminini garip aykırı yönüne doğru çarptığını görüyorum. Bu geçmişe bakıldığında oldukça açık.

Öyleyse benim sorum - hangi örnekte Kök Ortalama Karesel Hata, Ortalama Mutlak Hatadan daha uygun bir hata ölçüsü olur? İkincisi bana daha uygun görünüyor veya bir şey eksik mi?

Bunu göstermek için aşağıda bir örnek verdim:

  • Dağılım grafiği, iyi korelasyonlu iki değişken gösterir,

  • Sağdaki grafikteki iki histogram, normalize RMSE (üst) ve MAE (alt) kullanarak Y (gözlenen) ve Y (öngörülen) arasındaki hatayı gösterir.

görüntü tanımını buraya girin

Bu verilerde önemli aykırı değerler yoktur ve MAE, RMSE'den daha düşük bir hata verir. MAE dışında bir hata ölçüsü kullanmak için tercih edilebilecek herhangi bir rasyonel var mı?


9
RMSE ve MAE iki farklı hata ölçüsü olduğundan, aralarındaki sayısal bir karşılaştırma (MAE'nin RMSE'den "düşük" olduğunu iddia etmede rol oynar) anlamlı görünmüyor. Bu çizgi bir kritere göre uygun olmalıdır: bu kriter, ne olursa olsun, ilgili hata ölçüsü olmalıdır.
whuber

çizgi en küçük kareler kullanılarak yerleştirildi - ancak resim ölçülen hatadaki farkı göstermek için sadece bir örnek. Asıl meselem, azalan hata, MAE veya RMSE'nin bir ölçüsüne göre dört fonksiyon parametresini çözmek için bir optimizasyon cihazı kullanmak.
user1665220

Açıklama için teşekkür ederim. Ama tam olarak hangi hatayla ilgileniyorsunuz? Hata fit veya hatalar parametre tahminleri ?
whuber

1
Uygun olan hata. Bir işlevi kullanarak tahmin etmek istediğim, y veren bazı laboratuar örneklerine sahibim. Gözlemlenen ve öngörülen veriler arasındaki uyum hatasını en aza indirerek işlevi 4 üs için optimize ediyorum.
user1665220

RMSE'de, öğelerin sayısının (n) kökü olduğunu düşünüyoruz. Bu MSE'nin kökü, n'nin köküdür. MSE'nin kökü tamamdır, fakat n'ye bölmek yerine RMSE'yi almak için n'nin kökü ile bölünür. Bunun bir politika olacağını hissediyorum. Gerçeklik (MSE Kökü) / n olacaktır. Bu şekilde MAE daha iyidir.

Yanıtlar:


57

Bu, kayıp fonksiyonunuza bağlıdır. Pek çok durumda, ortalamanın uzağındaki noktalara daha fazla ağırlık vermek mantıklıdır; yani, 10'la çıkmak, 5'le olandan iki kat daha kötüdür. Bu gibi durumlarda, RMSE daha uygun bir hata ölçüsüdür.

Eğer 10'a kadar kapalı olmak, 5'e göre sadece iki kat daha kötü ise, MAE daha uygundur.

Her durumda, RMSE ve MAE'yi birbirinizle olan son cümleinizde olduğu gibi karşılaştırmak anlamsızdır ("MAE, RMSE'den daha düşük bir hata verir"). MAE, hesaplandıkları için hiçbir zaman RMSE'den daha yüksek olmayacaktır. Yalnızca aynı hata ölçüsü ile karşılaştırıldığında anlamlıdır: Yöntem 1 için RMSE'yi Yöntem 2 için RMSE'yi veya Yöntem 2 için MAE'yi Yöntem 2 için MAE'yi karşılaştırabilirsiniz, ancak MAE'nin Yöntem için RMSE'den daha iyi olduğunu söyleyemezsiniz 1 çünkü daha küçük.


MAE'nin asla RMSE'den daha yüksek olmayacağını biliyorum. Her iki hata tahminini kullanıyorum ve aykırı değerlerin etkisine dair bir gösterge vermek için değerler arasındaki farka bakıyorum. Yani, çok yakın olduklarında, daha fazla ayrıldıklarında, neler olup bittiğini görmek için araştırma yaparım. Sonuçta verilere en uygun parametreleri tahmin etmek istiyorum ve örneğin% 9'luk hata sesi% 12'den daha iyi - sadece doğru sebepten doğru olanı seçtiğimden emin olmak istedim. Tavsiyeniz için Şerefe
user1665220

RMSE (sonuç olarak MSE) ve MAE arasındaki temel fark, hataları nasıl tarttıkları ile ilgili değildir. Gerekirse bir ağırlık işlevi kullanabilirsiniz. Ana fark, MSE'nin L2 Space ile ilişkili olmasıdır (MAE'de böyle bir şey yoktur). Örneğin, E, geri besleme sinyali olduğunda kapalı bir döngü kontrolü için ihtiyaç duyulan enerji miktarını ölçebilir (Bir sinyalin Ortalama Karesini Hatırla, Bu durumda Hata, enerjisiyle orantılıdır). Ayrıca matematik ve dolayısıyla Marquardt-Levenberg gibi algoritmalar da bu alanda çalışır. basitçe söylemek gerekirse, MSE'yi amaç işlevleri olarak kullanırlar.
eulerleibniz

17

MAE yerine (R) MSE kullanmak istediğinizde başka bir durum var: gözlemlerinizin koşullu dağılımı asimetrik olduğunda ve tarafsız bir uyum istediğinizde. (R) MSE koşullu ortalama ile , MAE şartlı ortanca ile en aza indirgenir . Yani MAE'yi en aza indirirseniz, uyum medyanlara daha yakın ve önyargılı olacaktır.

Tabii ki, tüm bunlar gerçekten kayıp fonksiyonuna bağlı.

Tahminleri veya tahminleri değerlendirmek için MAE veya (R) MSE kullanıyorsanız, aynı sorun ortaya çıkar . Örneğin, düşük hacimli satış verileri tipik olarak asimetrik bir dağılıma sahiptir. MAE'yi optimize ederseniz, MAE-optimal tahmininin düz sıfırlı bir tahmin olduğunu görünce şaşırabilirsiniz.

İşte bunu kapsayan küçük bir sunum ve işte bu etkiyi açıkladığım M4 tahmin yarışması için davet edilen bir yorum .


+1. Dağılımları karşılaştırma fikri harika ama ... sunduğunuz gibi bir metrik gibi bir şeyde sefilce başarısız olmaz N = 1e3; set.seed(1); y = rpois(N, lambda=1); yhat = c(y[2:N],0)mıydı? Tahmini yoğunluklar "fark" minimal olacaktır, ancak gerçek yhatfaydasız olacaktır. Verilmiş, bu aşırı bir durumdur. (Önceden bunun için belirgin bir şey, özürlerini eksik olabilir - Gazeteden sadece sunum erişimi yok.)
usεr11852 eski haline Monic diyor

y^=1

Açıklamalar için çok teşekkür ederim; Sunumu şimdi daha iyi kavramsallaştırabilirim. (Hmm ... Sonuçta makaleni almam gerek. :))
usεr11852 diyor Reinstate Monic,

@ usεr11852: e-posta yoluyla benimle temas kurmaktan çekinmeyin ( adresi burada bulabilirsiniz ) - postanız spam filtresimin içine girmezse, size o kağıdı gönderirim.
S. Kolassa - Monica,

@ usεr11852 "N = gibi" ifadesinden sonra seni tamamen kaybettim.
sak

5

görüntü tanımını buraya girin

RMSE, Öklid mesafesindeki kaybı tanımlamanın daha doğal bir yoludur. Bu nedenle, onu 3B olarak grafiklendirirseniz, kayıp, yukarıda yeşil gördüğünüz gibi koni şeklindedir. Bu aynı zamanda daha yüksek boyutlar için de geçerlidir, ancak görselleştirilmesi daha zordur.

MAE şehir-blok mesafesi olarak düşünülebilir. Bu grafikte mavi olarak gördüğünüz gibi, kaybı ölçmenin bir yolu değildir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.