Neden bir diğerinin (örneğin MSE) aksine belirli bir tahmin hatası ölçüsü (örneğin MAD) kullanıyorsunuz?


15

MAD = Ortalama Mutlak Sapma MSE = Ortalama Kare Hata

Ben MSE bazı istenmeyen nitelikleri rağmen kullanıldığını çeşitli yerlerden önerileri gördüğüm (örn http://www.stat.nus.edu.sg/~staxyc/T12.pdf , p8 üzerinde devletler hangi "O mad genel olarak inanılmaktadır MSE'den daha iyi bir ölçüttür. Bununla birlikte, matematiksel olarak MSE MAD'den daha uygundur. ")

Bundan daha fazlası var mı? Tahmin hatasını ölçmenin çeşitli yöntemlerinin daha az / az uygun olduğu durumları ayrıntılı olarak analiz eden bir makale var mı? Google aramalarım hiçbir şey göstermedi.

Buna benzer bir soru /programming/13391376/how-to-decide-the-forecasting-method-from-the-me-mad-mse-sde adresinde soruldu ve kullanıcıdan 15.01.2018


2
MAD tipik olarak Ortalama yerine Medyan Mutlak Sapmadır, değil mi?
Brian D

@BrianD: Daha geniş istatistik topluluğunda haklısınız. Daha dar tahmin topluluğunda, "MAD" her zaman "ortalama mutlak sapma", AKA MAE'dir .
Stephan Kolassa

Yanıtlar:


23

Hangi nokta tahmini hata ölçüsünün kullanılacağına karar vermek için geri adım atmamız gerekiyor. Gelecekteki sonucu mükemmel bir şekilde bilmediğimizi ve hiçbir zaman bilmeyeceğimizi unutmayın. Gelecekteki sonuç bir olasılık dağılımını izliyor . Bazı tahmin yöntemleri bu tür bir tam dağıtımın çıktısını açıkça verirken, bazıları vermez - ama sadece örtük olarak her zaman oradadır.

Şimdi, bir nokta tahmini için iyi bir hata ölçüsü almak istiyoruz . Tahmin Böyle bir nokta Ft biz zaman gelecekteki dağılımı (yani öngörü dağılımı) hakkında bildiklerimizi özetlemek bizim girişimi t tek bir sayı, bir sözde kullanarak işlevsel gelecek yoğunluğunun. Hata ölçüsü, bu tek sayı özetinin kalitesini değerlendirmenin bir yoludur.

Bu nedenle, gelecekteki yoğunlukların (bilinmeyen, muhtemelen tahmin edilen, ancak muhtemelen üstü kapalı) bir sayı özetini "iyi" olarak ödüllendiren bir hata ölçüsü seçmelisiniz.

Buradaki zorluk, farklı hata ölçümlerinin farklı işlevler tarafından en aza indirilmesidir. Beklenen MSE, gelecekteki dağılımın beklenen değeri ile en aza indirilir . Beklenen MAD, gelecekteki dağılımın medyanı tarafından en aza indirilmiştir . Bu nedenle, MAE'yi en aza indirmek için tahminlerinizi kalibre ederseniz, nokta tahmininiz gelecekteki beklenen değer değil, gelecekteki medyan olacaktır ve gelecekteki dağılımınız simetrik değilse tahminleriniz taraflı olacaktır.

Bu, genellikle eğri olan sayım verileri için en uygunudur. Aşırı durumlarda (örneğin, Poisson, satışları log20.69 altında bir ortalamaya dağıttı ), MAE'niz sabit sıfır tahmini için en düşük olacaktır. Ayrıntılar için buraya veya buraya veya buraya bakın.

Biraz daha bilgi ve bir resme vermek Ortalama Mutlak Yüzde Hata (MAPE) eksiklikleri nelerdir? Bu iş parçacığı ve diğer hata ölçülerini de dikkate alır ve diğer ilgili iş parçacıklarına bağlantılar içerir.


Sonunda, hangi hata ölçüsünün kullanılacağı gerçekten Tahmin Maliyetinize, yani hangi hatanın en acı verici olduğuna bağlıdır. Tahmin hatalarının gerçek sonuçlarına bakmadan, "daha iyi kriterler" hakkında herhangi bir tartışma temel olarak anlamsızdır.

Tahmin doğruluğu ölçütleri, birkaç yıl önce tahmin topluluğunda büyük bir konuydu ve ara sıra hala ortaya çıkıyorlar. Bakmak için çok iyi bir makale Hyndman & Koehler "Tahmin doğruluğu ölçümlerine bir başka bakış" (2006).

Son olarak, bir alternatif tam tahmin yoğunluklarını hesaplamak ve bunları uygun kullanarak değerlendirmektir .


Yanıt ve bağlantı için teşekkürler. "Tahmin Maliyeti Hatası" terimini bilmiyordum. Bir işletmenin (örneğin) bir işletmenin kaç tane widget satacağını öngördüğü ve belki de fazla tahmin etmek için maruz kaldıkları ağrının, az tahmin etmek için acı çektiğinden iki kat fazla olduğu durumlarla ilgili gibi görünüyor. Bununla birlikte, çoğunlukla , sıradan insanların tahmin edilebilir bir maliyet tahmini hatası olmadan tahminlerde bulundukları bir bağlam düşünüyorum (örneğin, "Bill Gates'in önümüzdeki 5 ay içinde kaç tane tweet yapacak?"). Böyle bir durumda hata ölçümü seçimim keyfi olacak mı?
user1205901 - Monica

3
Tahmin Maliyeti Hatası, pratisyen odaklı Foresight dergisinde tartışılmıştır : tahminler.org/foresight Çok tavsiye edilir! (Tam açıklama: Yardımcı editörüm.) CoFE'nin örneğinizde kolayca görülmediğini kabul ediyorum, ancak sonra hata
ölçünüzü

4

MSE yerine MAE kullanmanın avantajları Davydenko ve Fildes (2016) ' da açıklanmıştır , bakınız Bölüm 3.1:

... Bazı yazarlar (örneğin, Zellner, 1986) tahminleri değerlendirdiğimiz ölçütün tahminleri optimize ettiğimiz ölçütle aynı olması gerektiğini savunuyorlar. Başka bir deyişle, tahminleri belirli bir kayıp fonksiyonunu kullanarak optimize edersek, hangi modelin daha iyi olduğunu bulmak için ampirik değerlendirme için aynı kayıp fonksiyonunu kullanmalıyız.

İstatistiksel bir modelin yerleştirilmesi genellikle ikinci dereceden kayıp altında optimal tahminler verir. Bu, örneğin, doğrusal bir regresyona uyduğumuzda olur. İstatistiksel modellemeden yoğunluk tahminimiz simetrik ise, ikinci dereceden kayıp altında optimal tahminler doğrusal kayıp altında da optimal olur. Ancak, varyansı log dönüşümleri ile stabilize edersek ve tahminleri üs ile geri dönüştürürsek, tahminleri optimum olarak sadece doğrusal kayıp altında alırız. Başka bir kayıp kullanırsak, öncelikle istatistiksel bir model kullanarak yoğunluk tahminini elde etmeli ve daha sonra spesifik kayıp fonksiyonumuza göre tahminlerimizi ayarlamalıyız (bunu Goodwin, 2000'de yapma örneklerine bakınız).

Diyelim ki iki yöntemi ampirik olarak karşılaştırmak ve simetrik doğrusal kayıp açısından hangi yöntemin daha iyi olduğunu bulmak istiyoruz (çünkü bu tür kayıplar modellemede yaygın olarak kullanılmaktadır). Sadece bir zaman serimiz varsa, ortalama bir mutlak hata (MAE) kullanmak doğal görünmektedir. Ayrıca, MAE anlaşılması ve hesaplanması basit olduğu için caziptir (Hyndman, 2006) ...

Referanslar

Davydenko, A. ve Fildes, R. (2016). Tahmin Hata Önlemleri: Eleştirel İnceleme ve Pratik Öneriler. In Business Öngörü: Pratik Sorunlar ve Çözümler. John Wiley ve Oğulları


Makaleye sadece "Davydenko ve Fildes, 2016" yerine tam bir alıntı yapabilir misiniz ?
Silverfish

Yanıtlarımızın bağımsız olmasını seviyoruz, böylece bağlantı kopan bağlantılardan olumsuz etkilenmiyorlar. İçeriğinin bu soru ile ilgili temel noktaları olduğunu düşündüğünüzü özetlemek için cevabınızı biraz genişletebileceğinizi düşünüyor musunuz? Aksi takdirde, bu bir yorum için bir cevaptan çok daha uygundur. (Henüz yorum göndermek için yeterli üne sahip olmadığınızı takdir ediyorum, ancak sizin için bir tanesine dönüştürebiliriz.)
Silverfish

1
Cevabın için teşekkürler! İşte (Davydenko ve Fildes, 2016) şöyle diyor: İstatistiksel bir modelin takılması genellikle kuadratik kayıp altında optimum tahminler sunar. Bu, örneğin, doğrusal bir regresyona uyduğumuzda olur. İstatistiksel modellemeden yoğunluk tahminimiz simetrik ise, ikinci dereceden kayıp altında optimal tahminler doğrusal kayıp altında da optimal olur. Ancak, varyansı log dönüşümleri ile stabilize edersek ve tahminleri üs ile geri dönüştürürsek, tahminleri optimum olarak sadece doğrusal kayıp altında alırız.
Turbofly

1
Teşekkürler! Bu bilgiyi cevabınızda düzenleyebilirsiniz ("düzenle" düğmesi yayınınızın altındadır).
Silverfish

Çok teşekkürler. Bazı biçimlendirme yaptım ve tam bir alıntı yaptım.
Silverfish

3

RMSE=MSEMAE=MAD

Aslında,

MAERMSEnMAE

  • e
    RMSE=1nei2=1nne2=e=MAE
  • üst sınır: tek bir vaka hatası e
    MAE=en
    RMSE=1nei2=1ne2=1n(nMAE)2=nMAE

MAERMSEMAEyiy^i[0,1]

  • ei1
    MbirE=nwrÖngn
    R,MSE=1nΣeben2=1nnwrÖng=MbirE
    (Bu üst sınır tamsayısı için oluşurnwrÖng, kısmi / kesirli sınıf üyeliği ve dolayısıyla eben[0,1], işler biraz daha karmaşıklaşır, çünkü olası maksimum hatanın 1'den az olabileceğini ve "artık" olabileceğinizi dikkate almanız gerekir. eben<1 her ikisi de üst sınırı biraz daha aşağı indirir.)

RMSE MAE'ye yakınsa, birçok küçük sapmaya sahipsiniz, eğer üst sınırına yakınsa, çok az yanlış tahmin vardır.


üst sınır olarak sqrt (n) * MAE veya sqrt (n * MAE) demek istediniz?
Chris

1
@Chris: sqrt (n) * MAE, benim düzenlememe bakın.
cbeleites Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.