RMSE'den olasılık hesaplanıyor


13

Ben birkaç parametre ile bir yörünge (zamanın bir fonksiyonu olarak x) tahmin etmek için bir model var. Şu anda, tahmin edilen yörünge ve deneysel olarak kaydedilen yörünge arasındaki kök ortalama kare hatasını (RMSE) hesaplıyorum. Şu anda, simpleks (matlab'da fminsearch) kullanarak bu farkı (RMSE) en aza indiriyorum. Bu yöntem iyi uyum sağlamak için çalışırken, birkaç farklı modeli karşılaştırmak istiyorum, bu yüzden RMSE'yi en aza indirmek yerine maksimum olasılık tahminini kullanabilmem için olasılığı hesaplamam gerekiyor (ve daha sonra AIC veya BIC kullanarak modelleri karşılaştırmam gerekiyor) ). Bunu yapmanın standart bir yolu var mı?

Yanıtlar:


20

Kök ortalama kare hatası ve olasılık aslında yakından ilişkilidir. Diyelim ki {xi,zi} çifti veri kümeniz var ve ilişkilerini f modelini kullanarak modellemek istiyorsunuz f. İkinci dereceden hatayı en aza indirmeye karar verdiniz

i(f(xi)zi)2

Bu seçim tamamen keyfi değil mi? Tabii, tamamen yanlış olan tahminleri tamamen doğru olanlardan daha fazla cezalandırmak istiyorsunuz. Ancak kare hatası kullanmak için çok iyi bir neden var.

Gauss yoğunluğunu unutmayın: ; burada , şimdilik umursadığımız normalleştirme sabiti. Hedef verileriniz Gauss'a göre dağıtıldığını varsayalım . Böylece verilerin olasılığını yazabiliriz.1Zexp(xμ)22σ2Zz

L=i1Zexp(f(xi)zi)22σ2

Şimdi bunun logaritmasını alırsan ...

logL=i(f(xi)zi)22σ2logZ

... rms ile çok yakından ilişkili olduğu ortaya çıktı: tek farklar bazı sabit terimler, bir kare kök ve çarpmadır.

Uzun lafın kısası: Kök ortalama kare hatasını en aza indirmek, verilerin günlük olasılığını en üst düzeye çıkarmakla eşdeğerdir.


Açık açıklama için teşekkürler. BIC kullanarak iki (gömülü olmayan) modeli karşılaştırmak istersem, olasılığı hesaplarken sadece sigma ^ 2 ve Z terimlerini (etkili bir şekilde modellerin aynı olduğunu varsayarak) düşürebilir miyim?
Jason

Evet. Her iki terim sadece bağlıdır , bu nedenle her iki eşitse bunları bırakabilirsiniz . σσ
bayerj

1
Yukarıdaki son adımda bir hata olduğunu düşünüyorum (olabilirlik günlüğü alarak), şöyle olmalıdır: Günlük olasılığı RMSE ile doğrusal olarak ilişkili olduğu için bu "alt çizgiyi" değiştirmez, bu nedenle RMSE'yi en aza indirmek günlük olasılığını en aza indirmeye eşdeğerdir
logL=i(f(xi)zi)22σ2logZ
Jason

2
Gauss dağılımında negatif bir işaret var mı?
Manoj

1
Sonuç tam tersi olmamalı mı? Kareli hataların toplamının en aza indirilmesi, log olasılığını maksimuma çıkarır (sabit bir ) ve böylece olasılığı maksimuma çıkarır (log monotonik olduğundan). σ
Tim Goodman
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.