İlgi gerçek değerini ve bazı algoritmaları kullanarak olarak tahmin edilen değeri gösterelim .θθ^
Korelasyon size ve nin ne kadar ilişkili olduğunu söyler . ile arasında değerler verir , burada ilişki yoktur, çok güçlüdür, doğrusal ilişki ve ters doğrusal bir ilişkidir (yani, daha büyük değerleri veya daha küçük değerleri belirtir) tam tersi). Aşağıda resimli bir korelasyon örneği bulacaksınız.θθ^−1101−1θθ^
(kaynak: http://www.mathsisfun.com/data/correlation.html )
Ortalama mutlak hata:
MAE=1N∑i=1N|θ^i−θi|
Kök ortalama kare hatası :
RMSE=1N∑i=1N(θ^i−θi)2−−−−−−−−−−−−−−⎷
Göreceli mutlak hata :
RAE=∑Ni=1|θ^i−θi|∑Ni=1|θ¯¯¯−θi|
burada , ortalama bir değeridir .θ¯¯¯θ
Kök bağıl kare hatası:
RRSE=∑Ni=1(θ^i−θi)2∑Ni=1(θ¯¯¯−θi)2−−−−−−−−−−−−−−⎷
Gördüğünüz gibi, tüm istatistikler gerçek değerleri tahminleriyle karşılaştırır, ancak biraz farklı bir şekilde yapar. Hepsi size "ne kadar uzak" olduğunu, gerçek değerinden tahmini değerleriniz olduğunu söylüyor . Bazen kare kökler kullanılır ve bazen mutlak değerler - bunun nedeni kare kökleri kullanırken aşırı değerlerin sonuç üzerinde daha fazla etkiye sahip olmalarıdır (bkz . Standart sapmadaki veya Mathoverflow'ta mutlak değeri almak yerine farkı neden kare )?θ
In ve sadece bu iki değer arasındaki "ortalama farkın" bakmak - Eğer onları valiable ölçeği (yani karşılaştırarak yorumlamak böylece 1 noktasının bir olduğunu 1 noktasında farkı arasında ve ).MAERMSEMSEθθ^θ
Gelen ve Eğer varyasyonu ile bu farklılıkları bölmek de 0 'dan 0-100 benzerliği elde 100 ile bu değerin 1 ve çarpma eğer bir ölçek, böylece (yani yüzde ). Değerleri veya ortalama değerinden ne kadar farklı olduğunu size söyleyin - böylelikle kendisinden ne kadar farklı olduğunu söyleyebilirsiniz ( varyansa kıyasla ). Bu yüzden ölçüler "göreceli" olarak adlandırılır - bunlar ölçeğiyle ilgili sonuç verir .RAERRSEθ∑(θ¯¯¯−θi)2∑|θ¯¯¯−θi|θθθ
Ayrıca bu slaytları da kontrol edin .