Sen yok olması için. Kayıp işlevi, dahil edip veya onu bastırmanız için aynı asgari seviyeye sahiptir . Yine de eklerseniz, veri noktası başına ortalama hatayı en aza indirmenin (bir buçuk) güzel bir yorumunu elde edersiniz . Başka bir deyişle, toplam hata yerine hata oranını en aza indirirsiniz .1m
Performansı, farklı boyutlarda iki veri kümesinde karşılaştırmayı düşünün. Kare hataların ham toplamı doğrudan karşılaştırılamaz, çünkü daha büyük veri setleri sadece boyutlarından dolayı daha fazla toplam hata yapma eğilimindedir. Öte yandan, veri noktası başına ortalama hata .
Biraz detaylandırabilir misin?
Emin. Veri veri noktalarının bir koleksiyonudur . modeline sahip olduğunuzda , tek bir veri noktasındaki en küçük kareler hatası:s s{ xben, yben}hh
( h ( xben) - yben)2
bu, elbette, her veri noktası için farklıdır. Şimdi, eğer hataları basitçe özetlersek (ve tanımladığınız nedenle yarıya kadar çarparsak) toplam hatayı alırız
12Σben( h ( xben) - yben)2
fakat eğer summan sayısına bölünürsek, veri noktası başına ortalama hata elde ederiz.
12 mΣben( h ( xben) - yben)2
Ortalama hata FAYDASIDA varsa yani iki veri setlerini ve ait boyutlarını differeing , o zaman ortalama hataları ancak toplam hatalar karşılaştırabilirsiniz. İkinci veri seti, örneğin, ilk boyutun on katı ise, aynı hata için toplam hatanın yaklaşık on kat daha büyük olmasını bekleriz. Öte yandan, ortalama hata, veri setinin boyutunun etkisini ayırır ve bu nedenle benzer performans modellerinin farklı veri setlerinde benzer ortalama hatalara sahip olmasını bekleriz.{ xben, yben}{ x'ben, y'ben}