Alternatif bir açıklama olarak, aşağıdaki sezgiyi düşünün:
Bir hatayı en aza indirirken, bu hataları nasıl cezalandıracağımıza karar vermeliyiz. Gerçekten de, hataları cezalandırmak için en basit yaklaşım bir linearly proportional
ceza işlevi kullanmak olacaktır . Böyle bir fonksiyonla, ortalamadan her sapmaya, orantılı bir karşılık gelen hata verilir. İki kez kadarıyla ortalamasından nedenle sonuçlanacaktır iki kez ceza.
Daha yaygın olan yaklaşım, squared proportional
ortalamadan sapmalar ile ilgili ceza arasındaki ilişkiyi göz önünde bulundurmaktır . Bu emin olacaktır ileri uzakta ortalama gelmektedir, oransal olarak daha fazla sen cezalandırılır. Bu ceza fonksiyonu kullanılarak, aykırı değerler (ortalamanın uzağında) , ortalamanın yakınındaki gözlemlerden orantılı olarak daha bilgilendirici olarak kabul edilir .
Bunun bir görselleştirmesini vermek için, ceza işlevlerini basitçe çizebilirsiniz:
Şimdi, özellikle gerilemelerin tahmini (örneğin OLS) tahmini göz önüne alındığında, farklı ceza fonksiyonları farklı sonuçlar verecektir. linearly proportional
Ceza işlevini kullanarak, regresyon aykırı değerlere squared proportional
ceza işlevini kullanmaktan daha az ağırlık verir . Medyan Mutlak Sapma (MAD) bu nedenle daha sağlam bir tahminci olarak bilinir . Bu nedenle, genel olarak, sağlam bir tahmincinin veri noktalarının çoğuna iyi uyduğu ancak aykırı olanları 'görmezden geldiği' durumdur. Buna karşılık, en küçük kareler sığacak şekilde aykırı değerlere doğru daha fazla çekilir. Karşılaştırma için bir görselleştirme:
Şimdi OLS hemen hemen standart olmasına rağmen, farklı ceza fonksiyonları da kesinlikle kullanılıyor. Örnek olarak, Matlab'ın regresyonunuz için farklı bir ceza ('ağırlık' da denir) işlevini seçmenize izin veren sağlamlık işlevine bir göz atabilirsiniz . Ceza fonksiyonları arasında andrews, bisquare, cauchy, fair, huber, lojistik, ols, talwar ve welsch sayılabilir. Karşılık gelen ifadeleri web sitesinde de bulabilirsiniz.
Umarım bu ceza fonksiyonları için biraz daha sezgisel olmana yardım eder :)
Güncelleme
Eğer Matlab'ınız varsa , sıradan en küçük karelerin sağlam regresyonla karşılaştırılması için özel olarak geliştirilen Matlab'ın sağlam dümeniyle oynamayı önerebilirim :
Demo, bireysel noktaları sürüklemenizi ve hem sıradan en küçük kareler hem de güçlü regresyon üzerindeki etkiyi hemen görmenizi sağlar (öğretim amaçları için mükemmeldir!).