Sıklıkla en az kare kalıntıları en aza indirmenin , hesaplama bakımından daha basit olmasından dolayı mutlak kalıntıları en aza indirmeye tercih edildiği belirtilmektedir . Ancak, olabilir de başka nedenlerle iyi olur. Şöyle ki, eğer varsayımlar doğruysa (ve bu yüzden nadir değildir) o zaman (ortalama olarak) daha doğru bir çözüm sağlar.
Maksimum olasılık
En küçük kareler regresyonu ve kantil regresyon (mutlak kalıntılar en aza indirilerek gerçekleştirildiğinde), Gauss / Laplace dağıtılmış hatalarının olasılık fonksiyonunu en üst düzeye çıkarıyor gibi görülebilir ve bu anlamda çok ilişkilidir.
Gauss dağılımı:
f(x)=12πσ2−−−−√e−(x−μ)22σ2
kare kalıntıların toplamı en aza indirilirken log olasılığı en üst düzeye çıkarılır
logL(x)=−n2log(2π)−nlog(σ)−12σ2∑i=1n(xi−μ)2sum of squared residuals
Laplace dağılımı:
f(x)=12be−|x−μ|b
mutlak artıkların toplamı en aza indirilirken log olasılığı en üst düzeye çıkarılır
logL(x)=−nlog(2)−nlog(b)−1b∑i=1n|xi−μ|sum of absolute residuals
Not: Laplace dağılımı ve mutlak artıkların toplamı medyanla ilgilidir, ancak negatif ve pozitif kalıntılara farklı ağırlıklar verilerek diğer niceliklere genelleştirilebilir.
Bilinen hata dağılımı
Hata dağılımını bildiğimizde (varsayımlar muhtemelen doğru olduğunda) ilişkili olabilirlik işlevini seçmek mantıklıdır. Bu işlevi en aza indirmek daha uygundur.
Çoğu zaman hatalar (yaklaşık) normal dağılır. Bu durumda, en küçük kareler kullanmak μ parametresini bulmanın en iyi yoludur ( hem ortalama hem de medyan ile ilgilidir). Bu en iyi yoldur çünkü en düşük örnek varyansına sahiptir (tüm yansız tahmin edicilerin en düşüktür ). Veya daha güçlü bir şekilde söyleyebilirsiniz: stokastik olarak baskın olduğunu ( bu sorudaki örnek medyanın dağılımını ve örnek ortalamasını karşılaştıran resme bakın ).
Dolayısıyla, hatalar normal olarak dağıtıldığında, örnek ortalaması dağılım medyanının numune medyanından daha iyi bir tahmin edicisidir . En küçük kareler regresyonu, miktarların daha uygun bir tahmincisidir. Mutlak artıkların en az toplamını kullanmaktan daha iyidir.
Normal dağıtılmış hatalarla ilgili çok fazla sorun olduğundan, en küçük kareler yönteminin kullanımı çok popülerdir. Diğer dağıtım türleri ile çalışmak için Genelleştirilmiş doğrusal model kullanılabilir . Ve, GLM'leri çözmek için kullanılabilen yinelemeli en küçük kareler yöntemi , medyanı (veya genelleştirilmiş versiyonda diğer miktarlarda) bulmaya eşdeğer olan Laplace dağılımı (yani mutlak sapmalar için ) için de çalışır .
Bilinmeyen hata dağılımı
sağlamlık
Medyan veya diğer miktarlar, dağıtım türü konusunda çok sağlam olma avantajına sahiptir. Gerçek değerler çok önemli değil ve miktarlar sadece siparişi önemsiyor. Dolayısıyla, dağılım ne olursa olsun, mutlak kalıntıları (miktarları bulmaya eşdeğer) en aza indirmek çok iyi çalışıyor.
Buradaki soru karmaşık ve geniş hale geliyor ve dağıtım işlevi hakkında ne tür bilgiye sahip olduğumuz ya da sahip olmadığımıza bağlı. Örneğin, bir dağılım yaklaşık olarak normal dağılıma sahip olabilir, ancak sadece bazı ek aykırı değerlerle olabilir. Bu, dış değerler kaldırılarak çözülebilir. Aşırı değerlerin bu şekilde kaldırılması , kesik ortalamanın medyandan daha iyi bir tahminci olabileceği Cauchy dağılımının konum parametresini tahmin etmede bile çalışır . Bu nedenle, yalnızca varsayımların geçerli olduğu ideal durum için değil, aynı zamanda daha az ideal uygulamalar için (örn. Ek aykırı değerler), mutlak artıkların toplamı yerine bir miktar kare kalıntısının hala bir kısmını kullanan iyi sağlam yöntemler olabilir.
Kesik artıklarla regresyonun hesaplama açısından çok daha karmaşık olabileceğini düşünüyorum. Yani aslında hesaplama açısından daha basit (normal en küçük karelerden daha basit değil, kesik en küçük karelerden daha basit) nedeni ile gerçekleştirilen regresyon türü olan kuantil regresyon olabilir .
Önyargılı / tarafsız
Başka bir konu tarafsız tahmin edicilere karşı önyargılıdır. Yukarıda, ortalama veya en küçük kareler çözümü için maksimum olasılık tahminini iyi veya tercih edilebilir bir tahmin edici olarak tanımladım çünkü çoğu zaman tüm yansız tahmin edicilerin en düşük varyansına sahiptir (hatalar normal dağıtıldığında). Ancak, önyargılı tahminciler daha iyi olabilir (kare hatalarının beklenen toplamının düşük olması).
Bu, soruyu tekrar geniş ve karmaşık hale getirir. Bunları uygulamak için birçok farklı tahminci ve birçok farklı durum vardır. Uyarlanmış toplam kare kalıntısı kaybı işlevinin kullanılması, hatayı azaltmak için genellikle iyi çalışır (örneğin her türlü düzenleme yöntemi), ancak tüm durumlar için iyi çalışması gerekmeyebilir. Sezgisel olarak, kare kalan kalıntı kaybı işlevinin toplamının çoğu zaman tüm tarafsız tahmin ediciler için iyi çalıştığından, en uygun önyargılı tahmin edicilerin muhtemelen kare kalan kalıntı kaybı işlevinin toplamına yakın bir şey olduğunu hayal etmek garip değildir.