Sayısal kararlılık ve aşırı uyum bir anlamda ilişkili ancak farklı konulardır.
Klasik OLS sorunu:
Klasik en küçük kareler sorununu düşünün:
minimize(over b)(y−Xb)T(y−Xb)
Çözüm klasik . Bir fikir, çok sayıda yasa ile:b^=(X′X)−1(X′y)
limn→∞1nX′X→E[xx′]limn→∞1nX′y→E[xy]
Bu nedenle OLS tahmini ayrıca . (Doğrusal cebir terimleriyle, bu, rasgele değişken rasgele değişkenlerinin doğrusal açıklığına doğrusal projeksiyonudur .)b^E[xx′]−1E[xy]yx1,x2,…,xk
Sorunlar?
Mekanik olarak ne yanlış gidebilir? Olası sorunlar nelerdir?
- Küçük örnekler için ve örnek tahminlerimiz zayıf olabilir.E[xx′]E[xy]
- sütunları eşdoğrusalsa (doğal eşdoğrusallık veya küçük örneklem büyüklüğü nedeniyle), sorunun sürekli bir çözümü olacaktır! Çözüm benzersiz olmayabilir.
X
- Bu, sıralama eksikse oluşur.E[xx′]
- Bu aynı zamanda, sorunlarının sayısına göre küçük örneklem büyüklüğü nedeniyle sıralama eksikliği varsa da oluşur .X′X
tahmini , temel popülasyonda bulunmayan örneklemdeki kalıpları yansıtmaya başladığında , problem (1) aşırı sığmaya neden olabilir . Bu tahmin ve de veb^1nX′X1nX′yE[xx′]E[xy]
Sorun (2), bir çözümün benzersiz olmadığı anlamına gelir. Bireysel ayakkabıların fiyatını tahmin etmeye çalıştığımızı düşünün, ancak ayakkabı çiftleri her zaman birlikte satılıyor. Bu kötü bir sorun, ama diyelim ki yine de yapıyoruz. Sol ayakkabı fiyatının artı doğru ayakkabı fiyatının 50 $ 'a eşit olduğuna inanabiliriz , ancak bireysel fiyatları nasıl bulabiliriz? Sol ayakkabı fiyatları ve sağ ayakkabı fiyatı mı? Tüm olasılıklardan nasıl seçim yapabiliriz?pl=45pr=5
Tanıtımı penaltı:L2
Şimdi düşünün:
minimize(over b)(y−Xb)T(y−Xb)+λ∥b∥2
Bu bize her iki tür problemde de yardımcı olabilir. ceza bizim tahminini iter sıfıra doğru. Bu katsayı değerleri üzerinden dağılım etrafında merkezlenmeden önce Bayesci olarak etkili bir şekilde işlev görür . Aşırı takmaya yardımcı olur. Tahminimiz hem verileri hem de nin sıfıra yakın olduğuna dair ilk inancımızı yansıtacaktır .L2b0b
L2 düzenlenmesi de her zaman kötü durumdaki sorunlara benzersiz bir çözüm bulmak için kullanılır. Sol ve sağ ayakkabıların toplamının olduğunu , normunu da en aza indiren çözüm .$50L2pl=pr=25
Bu sihir mi? Hayır. Düzenleme, soruyu gerçekten yanıtlamamıza izin verecek verileri eklemekle aynı şey değildir. düzenlenmesi bir anlamda veri eksikliği varsa yakın tahminleri seçtiği görüşünü benimser .L20