tanımlayınOlduğunu biliyoruz , bağlı cezası da asgarileştirir olarak orijini olan.
w^λ=argminwL(Θ,X,y)+λ∥w∥22.
limλ→∞w^λ=0w↦∥w∥22
Sycorax, benzer şekildeBu başarılı genelleme bizi önermemize yol açabilir burada bir işlevdir Küçültücü aradığımız bazı malları tatmin ediyor. Gerçekten de, Sycorax , burada başlangıç noktasında (benzersiz olarak) en aza indirilir ve özellikle . Bu nedenle , istendiği gibi. Ne yazık ki, yine de, her ikilimλ→∞{argminwL(Θ,X,y)+λ∥w−c∥22}=c.
w~λ=argminwL(Θ,X,y)+λpen(w),
penpen(w)=g(∥w∥22−5)gg∈{|⋅|,(⋅)2}limλ→∞∥w~λ∥22=5gdışbükey cezalara yol açarak tahmin edicinin hesaplanmasını zorlaştırır.
Yukarıdaki analiz en iyi çözüm gibi görünüyor (belki de seçimine, daha fazla önereceğim daha iyi bir şeyim yok) tarif edilen "eğilim" in benzersiz yorumu olarak ısrar edersek soru. Ancak, , bazı var, böylece OP sorununun minimizer Lambda'sı satsifes . Bu nedenle nesnel işlevi değiştirmeye gerek kalmadan. Böyle bir yoksa, bilgi işlem sorunugλ→∞∥argminwL(Θ,X,y)∥22≥5Λw^Λ∥w^Λ∥22=5
limλ→Λ∥w^λ∥22=5,
Λargminw:∥w∥22=5L(Θ,X,y) esasen zordur. Gerçekten de, doğal özelliklerini teşvik etmeye çalışırken dışında herhangi bir tahminci düşünmeye gerek yoktur .
w^λ∥w^λ∥22
(Cezalandırılmış bir tahmincinin, deneyimsiz tahminci tarafından elde edilemeyen bir ceza değerine ulaşmasını sağlamak benim için son derece doğal görünmüyor. Aslında bunun istendiği herhangi bir yerden haberdar olan varsa, lütfen yorum yapın!)