Düzenleme ile lagrange çarpanları yöntemi arasındaki bağlantı nedir?


12

İnsanların fazla uymasını önlemek için insanlar , doğrusal regresyonun maliyet fonksiyonuna bir düzenleme parametresi ile bir modelleme terimi (modelin parametrelerinin kare toplamıyla orantılı) ekler λ. Bu parametresi λbir lagrange çarpanı ile aynı mıdır? Düzenleme, lagrange çarpanı yöntemiyle aynı mıdır? Veya bu yöntemler nasıl bağlanır?

Yanıtlar:


11

Diyelim ki , parametre vektörünün büyüklüğü üzerinde bir kısıtlamaya tabi bazı f ( θ ) kriterlerini en aza indirerek parametrelerine sahip bir modeli optimize ediyoruz (örneğin, iç içe artan bir dizi model inşa ederek yapısal bir risk minimizasyonu yaklaşımı uygulamak karmaşıklık), çözmemiz gerekir:θf(θ)

minθf(θ)s.t.θ2<C

Lagrangian bu sorun için (uyarı: Bence, uzun bir gün oldu ... ;-)

Λ(θ,λ)=f(θ)+λθ2λC.

Bu nedenle, düzenli bir maliyet fonksiyonunun, kısıtlama optimizasyon problemiyle yakından ilişkili olduğu görülebilir; bu düzenleme parametresi , kısıtlamayı ( ) yöneten sabitle ilişkilidir ve esasen Lagrange çarpanıdır. λC

Bu, örneğin sırt regresyonunun neden yapısal risk minimizasyonunu uyguladığını gösterir: Düzenleme, ağırlık vektörünün büyüklüğüne bir sınırlama koymaya eşdeğerdir ve eğer ise, kısıtlamaya yapılabilecek her modelC1>C2

θ2<C2

kısıtlama altında da mevcut olacak

θ2<C1 .

Bu nedenle azaltılması , karmaşıklığı artıran bir dizi hipotez alanı üretir.λ

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.