Lasso için düz alt gradyan yöntemleri yerine neden proksimal gradyan inişi?


9

Lasso'yu vanilya alt gradyan yöntemleri ile çözmeyi düşünüyordum. Ama Proksimal degrade iniş kullanmayı öneren insanları okudum. Birisi neden Kement için vanilya alt gradyan yöntemleri yerine proksimal GD'nin kullanıldığını vurgulayabilir mi?

Yanıtlar:


14

Kement için alt gradyan yöntemleri kullanılarak yaklaşık bir çözüm bulunabilir. Örneğin, aşağıdaki kayıp işlevini en aza indirmek istediğimizi düşünelim:

f(w;λ)=yXw22+λw1

Ceza terimi gradyanına λ için wi<0 ve λ için wi>0 , ancak ceza terimi en türevlenemeyen olan 0 . Bunun yerine, aynı ancak w_i = 0 için 0 değerine sahip \ lambda \ text {sgn} (w) alt gradyanını kullanabiliriz .λsgn(w)0wi=0

Kayıp işlevi için karşılık gelen alt gradyan:

g(w;λ)=2XT(yXw)+λsgn(w)

Degrade inişe benzer bir yaklaşım kullanarak , ancak degradenin tanımsız olduğu dışındaki her yerde degradeye eşit olan) kullanarak kayıp işlevini en aza indirebiliriz . Çözelti gerçek kement çözeltisine çok yakın olabilir, ancak tam sıfır içermeyebilir - ağırlıkların sıfır olması gerektiği yerde, bunun yerine çok küçük değerler alırlar. Bu gerçek azlık eksikliği, kement için alt gradyan yöntemlerini kullanmamak için bir nedendir. Özel çözücüler, hesaplamalı olarak verimli bir şekilde gerçekten seyrek çözümler üretmek için sorun yapısından yararlanır. Bu gönderi0seyrek çözümler üretmenin yanı sıra, özel yöntemlerin (proksimal degrade yöntemleri dahil) alt gradyan yöntemlerinden daha hızlı yakınsama hızlarına sahip olduğunu söylüyor. Bazı referanslar veriyor.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.