Kement sorunu kapalı formda bir çözüme sahip: \ beta_j ^ {\ text {lasso}} = \ mathrm {sgn} (\ beta ^ {\ metin {LS}} _ j) (| \ beta_j ^ {\ text {LS }} | - \ alpha) ^ +
, X ortonormal sütunlara sahipse. Bu, bu başlıkta gösterilmiştir: Kapalı formdaki kement çözeltisinin türetilmesi .
βlasso=argminβ∥y−Xβ∥22+α∥β∥1
βlassoj=sgn(βLSj)(|βLSj|−α)+
X
Ancak genel olarak neden kapalı form çözümü olmadığını anlamıyorum. Alt farklılıkları kullanarak aşağıdakileri elde ettim.
( X , n×p Matrix'tir)
f(β)=∥y−Xβ∥22+α∥β∥1
=∑i=1n(yi−Xiβ)2+α∑j=1p|βj|
(
Xi ,
X'in i-inci
satırıdırX )
=∑i=1ny2i−2∑i=1nyiXiβ+∑i=1nβTXTiXiβ+α∑j=1p|βj|
⇒∂f∂βj=−2∑i=1nyiXij+2∑i=1nX2ijβj+∂∂βj(α|βj|)
=⎧⎩⎨⎪⎪−2∑ni=1yiXij+2∑ni=1X2ijβj+α for βj>0−2∑ni=1yiXij+2∑ni=1X2ijβj−α for βj<0[−2∑ni=1yiXij−α,−2∑ni=1yiXij+α] for βj=0
ile
∂f∂βj=0 aldığımız
βj=⎧⎩⎨⎪⎪(2(∑ni=1yiXij)−α)/2∑ni=1X2ij(2(∑ni=1yiXij)+α)/2∑ni=1X2ij0for ∑ni=1yiXij>αfor ∑ni=1yiXij<−α for ∑ni=1yiXij∈[−α,α]
Yanlış yaptığım yeri gören var mı?
Cevap:
Problemi matris cinsinden yazarsak, kapalı bir form çözümünün sadece ortonormal durumda neden sadece X ^ TX = I ile olduğunu çok kolay görebiliriz XTX=I:
f(β)=∥y−Xβ∥22+α∥β∥1
=yTy−2βTXTy+βTXTXβ+α∥β∥1
⇒∇f(β)=−2XTy+2XTXβ+∇(α|β∥1)
(Burada bir kerede birçok adım attım. Bu noktaya kadar bu, en küçük kareler çözümünün türetilmesine tamamen benzer. Bu yüzden orada eksik adımları bulabilmelisiniz.)
⇒∂f∂βj=−2XTjy+2(XTX)jβ+∂∂βj(α|βj|)
İle ∂f∂βj=0 aldığımız
2(XTX)jβ=2XTjy−∂∂βj(α|βj|)
⇔2(XTX)jjβj=2XTjy−∂∂βj(α|βj|)−2∑i=1,i≠jp(XTX)jiβi
Şimdi bir diğer tüm bağlı olduğunu , bu nedenle buradan nasıl devam belli değil. Eğer ortonormal ise bu yüzden kesinlikle bu durumda kapalı bir form çözümü var.βjβi≠jX2(XTX)jβ=2(I)jβ=2βj
Guðmundur Einarsson’a, burada üzerinde durduğum yanıtı için teşekkür ederim. Umarım bu sefer doğru olur :-)