Kapalı formdaki kement çözümünün türetilmesi neden yanlış?


28

Kement sorunu kapalı formda bir çözüme sahip: \ beta_j ^ {\ text {lasso}} = \ mathrm {sgn} (\ beta ^ {\ metin {LS}} _ j) (| \ beta_j ^ {\ text {LS }} | - \ alpha) ^ + , X ortonormal sütunlara sahipse. Bu, bu başlıkta gösterilmiştir: Kapalı formdaki kement çözeltisinin türetilmesi .

βlasso=argminβyXβ22+αβ1
βjlasso=sgn(βjLS)(|βjLS|α)+
X

Ancak genel olarak neden kapalı form çözümü olmadığını anlamıyorum. Alt farklılıkları kullanarak aşağıdakileri elde ettim.

( X , n×p Matrix'tir)

f(β)=yXβ22+αβ1
=i=1n(yiXiβ)2+αj=1p|βj|
( Xi , X'in i-inci satırıdırX )
=i=1nyi22i=1nyiXiβ+i=1nβTXiTXiβ+αj=1p|βj|
fβj=2i=1nyiXij+2i=1nXij2βj+βj(α|βj|)
={2i=1nyiXij+2i=1nXij2βj+α for βj>02i=1nyiXij+2i=1nXij2βjα for βj<0[2i=1nyiXijα,2i=1nyiXij+α] for βj=0
ile fβj=0 aldığımız

βj={(2(i=1nyiXij)α)/2i=1nXij2for i=1nyiXij>α(2(i=1nyiXij)+α)/2i=1nXij2for i=1nyiXij<α0 for i=1nyiXij[α,α]

Yanlış yaptığım yeri gören var mı?

Cevap:

Problemi matris cinsinden yazarsak, kapalı bir form çözümünün sadece ortonormal durumda neden sadece X ^ TX = I ile olduğunu çok kolay görebiliriz XTX=I:

f(β)=yXβ22+αβ1
=yTy2βTXTy+βTXTXβ+αβ1
f(β)=2XTy+2XTXβ+(α|β1)
(Burada bir kerede birçok adım attım. Bu noktaya kadar bu, en küçük kareler çözümünün türetilmesine tamamen benzer. Bu yüzden orada eksik adımları bulabilmelisiniz.)
fβj=2XjTy+2(XTX)jβ+βj(α|βj|)

İle fβj=0 aldığımız

2(XTX)jβ=2XjTyβj(α|βj|)
2(XTX)jjβj=2XjTyβj(α|βj|)2i=1,ijp(XTX)jiβi

Şimdi bir diğer tüm bağlı olduğunu , bu nedenle buradan nasıl devam belli değil. Eğer ortonormal ise bu yüzden kesinlikle bu durumda kapalı bir form çözümü var.βjβijX2(XTX)jβ=2(I)jβ=2βj

Guðmundur Einarsson’a, burada üzerinde durduğum yanıtı için teşekkür ederim. Umarım bu sefer doğru olur :-)


3
CrossValidated'e hoş geldiniz ve çok güzel bir ilk yazı için tebrikler !
S. Kolassa - Monica,

Yanıtlar:


16

Bu normalde en az açı regresyonu ile yapılır, kağıdı burada bulabilirsiniz .

Başlangıçtaki kafa karışıklığım için üzgünüm, bu konuda başka bir girişimde bulunacağım.

Yani işlevi genişlemesi sonrasında Alacağınızf(β)

f(β)=i=1nyi22i=1nyiXiβ+i=1nβTXiTXiβ+αj=1p|βj|

Sonra kısmi türevi göre . Benim endişem, sizin 1 normdan önceki son terimin kısmi türevini, yani ikinci dereceden terimini hesaplamanızdır. Daha detaylı inceleyelim. Bizde var:βj

Xiβ=βTXiT=(β1Xi1+β2Xi2++βpXip)
Böylece ikinci dereceden teriminizi şu şekilde yeniden yazabilirsiniz: Şimdi bu wrt : nin türevini hesaplamak için zincir kuralını kullanabiliriz
i=1nβTXiTXiβ=i=1n(Xiβ)2
βj
βji=1n(Xiβ)2=i=1nβj(Xiβ)2=i=1n2(Xiβ)Xij

Şimdi probleminiz kolay değil, çünkü her denklemde mevcut tüm katsayılarına sahipsiniz .β

Bu, neden Kement’in kapalı bir form çözümü olmadığına dair sorunuza cevap vermiyor, daha sonra bir şeyler ekleyebilirim.


1
Çok teşekkürler. Aslında neden kapalı form çözümü olmadığına bakıyorum (düzenlememe bakın).
Norbert

Tatlı! Harika iş :)
Gumeo
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.