LASSO'da normalleştirme parametresi için aralık ve ızgara yoğunluğunu seçme


12

Bu arada LASSO (en az mutlak büzülme ve seçim operatörü) okuyorum . Düzenleme parametresi için en uygun değerin çapraz doğrulama ile seçilebildiğini görüyorum. Ben de sırt regresyonunda ve regülasyonu uygulayan birçok yöntemde görüyorum, optimal regülasyon parametresini (ceza söyleyerek) bulmak için CV'yi kullanabiliriz. Şimdi sorum parametrenin üst ve alt sınırı için başlangıç ​​değerleri ve dizinin uzunluğunun nasıl belirleneceği hakkında.

Spesifik olarak, bir LASSO problemimiz olduğunu varsayalım ve ceza için en uygun değeri bulmak istiyoruz, . Peki için alt ve üst sınırı nasıl seçebiliriz ? ve bu iki değer arasında kaç bölünme ? λ λ [ a = ? , b = ? ] ( b - a )

LogLikelihood=(yxβ)(yxβ)+λ|β|1
λλ[a=?,b=?](ba)k=?

İlgili soru burada .
Richard Hardy

Yanıtlar:


13

Bu metodoloji, Koordinat İniş Yoluyla Genelleştirilmiş Doğrusal Modeller için glmnet makalesi Düzenleme Yolları'nda açıklanmaktadır . Burada metodoloji hem genel durum için olsa ve L 2 regularization, bu kement (yalnızca uygulamalıdır L 1 ) de.L1L2L1

Maksimum için çözelti bölüm 2.5'te verilmiştir. λ

Tüm , biz görmek (5), ~ β j kalacak sıfır ise 1β~=0β~j. Bu nedenleNαλmax=maks.L| Xl,y|1N|xj,y|<λαNαλmax=maxl|xl,y|

Yani, beta için güncelleme kuralının yukarıda belirtilen için tüm parametre tahminlerini sıfıra zorladığını gözlemliyoruz .λ>λmax

Belirlenmesi ve ızgara noktaları sayısı daha az ilkeli görünüyor. Glmnet'te λ m i n = 0.001 λ m a x ayarladılar ve sonra logaritmik ölçekte eşit aralıklı 100 noktadan oluşan bir ızgara seçtiler .λminλmin=0.001λmax100

Bu pratikte iyi çalışıyor, glmnet'i yoğun bir şekilde kullandığımda, bu ızgarayı asla çok kaba bulmadım.

L1λ

β=0λmaxL1

Numune ağırlıkları da durumu zorlaştırır, iç ürünler uygun yerlerde ağırlıklı iç ürünlerle değiştirilmelidir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.