Yanıtlar:
LASSO (En Az Mutlak Çekme ve Seçme Operatörü), regresyon katsayılarının mutlak boyutunun cezalandırılmasını içeren bir regresyon yöntemidir.
Cezalandırmak (veya tahminlerin mutlak değerlerinin toplamını eşit olarak sınırlamak), parametre tahminlerinin bazılarının tamamen sıfır olabileceği bir durumda sonuçlanır. Uygulanan ceza ne kadar büyük olursa, başka tahminler de sıfıra doğru küçülür.
Bazı otomatik özellik / değişken seçimi istediğimizde veya yüksek düzeyde korelasyonlu prediktörlerle çalışırken standart regresyonun genellikle 'çok büyük' olan regresyon katsayılarına sahip olacağı durumlarda bu uygundur.
https://web.stanford.edu/~hastie/ElemStatLearn/ (Ücretsiz indirme), LASSO ve ilgili yöntemlerin iyi bir tanımına sahiptir.
LASSO regresyonu, hem değişken seçim hem de regülizasyonun aynı anda gerçekleştiği bir regresyon analizi türüdür. Bu yöntem, regresyon katsayılarının değerini etkileyen bir ceza kullanır. Ceza arttıkça, katsayılar sıfır olur ve Versa da geçerlidir. Ayar parametresinin büzülme miktarı olarak kullanıldığı L1 normalizasyon tekniğini kullanır. Ayar parametresi arttıkça yanlılık artar, azaldıkça değişkenlik artar. Eğer sabittirse, o zaman hiçbir katsayı sıfır değildir ve sonsuzluğa meyilli olduğu için tüm katsayılar sıfır olacaktır.
"Normal" regresyonda (OLS) amaç, katsayıları tahmin etmek için artık kareler toplamını (RSS) en aza indirmektir.
LASSO regresyonu durumunda katsayıları biraz farklı bir yaklaşımla tahmin edersiniz:
Yeni parça tarafından cezalandırılmış mutlak katsayı değerlerinin bir toplamı olan, kırmızı highlitened edilir , yani (L1) regulazation miktarını kontrol eder.
Eğer unutmayın , bu basit doğrusal regresyon ile aynı katsayılar içine sonuçlanacaktır. Formül, LASSO olması durumunda, hem RSS hem de L1 düzenlemesinin (yeni kırmızı bölüm) minimum olmasını gerektirir. Eğer , kırmızı L1 ceza katsayılarının büyüklüğünü kısıtlar katsayısı sadece artırabilir böylece eğer RSS azalma aynı miktarda bu kurşun. Daha genel olarak, katsayıların artmasının tek yolu, artık kareler toplamında (RSS) karşılaştırılabilir bir düşüş yaşarsak olur. Böylece, yüksek ayarladığınızne kadar fazla ceza katsayılara uygulanır ve o kadar küçük katsayılar o kadar küçük olur, bazıları sıfır olabilir. Bu, LASSO'nun özellik seçimi yaparak temelli modellere yol açabileceği ve modelin fazla takılmasını önlediği anlamına gelir. Bununla birlikte, birçok özelliğiniz varsa ve amacınız modelinizin katsayılarını yorumlamaktan ziyade verileri öngörmekse LASSO'yu kullanabilirsiniz.