Yanıtlar:
Kısa cevap: Bu durumlardan biriyle ne zaman karşı karşıya kalırsanız:
Ridge regresyon genellikle, önyargı ve varyans arasındaki daha iyi bir uzlaşma yoluyla OLS çözümünden daha iyi tahminler verir. Başlıca dezavantajı, tüm tahmincilerin modelde tutulmasıdır; bu nedenle, temelli bir model aramak ya da bir tür özellik seçimi uygulamak istemeniz çok ilginç değildir.
Seyrekliği sağlamak için, kement daha uygundur, ancak yüksek collinearity varlığında mutlaka iyi sonuçlar vermeyecektir (prediktörler yüksek korelasyona sahipse, kementin tahmin performansının sırt regresyonunun egemen olduğu görülmüştür). L1 cezası ile ikinci sorun, değişken sayısının denek sayısından daha büyük olması durumunda Kement çözümünün benzersiz bir şekilde belirlenmemesidir (bu, regresyon gerilemesi söz konusu değildir). Kementin son dezavantajı, çift yönlü korelasyonları yüksek olan bir grup yordayıcı arasında yalnızca bir değişkeni seçme eğiliminde olmasıdır. Bu durumda, grup gibi alternatif çözümler vardır (yani, değişkenler bloğunda büzülme elde et, bazı regresyon katsayıları blokları tamamen sıfırdır) veya kaynaşıkkement. Grafiksel Kement da GGMs için umut verici özellikleri (R bkz sunmaktadır glasso paketi).
Kement, Friedman ve coll. Tarafından yayınlanan son makalede açıklandığı gibi koordinat inişine, Koordinat İniş (JSS, 2010) veya LARS algoritması ile Genelleştirilmiş Doğrusal Modeller için Düzenlileştirme Yollarına dayanan bir algoritma ile hesaplanabilir . R olarak, ceza , Lars veya biglars ve glmnet paketleri yararlı paketler; Python'da scikit.learn araç seti var, üç tür düzenlileştirme planını uygulamak için kullanılan algoritmalar hakkında kapsamlı belgeler mevcut.
Genel referanslara gelince, Kement sayfasında L1 cezasıyla ilgili kement regresyonu ve teknik detaylara başlamak için ihtiyaç duyulanların çoğu yer almaktadır ve bu soru, kement vs sırtını ne zaman kullanmalıyım?
Sırt regresyonunun kullanımına ilişkin teorik bir gerekçe, çözümünün katsayılar üzerinde normal olarak verilen posterior ortalama olmasıdır. Diğer bir deyişle, kare hatasını önemsiyorsanız ve normal bir önceliğe inanıyorsanız, sırt tahminleri en uygunudur.
Benzer şekilde, kement tahmini, katsayılarınızdan önce çift-üstel olan arka moddur. Bu sıfır bir kayıp fonksiyonu altında en uygunudur.
Uygulamada, bu teknikler tipik olarak, çok fazla ilişkiniz olan değişkenlerin olmadığı ve çok fazla verinin olmadığı durumlarda, öngörüsel doğruluğu iyileştirir. OLS tahmincisi en iyi doğrusal yansız olsa da, bu durumlarda yüksek varyansa sahiptir. Önyargı varyans ticaretine bakarsanız, tahmin doğruluğu artar çünkü önyargıdaki küçük artış, varyanstaki büyük düşüş ile dengelenir.