Yanıtlar:
In İstatistiksel Öğrenme Unsurları kitabında, Hastie vd. bu büzülme tekniklerinin çok iyi anlaşılır ve ayrıntılı bir şekilde karşılaştırılmasını sağlar. Kitap çevrimiçi ( pdf ). Karşılaştırma bölüm 3.4.3, sayfa 69'da yapılmıştır.
Kement ve Ridge arasındaki temel fark, kullandıkları ceza terimdir. Ridge , katsayı vektörünün boyutunu sınırlayan ceza terimini kullanır . Lasso , katsayılar arasında seyreklik yaratan ve böylece takılan modeli daha fazla yorumlanabilen kılan cezasını kullanıyor . Elasticnet, bu iki teknik arasında bir uzlaşma olarak ortaya ve ve normlarının karışımı olan bir cezaya sahiptir .
Özetlemek gerekirse, Kement, Ridge ve Elastic-net arasındaki bazı belirgin farklar şunlardır:
İstatistiki öğrenme kitaplarına giriş konusuna bir göz atmanızı şiddetle tavsiye ederim (Tibshirani ve diğ., 2013).
Bunun nedeni , istatistiksel öğrenme kitabının Elementleri'nin matematik bilimlerinde ileri düzeyde eğitimi olan bireylere yönelik olmasıdır. ISL'ye önsözde, yazarlar şunları yazar:
Bir İstatistiksel Öğrenmeye Giriş Bu konuların daha geniş ve daha az teknik tedavisi için algılanan ihtiyaçtan doğdu. [...]
İstatistiksel Öğrenmeye Giriş, yüksek lisans öğrencileri veya yüksek lisans öğrencilerinin istatistik veya ilgili kantitatif alanlar için veya verilerini analiz etmek için istatistiksel öğrenme araçlarını kullanmak isteyen diğer disiplinlerdeki kişiler için uygundur.
Yukarıdaki cevaplar çok açık ve bilgilendirici. İstatistiksel açıdan küçük bir nokta eklemek istiyorum. Sırt regresyonunu örnek olarak alın. Çok sayıda doğrusallık problemini, birbiriyle ilişkili birçok özellik olduğunda çözmek, sıralı en küçük kare regresyonun bir uzantısıdır. Doğrusal regresyon
Y=Xb+e
Çoklu doğrusal regresyon için normal denklem çözümü
b=inv(X.T*X)*X.T*Y
Sırt regresyonu için normal denklem çözümü
b=inv(X.T*X+k*I)*X.T*Y.
B için önyargılı bir tahmin edicidir ve her zaman Ridge regresyonunun ortalama kare hatasını OLS regresyonundan daha küçük yapan bir ceza terimi k bulabiliriz.
LASSO ve Elastic-Net için böyle bir analitik çözüm bulamadık.