Bu yöntemlerin dezavantajlarını çözdüğü için elastik net düzenlileştirme Lasso ve Ridge için her zaman tercih edilir mi? Sezgi nedir ve elastik ağın arkasındaki matematik nedir?
Bu yöntemlerin dezavantajlarını çözdüğü için elastik net düzenlileştirme Lasso ve Ridge için her zaman tercih edilir mi? Sezgi nedir ve elastik ağın arkasındaki matematik nedir?
Yanıtlar:
Evet, elastik ağ her zaman özel durumlar olarak da dahil edilmekle birlikte her iki yöntemin sınırlarını da çözdüğü için, kement ve sırt regresyonu için tercih edilir. Öyleyse sırt veya kement çözümü gerçekten en iyisi ise, herhangi bir iyi model seçim rutini, bunu modelleme sürecinin bir parçası olarak tanımlayacaktır.
Yazıma yapılan yorumlar, elastik ağın avantajlarının niteliksiz olmadığını belirtti. Elastik net regresyonun genelliğinin hala kendi başına veya düzenlenmesi için tercih edildiğine inancım devam ediyor . Özellikle, kendim ve diğerleri arasındaki çekişme noktalarının, modelleme süreci hakkında ne gibi varsayımlarda bulunmak istediğimize doğrudan bağlı olduğunu düşünüyorum. Temel veriler hakkında güçlü bir bilgi varlığında, bazı yöntemler diğerlerine tercih edilecektir. Bununla birlikte, elastik ağ tercihim, kişinin şüphesiz ya da gerçek model olduğunu bileceği şüphesine dayanıyor .
Bu biraz dairesel. Bu biraz glib ise beni bağışlayın, ancak LASSO'nun (sırtın) en iyi çözüm olduğunu biliyorsanız, kendinize nasıl uygun bir şekilde modelleyeceğinizi sormayacaksınız; sadece bir LASSO (sırt) modeline uyacaksınız. Eğer konum kesinlikle emin doğru cevap LASSO (sırt) regresyon olduğunu, o zaman açıkça elastik net uydurma atık zaman için hiçbir neden olacağını ikna ediyoruz. Ancak, LASSO'nun (sırtın) ilerlemenin doğru yolu olup olmadığından biraz daha az emin iseniz, daha esnek bir model tahmin etmenin ve verilerin önceki inancı ne kadar güçlü bir şekilde desteklediğini değerlendirmenin anlamlı olacağını düşünüyorum.
Bu doğrudur, ancak hangi yöntemin kullanılacağına karar verilen adımda, hangisi elastik ağ, sırt veya LASSO'nun en iyisi olduğunu bilemez. En iyi çözümün LASSO ya da sırt regresyonu olmasının bir nedeni varsa, o zaman talep alanındayız (1). Hangisinin hala en iyi olduğundan emin değilsek, o zaman LASSO'yu, ridge ve elastik net çözümleri test edebilir ve bu noktada son bir model seçebiliriz (veya eğer akademik bir iseniz, üçünüz hakkında da bir makale yazabilirsiniz). ). Önceden belirsizliğin bu durumu bizi ya istem (2) 'nin alanına yerleştirecektir, burada gerçek model LASSO / sırttır, ancak zamanın ötesinde bunu bilmiyorduk ve yanlış tanımlanmış hiperparametreler nedeniyle yanlışlıkla yanlış modeli seçtik ya da elastik ağ aslında en iyi çözümdür.
Hui Zou ve Trevor Hastie. " Düzenlileştirme ve elastik ağ üzerinden değişken seçimi ." JR İstatistiği. Soc, cilt 67 (2005), Bölüm 2., sayfa 301-320.
Richard Hardy, bunun Hastie ve diğ. “İstatistiksel Öğrenmenin Öğeleri” bölüm 3 ve 18.
Bu yorumlarda bana yöneltilen bir soru:
Sorunun ruhunun "Sizin iddia ettiğiniz gibi ve iki penaltı iyidir, neden başka bir tane eklemiyorsunuz?" Olduğunu takdir ediyorum. Fakat bence cevap, ilk başta neden düzenli olduğumuzda yatıyor.
Bu sorunlardan herhangi birini bir kenara koyan düzenli model, ML modelinin performansını hala çıkarabilir çünkü tahmin edicilerin büzülme özellikleri "karamsar" ve katsayıları 0'a çeker.
@Sycorax cevabına genel olarak katılıyorum, ancak bazı yeterlilikler eklemek istiyorum.
"Elastik ağın her zaman kement ve sırt regresyonu için tercih edildiğini" söylemek, biraz fazla güçlü olabilir. Küçük veya orta örneklerde, elastik ağ, eski veya ikincisi aslında ilgili olsa bile, saf LASSO veya saf çıkıntı çözeltisini seçemez. Güçlü bir ön bilgi verildiğinde, elastik ağ yerine LASSO ya da sırtın seçilmesi mantıklı olabilir. Bununla birlikte, önceden bilgi yokluğunda, elastik ağ tercih edilen çözelti olmalıdır.
Ayrıca, elastik ağ, LASSO ya da sırttan hesaplanırken daha pahalıdır, çünkü LASSO'ya karşı sırtın göreceli ağırlığı, çapraz doğrulama kullanılarak seçilmelidir. Eğer makul bir alfa değerleri ızgarası, 0,1 adım büyüklüğüne sahip [0,1] ise, bu, elastik ağın kabaca LASSO ya da çıkıntı kadar hesaplamalı olarak 11 kat daha pahalı olduğu anlamına gelir. (LASSO ve çıkıntı oldukça aynı hesaplama karmaşıklığına sahip olmadığından sonuç sadece kaba bir tahmindir.)