ve Elastic Net parametreleriyle neyin kastedildiğini açıklamaα
Farklı terminoloji ve parametreler farklı paketler tarafından kullanılır, ancak anlamı genellikle aynıdır:
R paketi Glmnet aşağıdaki tanımı kullanır
minβ0,β1N∑Ni=1wil(yi,β0+βTxi)+λ[(1−α)||β||22/2+α||β||1]
Sklearn kullanır
minw12N∑Ni=1||y−Xw||22+α×l1ratio||w||1+0.5×α×(1−l1ratio)×||w||22
Orada alternatif parametrelendirme kullanarak ve de ..ab
Karışıklığı önlemek için arayacağım
- λ ceza gücü parametresi
- L1ratio ile cezası arasındaki oran , 0 (sırt) ile 1 (Kement) arasındaki oranL1L2
Parametrelerin etkisini görselleştirmek
Bir simüle edilmiş bir veri kümesi düşünün gürültülü bir sinüs eğrisi oluşur ve aşağıdakilerden oluşan iki boyutlu bir özelliktir ve . ve arasındaki korelasyon nedeniyle , maliyet fonksiyonu dar bir vadidir.yXX1=xX2=x2X1X2
Aşağıdaki grafikler, iki farklı oran parametresi ile esneklik regresyonunun çözüm yolunu , kuvvet parametresinin bir işlevi olarak göstermektedir .L1λ
- Her iki simülasyon için: olduğunda , çözüm ilişkili vadi şeklindeki maliyet fonksiyonuyla sağ alt kısımdaki OLS çözümüdür.λ=0
- Şöyle arttıkça, içinde düzenlilestirme başladı ve çözelti eğilimiλ(0,0)
- İki simülasyon arasındaki ana fark oran parametresidir.L1
- LHS : Küçük oranı için düzenli maliyet fonksiyonu yuvarlak konturlu Ridge regresyon sistemine çok benziyor.L1
- RHS : Büyük oranı için, maliyet fonksiyonu, tipik elmas şekli Lasso regresyonuna çok benziyor.L1
- Orta oranı için (gösterilmemiştir), maliyet fonksiyonu, iki bir karışımıdır.L1
Parametrelerin etkisini anlama
ElasticNet, Kement'in bazı sınırlamalarına karşı koymak için tanıtıldı:
- Veri noktalarından , daha fazla varsa , kement çoğu değişkenini seçer .pnp>nn
- Kement, özellikle korelasyonlu değişkenlerin varlığında gruplanmış seçim yapamamaktadır. Bir gruptan bir değişken seçme ve diğerlerini görmezden gelme eğiliminde olacaktır
Bir ile ikinci dereceden cezasını birleştirerek her ikisinin de avantajlarını elde ederiz:L1L2
- L1 seyrek bir model oluşturur
- L2 , seçilen değişkenlerin sayısındaki sınırlamayı kaldırır, gruplandırmayı teşvik eder ve düzenlileştirme yolunu .L1
Sen köşelerinde tekillik teşvik, yukarıdaki şemada üzerinde görsel olarak görebilirsiniz kıtlık sıkı dışbükey kenarları teşvik ediyoruz ederken, gruplama .
İşte Hastie'den (ElasticNet'in mucidi) alınan bir görselleştirme.
daha fazla okuma
caret
Tekrarlanan cv yapabilen ve hem alfa hem de lambda için ayar yapabilen bir pakete bakmak istersiniz (çok çekirdekli işlemeyi destekler!). Bellekten,glmnet
belgelerin burada yaptığınız gibi alfa ayarına karşı tavsiyelerde bulunduğunu düşünüyorum . Kullanıcı tarafından sağlanan lambda ayarının yanı sıra alfa için ayar yapıyorsa, kıvrımları sabit tutmanızı tavsiye edercv.glmnet
.