Bu yöntemler - kement ve elastik ağ - hem özellik seçimi hem de tahminin sorunlarından doğmuştur. Bu iki lens sayesinde bir açıklama bulunabileceğini düşünüyorum.
Matthew Gunn, cevabında bu iki hedefin farklı olduğunu ve genellikle farklı insanlar tarafından ele alındığını açıklıyor. Ancak, neyse ki bizim için, ilgilendiğimiz yöntemler her iki alanda da iyi performans gösterebilir.
Öznitelik Seçimi
İlk olarak, özellik seçimi hakkında konuşalım. İlk önce elastik ağı kement perspektifinden motive etmeliyiz. Yani, Hastie ve Zou'dan alıntı yapmak için , "İkili korelasyonların çok yüksek olduğu bir değişken grubu varsa, o zaman kement gruptan sadece bir değişken seçme eğilimindedir ve hangisinin seçildiğini umursamaz." Örneğin bu bir sorundur, çünkü kement kullanarak gerçek desteğin bir unsurunu bulamayacağımız anlamına gelir - sadece bir tanesi onunla oldukça ilişkili. (Makalede bunun henüz okumadığım LARS belgesinde kanıtlandığı belirtiliyor.) Korelasyon varlığında destek iyileşmesinin zorluğu Wainwright tarafından da belirtiliyor ,0.5Gerçek destek ve onun tamamlayıcısı arasında yüksek bir korelasyon olduğunda .
Şimdi, elastik ağdaki l2 cezası, katsayıları sadece kayıp ve ayırt edilemez katsayısına sahip olmak için ayırt edilemez olarak kabul edilen özellikleri teşvik etmektedir. Bunu tatmin eder. Bu nedenle, elastik ağ, bunu 'yanlışlıkla' ortadan kaldırma olasılığını gerçek destekte olan bir katsayı tahmini yapma olasılığımızın düşmesine neden olur. Yani, gerçek desteğin tahmini destek içinde yer alması daha olasıdır. Bu iyi! Bu, daha fazla yanlış keşif olduğu anlamına gelir, ancak bu çoğu insanın ödemek istediği bir fiyattır.(a,b)=argmina′,b′:c=|a′|+|b′|(a′)2+(b′)2|a|=|b|
Bir kenara, yüksek derecede korelasyonlu özelliklerin çok benzer katsayı tahminlerine sahip olma eğiliminde olacağına dikkat çekmeye değer, böylece tahmini destek içinde yanıtı benzer şekilde etkileyen özellik gruplarını tespit edebiliriz.
tahmin
Şimdi, tahmine geçiyoruz. Matthew Gunn'ın işaret ettiği gibi, çapraz doğrulama yoluyla ayar parametrelerini seçmek, minimum tahmin hatasına sahip bir model seçmek için bir amaç oluşturur. Kement tarafından seçilen herhangi bir model elastik ağ tarafından seçilebildiğinden ( alarak ), elastik ağın kementten daha iyi tahmin eden bir model bulabilmesi mantıklıdır.α=1
Lederer, Yu ve Gaynanova , özelliklerin hiçbir varsayımı altında, kement ve elastik ağın aynı miktarda sınırlandırılmış l2 tahmin hatasına sahip olabileceğini gösteriyor. Sınırlarının sıkı olduğu kesin olarak doğru değildir, ancak bu dikkat edilmesi ilginç olabilir, çünkü oracle eşitsizlikleri , tahmin edicilerin tahmin performansını ölçmek için istatistiksel literatürde standart bir yol gibi görünmektedir - belki de dağılımlar çok karmaşık olduğundan! Ayrıca Lederer (1) (2) ' nin ilişkili özelliklerin varlığında kement tahminleri hakkında bazı makaleleri olduğunu belirtmek gerekir .
özet
Özetle, ilgili sorunlar tahmini destek ve tahminde bulunan gerçek destektir. Destek kurtarma için, kementin gerçek destek ve tamamlayıcısı arasındaki düşük korelasyon varsayımları altında modelde olmak için doğru özellikleri seçtiğini (Wainwright aracılığıyla) titizlikle kanıtlanmış garantiler vardır. Bununla birlikte, korelasyon varlığında, gerçek desteğin özelliklerini seçtiği her şey arasında olacak şekilde seçme olasılığı daha yüksek olması için elastik ağa geri dönebiliriz. (Burada ayarlama parametrelerini dikkatle seçmemiz gerektiğini unutmayın.) Ve ayarlama parametresini çapraz doğrulama yoluyla seçtiğimizde tahmin etmek için, elastik ağın kementten daha iyi performans göstermesi sezgisel bir anlam ifade eder - özellikle korelasyon varlığında. .
Tahmin ve bazı formaliteleri bir kenara bırakarak ne öğrendik? Gerçek desteği öğrendik.
Güvenilirlik aralığı
Kement için geçerli çıkarım konusunda son 2 yılda çok şey değiştiğini belirtmek gerekir. Özellikle, Lee, Sun, Sun ve Taylor'un çalışması , seçilen model üzerinde şartlı olarak kement katsayıları için kesin bir çıkarım sağlar. (Gerçek katsayılar için kementteki çıkarım sonuçları OP'nin görev zamanında ortaya çıkmıştır ve bağlantılı makalede iyi özetlenmiştir.)