LASSO regresyonu konusundaki anlayışım, minimizasyon problemini çözmek için regresyon katsayılarının seçildiğidir:
Uygulamada bu, bir Lagrange çarpanı kullanılarak yapılır ve sorunu çözme
ve t arasındaki ilişki nedir ? Vikipedi yararsız bir şekilde "verilere bağlı" olduğunu belirtir.
Neden umursayayım? İlk olarak entelektüel merak için. Ama aynı zamanda çapraz onaylama ile \ lambda'yı seçmenin sonuçları hakkında endişeliyim .
Özellikle, n-kat çapraz doğrulaması yapıyorsam, eğitim verilerimin n farklı bölümüne n farklı model uyuyorum. Daha sonra belirli bir \ lambda için kullanılmayan verilerdeki modellerin her birinin doğruluğunu karşılaştırırım . Ancak aynı \ lambda , verilerin farklı alt kümeleri için farklı bir kısıtlama ( ) anlamına gelir (yani, "verilere bağımlıdır").
En iyi önyargı doğruluğu değişimini sağlayan t'yi bulmak için gerçekten çözmek istediğim çapraz doğrulama sorunu değil mi?
Ben hesaplayarak pratikte bu etkinin boyutunun kaba bir fikir edinebilirsiniz her çapraz doğrulama bölünme ve için ve elde edilen dağılım bakarak. Bazı durumlarda, zımni kısıtlama ( ) çapraz doğrulama alt kümelerimde büyük ölçüde değişebilir. Burada esasen cinsinden varyasyon katsayısını kastediyorum .