Biraz daha fazla bilgi; farz et ki
- önceden kaç değişken seçeceğinizi ve LARS prosedüründe karmaşıklık cezasını tam olarak 0 katsayısı olmayan birçok değişkene sahip olacak şekilde ayarladığınızı biliyorsunuz,
- hesaplama maliyetleri bir mesele değildir (toplam değişken sayısı, örneğin 50'dir),
- tüm değişkenlerin (y, x) süreklidir.
Hangi ortamda LARS modeli (yani, LARS uyumunda sıfır olmayan katsayılara sahip değişkenlerin OLS uyumu), aynı sayıda katsayıya sahip olan ancak kapsamlı arama (la regsubsets ()) ile bulunan bir modelden en farklı olurdu?
Düzenleme: Ben 0 'gerçek' katsayıları 0 (ve tüm özellikleri güçlü bir şekilde birbiriyle ilişkili olan) 10 değişken dışında standart bir gaussian çizilmiş gerçek katsayıları ile 50 değişkenler ve 250 gözlem kullanıyorum. Seçilen iki değişken grubu arasındaki farkların çok az olması nedeniyle bu ayarlar kesinlikle iyi değildir. Bu gerçekten en fazla farklılığı elde etmek için ne tür bir veri yapılandırmasının simüle edilmesi gerektiği hakkında bir sorudur.