LASSO regresyonu katsayıları sıfıra doğru küçültür, böylece etkin model seçimi sağlar. Verilerimde nominal ve sürekli değişkenler arasında anlamlı etkileşimler olduğuna inanıyorum. Bununla birlikte, zorunlu olarak, gerçek modelin 'sıfır etkisi olmayan' ana etkileridir. Tabii ki, gerçek model bilinmediğinden bunu bilmiyorum. Hedeflerim gerçek modeli bulmak ve sonucu mümkün olduğunca yakın tahmin etmektir.
Model kurma konusundaki klasik yaklaşımın, etkileşim dahil edilmeden önce her zaman temel bir etki içereceğini öğrendim . Dolayısıyla , aynı modelde eş değişkenler bir etkileşimi varsa , iki değişken ve ana etkisi olmayan bir model olamaz . Sonuç olarak işlev, bu kurala uyan model terimlerini (örn. İleri veya geri AIC'ye dayanarak) dikkatlice seçer.Z X ∗ Zstep
R
LASSO farklı çalışıyor gibi görünüyor. Tüm parametreler cezalandırıldığından şüphesiz, ana etkinin sıfıra çekilmesi olur, oysa en iyi (örneğin çapraz onaylanmış) modelin etkileşimi sıfır değildir. Kullanılırken bu benim veriler için özellikle bulmak R
'ın glmnet
paketi.
Yukarıda belirtilen ilk kurala dayanarak eleştiri aldım, yani çapraz onaylanmış son Kement modelim, sıfır olmayan etkileşimin karşılık gelen ana etki terimlerini içermiyor. Ancak bu kural bu bağlamda biraz garip görünüyor. Asıl soru, gerçek modeldeki parametrenin sıfır olup olmadığı sorusudur. Diyelim ki etkileşim ancak sıfır değil, o zaman LASSO bunu tanımlayacak ve doğru modeli bulacaktır. Aslında, bu modelden tahminler daha kesin olacak gibi görünüyor çünkü model etkili bir gürültü değişkeni olan gerçek sıfır temel etkiyi içermiyor.
Bu temele dayanan eleştiriyi reddedebilir miyim ya da bir şekilde LASSO'nun etkileşim döneminden önceki ana etkiyi içerdiğine dair önlem almalı mıyım?