Birkaç gün önce ilgili referansa sahip benzer bir soru vardı:
- Belloni, A., Chernozhukov, V. ve Hansen, C. (2014) "Yüksek Boyutlu Kontroller Arasında Seçimden Sonra Tedavi Etkileri Üzerine Çıkarım", Ekonomik Çalışmaların Gözden Geçirilmesi, 81 (2), s. 608-50 ( bağlantı )
En azından benim için makale oldukça zor bir okuma çünkü bu nispeten basit olanın ardındaki kanıtlar oldukça ayrıntılı. gibi bir modeli tahmin etmek istediğinizde
yben= α Tben+ X'benβ+ ϵben
burada sonucunuz, ilgilenilen bir tedavi etkisidir ve potansiyel kontrollerin bir vektörüdür. Hedef parametre . Sonuçlarınızdaki varyasyonların çoğunun tedavi ve seyrek kontrollerle açıklandığı varsayılarak, Belloni ve ark. (2014), doğru nokta tahminleri ve geçerli güven aralıkları sağlayan çift-sağlam bir seçim yöntemi geliştirmiştir. Ancak bu azlık varsayımı önemlidir.ybenTbenXbenα
Eğer birkaç önemli belirleyicilerini içeren ama onlar (ya tek değişkenler, onların daha yüksek dereceden polinomlar veya diğer değişkenlerle etkileşim) hangi bilmiyorum, bir üç adım seçme işlemlerini gerçekleştirebilir:Xbenyben
- , karelerini ve etkileşimlerini gerileme ve kullanarak önemli tahmincileri seçmeybenXben
- regress üzerinde Kement kullanarak kendi kareler ve etkileşimler ve seçmek önemli belirleyicilerTbenXben
- gerileme üzerinde ilk iki adım her iki seçildi ve tüm değişkenlerinybenTben
Bunun neden işe yaradığına ve neden bu yöntemden doğru güven aralıkları vb. Aldığınıza dair kanıtlar sağlarlar. Ayrıca, sadece yukarıdaki regresyon üzerinde bir LASSO seçimi yaparsanız ve daha sonra tedavinin sonucunu ve seçilen değişkenleri geri çekerseniz, Björn'in zaten söylediği gibi yanlış nokta tahminleri ve yanlış güven aralıkları aldığınızı gösterirler.
Bunu yapmanın amacı iki yönlüdür: Değişken seçiminin sezgi veya teori tarafından yönlendirildiği ilk modelinizi çift güçlü seçim modeliyle karşılaştırmak, ilk modelinizin ne kadar iyi olduğu hakkında bir fikir verir. Belki de ilk modeliniz bazı önemli kare veya etkileşim terimlerini unutmuş ve dolayısıyla yanlış tanımlanmış fonksiyonel form veya atlanmış değişkenlerden muzdariptir. İkinci olarak, Belloni ve ark. (2014) yöntemi, fazladan regresörler prosedürlerinde cezalandırıldığı için hedef parametrenizdeki çıkarımı artırabilir.