Tahmin veya tahminle değil, yalnızca model parametrelerini tahmin etmek (ve yorumlamak) ile ilgileniyorsak, düzenlileştirme yardımcı olabilir mi?
Amacınız yeni veriler üzerinde iyi tahminler yapmaksa, normalleştirme / çapraz doğrulamanın son derece yararlı olduğunu görüyorum. Peki ya geleneksel ekonomi yapıyorsanız ve tek umduğunuz şey tahmin etmek ? Çapraz doğrulama da bu bağlamda faydalı olabilir mi? Karşılaştığım kavramsal zorluk , test verilerinde aslında hesaplayabileceğimiz, ancak asla çünkü gerçek tanım gereği asla gözlemlenmez. (Hatta gerçek bir olduğu varsayımına göre , yani verilerin oluşturulduğu model ailesini bildiğimizi düşünün.)L ( Y , Y ) L ( β , β ) β β
Kaybınız olduğunu varsayalım . Önyargı-varyans dengesiyle karşılaşıyorsunuz, değil mi? Yani, teorik olarak, bazı düzenlileştirme yapmak daha iyi olabilir. Peki, normalleştirme parametrenizi nasıl seçebilirsiniz?
Ben katsayıları ile, doğrusal regresyon modelinin basit bir sayısal örnek görmek mutluluk duyarım , araştırmacının kayıp fonksiyonu örn olduğunu , hatta sadece . Uygulamada, bu örneklerde beklenen kaybı iyileştirmek için çapraz doğrulama nasıl kullanılabilir?
Düzenleme : DJohnson beni bu soru ile ilgili olan https://www.cs.cornell.edu/home/kleinber/aer15-prediction.pdf adresine yönlendirdi . Yazarlar bunu yazar
Makine öğrenimi teknikleri ... 'ı tahmin etmek için disiplinli bir yol sağlar ki bu (i) önyargı-varyans değişiminin nasıl yapılacağına karar vermek için verilerin kendisini kullanır ve (ii) çok zengin bir dizi değişkenler ve fonksiyonel formlar. Ancak her şeyin bir bedeli vardır: \ hat {Y} için ayarlandıkları için (birçok varsayım olmadan) \ hat {\ beta} için çok yararlı garantiler vermediklerini her zaman akılda tutmak gerekir .
Yine ilgili başka bir makale, yine DJohnson sayesinde: http://arxiv.org/pdf/1504.01132v3.pdf . Bu makale yukarıda mücadele ettiğim soruyu ele almaktadır:
Hazır ... regresyon ağaçları gibi makine öğrenme yöntemlerini nedensel çıkarım sorununa uygulamak için temel bir zorluk, çapraz validasyona dayanan düzenlileştirme yaklaşımlarının tipik olarak “temel gerçeği” gözlemlemeye, yani gerçek sonuçlara dayanmasıdır. çapraz doğrulama örneğinde. Bununla birlikte, amacımız ortalama kare tedavi etkileri hatasını en aza indirmekse, [11] “nedensel çıkarımın temel sorunu” olarak adlandırdığımız şeyle karşılaşırız: nedensel etki herhangi bir birim için gözlenmez ve bu yüzden doğrudan temel hakikati olmak. Bunu, tedavinin nedensel etkisinin ortalama kare hatasının tarafsız tahminlerini oluşturmak için yaklaşımlar önererek ele alıyoruz.