Cezalandırılan R paketini , çok sayıda tahmin ediciye ve hangilerinin önemli olduğuna dair çok az bilgiye sahip olduğum bir veri kümesi için küçültülmüş katsayı tahminleri elde etmek için kullanıyorum. L1 ve L2 ayarlama parametrelerini seçtikten ve katsayılarımdan memnun kaldıktan sonra, modelin R-kare gibi bir şeyle özetlenmesinin istatistiksel olarak sağlam bir yolu var mı?
Ayrıca, modelin genel önemini test etmekle ilgileniyorum (yani R² = 0 mı, yoksa tüm = 0'ı mı yapıyor).
Burada sorulan benzer bir sorunun cevabını okudum , ama soruma cevap vermedi. Orada kullanıyorum o R paketi üzerinde mükemmel bir öğretici var burada ve yazar Jelle Goeman cezalandırılmış regresyon modellerinden güven aralıkları ile ilgili öğretici sonuna aşağıdaki notu vardı:
Regresyon katsayılarında veya diğer tahmini miktarlarda standart hatalar istemek çok doğal bir sorudur. Prensip olarak, bu tür standart hatalar, örneğin bootstrap kullanılarak kolayca hesaplanabilir.
Yine de, bu paket kasıtlı olarak bunları sağlamaz. Bunun nedeni, standart hataların cezalandırılmış tahmin yöntemlerinden kaynaklanan kuvvetli önyargılı tahminler için çok anlamlı olmamasıdır. Cezalandırılmış tahmin, önemli önyargı getirerek tahmin edicilerin varyansını azaltan bir prosedürdür. Bu nedenle, her bir kestiricinin sapması, ortalama kare hatasının önemli bir bileşenidir, ancak varyansı sadece küçük bir kısma katkıda bulunabilir.
Ne yazık ki, cezalandırılmış regresyon uygulamalarının çoğunda önyargı hakkında yeterince kesin bir tahmin elde etmek imkansızdır. Herhangi bir önyükleme tabanlı hesaplama yalnızca tahminlerin varyansını değerlendirebilir. Önyargıya ilişkin güvenilir tahminler, ancak cezai tahminlerin kullanıldığı durumlarda genellikle geçerli olmayan güvenilir tarafsız tahminler varsa kullanılabilir.
Dolayısıyla cezalandırılmış bir tahminde standart bir hata bildirilmesi hikayenin sadece bir kısmını anlatır. Yanlılıktan kaynaklanan yanlışlığı tamamen göz ardı ederek, yanlış bir yanlış izlenim verebilir. Sadece bootstrap tabanlı güven aralıkları gibi tahminlerin varyansının değerlendirilmesine dayanan güven ifadeleri yapmak kesinlikle bir hatadır.