Ortak veri tabanlı değişken seçim prosedürleri (örneğin, ileri, geri, kademeli, tüm alt kümeler) aşağıdakiler dahil olmak üzere istenmeyen özelliklere sahip modeller sağlama eğilimindedir:
- Katsayılar sıfırdan uzağa eğilimlidir.
- Çok küçük olan standart hatalar ve çok dar olan güven aralıkları.
- Reklamı yapılan anlamı olmayan test istatistikleri ve p değerleri.
- Aşırı iyimser olan model tahminleri.
- Anlamsız olabilen dahil edilen terimler (örneğin, düşük dereceli terimlerin hariç tutulması).
Ancak değişken seçim prosedürleri devam etmektedir. Değişken seçimdeki problemler göz önüne alındığında, bu prosedürler neden gerekli? Kullanımlarını ne motive eder?
Tartışmayı başlatmak için bazı öneriler ...
- Yorumlanabilir regresyon katsayıları isteği? (Birçok IV'ün bulunduğu bir modelde yanlış yönlendirilmiş mi?)
- Alakasız değişkenlerin getirdiği varyansı ortadan kaldırmak?
- Bağımsız değişkenler arasında gereksiz kovaryans / fazlalıkları ortadan kaldırın.
- Parametre tahmini sayısını azaltın (güç sorunları, örneklem büyüklüğü)
Diğerleri var mı Değişken seçim teknikleri ile ele alınan problemler, değişken seçim prosedürlerinin ortaya koyduğu problemlerden daha az mı yoksa çok mu önemli? Ne zaman kullanılmalılar? Ne zaman kullanılmamalıdır?