Çapraz Doğrulama ile Doğrusal Model Seçimi adlı makalesinde , Jun Shao, çok değişkenli doğrusal regresyonda değişken seçimi problemi için, bir kez dışarıda bırakılma çapraz doğrulama yönteminin (LOOCV) 'asimptotik olarak tutarsız' olduğunu göstermektedir. Düz İngilizce olarak, çok değişkenli modelleri seçme eğilimindedir. Bir simülasyon çalışmasında, Shao, en az 40 gözlem için bile, LOOCV'nin diğer çapraz doğrulama tekniklerinden daha iyi performans gösterdiğini göstermektedir.
Bu makale biraz tartışmalı ve biraz göz ardı edildi (yayınlanmasından 10 yıl sonra, kemometri meslektaşlarım bunu hiç duymamıştı ve LOOCV'yi değişken seçim için mutlu bir şekilde kullanıyorlardı ...). Ayrıca, sonuçlarından orijinal sınırlı kapsamın biraz ötesine uzandığına dair bir inanç da var.
O zaman soru şu: Bu sonuçlar ne kadar uzuyor? Aşağıdaki problemlere uygulanabilir mi?
- Lojistik regresyon için değişken seçimi / GLM?
- Fisher LDA sınıflandırması için değişken seçim?
- Sonlu (veya sonsuz) çekirdek alanlı SVM kullanarak değişken seçim?
- Sınıflandırmadaki modellerin karşılaştırılması, farklı çekirdeklerin kullanıldığı SVM mi?
- Lineer regresyondaki modellerin karşılaştırılması, MLR'nin Ridge Regression ile karşılaştırılması?
- vb.