Özellik sayısı ile "sağlam" bir sınıflayıcı yetiştirmek için gereken gözlem sayısı arasındaki ilişki hakkında herhangi bir makale / kitap / fikir var mı?
Örneğin, bir eğitim seti olarak iki sınıftan 1000 özellik ve 10 gözlem, ve bir test seti olarak diğer 10 gözlemim olduğunu varsayalım. Bazı sınıflandırıcı X'i eğitiyorum ve test setinde bana% 90 hassasiyet ve% 90 özgüllük sağlıyor. Diyelim ki bu doğruluktan memnunum ve bunun iyi bir sınıflandırıcı olduğunu söyleyebilirim. Öte yandan, sadece 10 puan kullanarak 1000 değişkenlik bir fonksiyona yaklaştım.