Sınıflandırıcının performansına erişmek için verileri eğitim / test setine bölmem gerektiğini biliyorum. Ama bunu okumak :
Bir SVM için manuel olarak ayarlanması gereken C ayarı gibi tahminciler için farklı ayarlar (“hiperparametreler”) değerlendirilirken, tahminci en iyi şekilde performans gösterene kadar parametreler ayarlanabileceğinden, test setinde aşırı uyum riski vardır. Bu şekilde, test seti hakkındaki bilgi modele “sızabilir” ve değerlendirme metrikleri artık genelleme performansı hakkında rapor vermemektedir. Bu sorunu çözmek için, veri kümesinin yine bir başka kısmı “doğrulama seti” olarak adlandırılabilir: eğitim, eğitim setinde ilerler, daha sonra doğrulama setinde değerlendirme yapılır ve deney başarılı görünüyorsa , son değerlendirme test setinde yapılabilir.
Hiperparametrelerin ayarlanması sırasında test setinin aşırı takılmasıyla gerekçelendirilen başka bir (üçüncü) doğrulama setinin tanıtıldığını görüyorum.
Sorun şu ki, bu aşırı sığmanın nasıl ortaya çıkabileceğini anlayamıyorum ve bu nedenle üçüncü setin gerekçesini anlayamıyorum.