ve sınıflandırma problemi için iki öğrenme yöntemim olduğunu ve genelleme performanslarını tekrarlanan çapraz doğrulama veya önyükleme gibi bir şeyle tahmin ettiğimi varsayalım. Bu işlemden , bu tekrarlar boyunca her yöntem için ve puanlarının bir dağılımını elde ederim (örneğin, her model için ROC AUC değerlerinin dağılımı).B P A P B
Bu dağılımlara bakıldığında, ancak (yani beklenen genelleme performansı daha yüksek olabilir , ancak bu tahmin hakkında daha fazla belirsizlik vardır).σ A ≥ σ B A B
Bence bu regresyondaki yanlılık sapması ikilemi .
ve karşılaştırmak ve nihayetinde hangi modelin kullanılacağı hakkında bilinçli bir karar vermek için hangi matematiksel yöntemleri kullanabilirim?P B
Not: Basitlik açısından, burada iki ve yöntemine atıfta bulunuyorum , ancak ~ 1000 öğrenme yönteminin (örneğin bir ızgara aramasından) puanlarının dağılımını karşılaştırmak ve sonunda yapmak için kullanılabilecek yöntemlerle ilgileniyorum. hangi modelin kullanılacağına dair nihai bir karar.B