Birkaç farklı sınıflandırıcıyı eğitebileceğiniz veya birkaç farklı özellik çıkarma yöntemi kullanabileceğiniz birçok durum vardır. Literatürde yazarlar sıklıkla verinin bir rasgele bölmeleri kümesi (yani iki kat yuvalanmış çapraz doğrulama sonrasında) üzerinde ortalama sınıflandırma hatası verir ve bazen de bölmeler üzerindeki hata üzerinde değişiklikler yapar. Bununla birlikte, bu kendi başına bir sınıflandırıcının diğerinden önemli ölçüde daha iyi olduğunu söylemek için tek başına yeterli değildir. Buna birçok farklı yaklaşım gördüm - Ki-kare testleri, t-testi, post-hoc testi ile ANOVA.
İstatistiksel önemi belirlemek için hangi yöntem kullanılmalıdır? Bu sorunun altında yatan şey: Sınıflandırma puanlarının dağılımı hakkında ne gibi varsayımlarda bulunmalıyız?