Sınıflandırma problemi için hangi model çapraz doğrulamayı seçeceğinizi merak ediyorum: K-katlamalı veya rastgele alt örnekleme (bootstrap örneklemesi)?
En iyi tahminim, veri setinin 2 / 3'ünü (~ 1000 öğedir) ve 1/3'ü doğrulama için kullanmaktır.
Bu durumda K-katlama sadece üç iterasyon (katlama) verir, bu da kararlı ortalama hatayı görmek için yeterli değildir.
Öte yandan rastgele alt örnekleme özelliğini sevmiyorum: bazı öğeler eğitim / doğrulama için seçilmeyecek ve bazıları birden fazla kullanılacak.
Kullanılan sınıflandırma algoritmaları: rastgele orman ve lojistik regresyon.