Tabii ki (çift) yeniden örnekleme için bölme oranlarına karar vermelisiniz ...
Bununla birlikte, yeniden örnekleme, aklınızda bulundurursanız genellikle oldukça geniş bir bölünme oranları aralığında çalışır
- olası farklı koşuların sayısını azaltacaksa, bir kez bırakma
- en içteki eğitim setinde yeterli eğitim vakası bırakın, böylece algoritma yararlı bir model üretmek için iyi bir şansa sahiptir.
- ne kadar bağımsız vakalarınız varsa, bu düşünceler o kadar az önemlidir.
Ve ya 10000 <N <1000000 gibi daha büyük ölçekli verilerde (ancak büyük verilerde değil) çalışıyorsanız?
Yeniden örneklemenin gerekli olduğundan emin değilseniz ne yapabilirsiniz: birkaç kez yeniden örnekleyin. Yeter ki yeniden örneklemenin gerekli olup olmadığını ölçebilirsiniz.
- tahminlerinizin istikrarını kontrol edin
- model parametrelerinizin kararlılığını kontrol edin
Bu sonuçlarla, daha fazla yeniden örnekleme yinelemesi eklemeniz gerekip gerekmediğine veya her şeyin olduğu gibi iyi olup olmadığına karar verebilirsiniz.