Gördüğüm kadarıyla, bu konuda görüşler farklılaşıyor. En iyi uygulama, kesinlikle çapraz doğrulama kullanarak (özellikle de RF'leri aynı veri setindeki diğer algoritmalarla karşılaştırıyorsanız) kullanmaya zorlayacaktır. Öte yandan, orijinal kaynak OOB hatasının model eğitimi sırasında hesaplanmasının test set performansının bir göstergesi için yeterli olduğunu belirtmektedir. Trevor Hastie bile, nispeten yakın tarihli bir görüşmede "Rastgele Ormanların serbest çapraz doğrulama sağladığını" söylüyor. Sezgisel olarak, eğer bir veri setinde RF tabanlı bir modeli eğitmek ve geliştirmek için çalışıyorsa, bu bana mantıklı geliyor.
Birisi lütfen rastgele ormanlarla çapraz doğrulama ihtiyacına yönelik ve aleyhindeki argümanları ortaya koyabilir mi?