Rastgele ormanlarda oldukça yeniyim. Geçmişte, hep doğruluğunu karşılaştırdık testi vs oturması karşı trenle vs oturması herhangi overfitting algılamak için. Ama burada sadece şunu okudum :
"Rasgele ormanlarda, test seti hatasının tarafsız bir tahminini elde etmek için çapraz validasyona veya ayrı bir test setine gerek yoktur. Dahili olarak, çalışma sırasında tahmin edilir ..."
Yukarıdaki küçük paragraf Torbadaki (oob) hata tahmini Bölümü altında bulunabilir. Bu Çanta Dışı Hatası kavramı benim için tamamen yeni ve biraz kafa karıştırıcı olan şey, modelimdeki OOB hatasının nasıl% 35 (veya% 65 doğruluk) olduğu, ancak yine de verilerime çapraz doğrulama uygularsam (sadece basit bir kısıtlama) yöntem) ve her iki karşılaştırma testi karşı uyum karşı tren karşı uyum I sırasıyla% 65 akıcı ve% 96 doğruluk elde. Benim tecrübelerime göre, bu aşırı uydurma olarak kabul edilir, ancak OOB, tıpkı test ve test hatasım gibi% 35 hata tutar . Aşırı takılıyor muyum? Rastgele ormanlarda aşırı sığdırma olup olmadığını kontrol etmek için çapraz doğrulama kullanmalı mıyım?
Kısacası, benim uyum vs tren benim aşırı uydurma gösterdiğinde test seti hatası tarafsız bir hata almak için OOB güvenmek gerekir emin değilim!