Test verisine EDA uygulamak yanlış.
Eğitim, en iyi modeli oluşturmak için doğru cevapları araştırma sürecidir. Bu işlem sadece eğitim verileri üzerinde kod çalıştırmakla sınırlı değildir. Hangi modelin kullanılacağına karar vermek, parametreleri değiştirmek vb. İçin EDA'dan gelen bilgileri kullanmak eğitim sürecinin bir parçasıdır ve bu nedenle test verilerine erişmesine izin verilmemelidir. Kendinize karşı dürüst olmak için test verilerini yalnızca modelinizin performansını kontrol etmek için kullanın.
Ayrıca, modelin test sırasında iyi performans göstermediğini fark ederseniz ve sonra modelinizi ayarlamaya geri dönerseniz, bu da iyi değildir. Bunun yerine, egzersiz verilerinizi ikiye bölün. Birini eğitim için, diğerini modelinizi test etmek ve değiştirmek için kullanın. Bkz. Test seti ile doğrulama seti arasındaki fark nedir?