Ön işleme veya imputing işleminden önce bölmelisiniz.
Eğitim ve test seti arasındaki ayrım, geçmiş bilgilerinizin olduğu ve gelecekteki henüz bilinmeyen bilgiler üzerinde test edeceğiniz bir model oluşturduğunuz durumu çoğaltma girişimidir: eğitim seti geçmişin yerini alır ve test seti alır geleceğin yeri, böylece eğitimli modelinizi sadece bir kez test edebilirsiniz.
Geçmiş / gelecekteki benzetmeyi akılda tutmak, bu, verilerinizi önceden işlemek veya işlemek için, eksik değerleri ima etmek gibi yaptığınız her şeyin, tek başına ayarlanan eğitimde yapmanız gerektiği anlamına gelir. Daha sonra test setinizin de ön işleme veya imaya ihtiyacı varsa eğitim setinize ne yaptığınızı hatırlayabilirsiniz, böylece her iki sette de aynı şekilde yapabilirsiniz.
Yorumlardan eklendi: Eğitim verilerini etkilemek için test verilerini kullanıyorsanız, modelinizi oluşturmak için test verileri kullanılır, bu nedenle test verisi olmaktan çıkar ve modelinizin adil bir testini sağlamaz. Aşırı takılma riskiniz var ve bunu test verilerini ilk etapta ayırmanızın cesaretini kırmaktı.