Şu anda kabul edilen cevabın talihsiz bir şekilde eksik olduğunu düşünüyorum. Cümleyi kabul etmiyorum
Çapraz validasyonun amacı, her bir kattan öğrendiğimiz popülasyon örneklerinde genelleme yapan öğrenme parametrelerini tanımlamaktır.
Bu gerçekten de çapraz doğrulamanın çok önemli bir uygulamasıdır, ancak tek geçerli değildir. Genellikle, iki şey yapmak istersiniz:
- Mümkün olan en iyi modeli oluşturun
- Ne kadar iyi performans gösterdiğine dair doğru bir izlenim edinin
Şimdi, algoritmanıza bağlı olarak hedef 1'i tamamlamak için bazı hiperparametreleri ayarlamanız gerekebilir ve bu genellikle çapraz doğrulama ile yapılır. Ancak bu henüz hedef 2 ile size yardımcı olmaz. Bunun için çapraz doğrulamayı temel olarak şu şekilde iç içe yerleştirmeniz gerekir:
- Tüm verileri n katlara ayırın
- Her biri için egzersiz verilerini tekrar alt katmanlara ayırın
- İyi hiperparametreleri öğrenmek için alt klasörlerde çapraz doğrulamayı kullanın
- Bu hiperparametre ile bu katın eğitim verilerine bir model oluşturun
- Modeli test verilerinde test edin
- Bir sonraki katlamada tekrarlayın
İyi bir model oluşturmak için sadece iç çapraz doğrulamaya ihtiyacınız vardır. İyi bir model almak için yine de yapmanız gerekecek. Ancak, model performansınıza ilişkin iyi bir tahmin elde etmek için, model oluşturma sürecinin tamamını çapraz doğrulama şeması içinde gerçekleştirmeniz gerekir. Bu aynı zamanda itfa, vb. Gibi adımları da içerir.