Çapraz doğrulama amacını anlamada hala bir şeylerin eksik olduğunu düşünüyorum.
Bazı terminolojiyi açıklığa kavuşturalım, genel olarak 'bir model' dediğimizde, bazı girdi verilerinin tahmin etmeye çalıştığımızla nasıl ilişkili olduğunu açıklamak için özel bir metoda atıfta bulunuruz. Genel olarak, bu yöntemin belirli örneklerine farklı modeller olarak atıfta bulunmayız. Yani 'Doğrusal bir regresyon modelim var' diyebilirsiniz, ancak iki farklı eğitimli katsayı kümesi farklı modeller demezsiniz. En azından model seçimi bağlamında değil.
Bu nedenle, K-fold cross validation yaptığınızda, modelinizin bazı veriler tarafından ne kadar iyi eğitilebileceğini test ediyor ve sonra görmediği verileri tahmin ediyorsunuz. Bunun için çapraz onaylama kullanıyoruz, çünkü elinizdeki tüm verileri kullanarak eğitim yaparsanız, test için hiçbir kalmanız kalmaz. Bunu bir kez yapabilir, eğitmek için verilerin% 80'ini ve test etmek için% 20'sini kullanarak söyleyebilirsiniz, ancak test etmek için seçtiğiniz% 20'nin özellikle kolay (ya da özellikle zor) bir sürü nokta içermesi durumunda tahmin etmek? Modelleri öğrenmek ve tahmin etmek için mümkün olan en iyi tahmini bulamayacağız.
Tüm verileri kullanmak istiyoruz. Yukarıdaki 80/20'lık bir bölünme örneğine devam etmek için, verinin% 80'inde modeli 5 kez eğitip% 20'sinde test ederek 5 kat çapraz doğrulama yaparız. Her veri noktasının bir kez ayarlanan% 20 testinde sona ermesini sağlıyoruz. Bu nedenle, modelimizin bazı verilerden öğrenme ve yeni verileri öngörme görevini ne kadar iyi yerine getirdiğinin anlaşılmasına katkıda bulunmak için her veri noktasını kullandık.
Ancak, çapraz onaylamanın amacı nihai modelimizi bulmak değildir. Eğitimli modelimizin bu 5 örneğini gerçek bir tahmin yapmak için kullanmıyoruz. Bunun için mümkün olan en iyi model ile gelip bütün verileri kullanmak istiyoruz. Çapraz doğrulama işleminin amacı, model oluşturma değil, model kontrolüdür.
Şimdi, iki modelimiz olduğunu söyleyin, doğrusal regresyon modeli ve sinir ağını söyleyin. Hangi modelin daha iyi olduğunu nasıl söyleyebiliriz? K-kat çapraz onaylama yapabilir ve hangisinin test ayar noktalarını tahmin etmekte daha iyi olduğunu görebiliriz. Ancak, daha iyi performans gösteren modeli seçmek için çapraz doğrulama kullandığımızda, bu modeli (doğrusal regresyon veya sinir ağı olsun) tüm veriler üzerinde eğitiriz. Nihai kestirim modelimiz için çapraz doğrulama sırasında eğittiğimiz gerçek model örneklerini kullanmıyoruz.
Önyükleme toplaması adı verilen (genellikle 'torbalama' olarak kısaltılmış) bir teknik olduğunu, bir grup model oluşturmak için çapraz onaylamaya benzer şekilde üretilen model örneklerini bir şekilde kullandığını, ancak bu kapsamın ötesinde gelişmiş bir teknik olduğunu unutmayın. Buradaki sorunuzun.