Take-ev-mesajlar:
Maalesef, alıntıladığınız metin yaklaşım 1 ve 2 arasında iki şeyi değiştirir:
- Yaklaşım 2, çapraz doğrulama ve veriye dayalı model seçimi / ayarlama / optimizasyon gerçekleştirir
- Yaklaşım 1'de ne çapraz doğrulama ne de veriye dayalı model seçimi / ayarlama / optimizasyon kullanılmamaktadır.
- Veri odaklı model seçimi / ayarlama / optimizasyon olmadan yaklaşım 3 çapraz doğrulaması burada tartışılan bağlamda mükemmel bir şekilde uygulanabilir (amd IMHO daha fazla kavrayışa neden olur)
- Yaklaşım 4, çapraz doğrulama yok ancak veriye dayalı model seçimi / ayarlama / optimizasyon da mümkündür, ancak daha karmaşık bir yapıya sahiptir.
IMHO, çapraz doğrulama ve veriye dayalı optimizasyon, modelleme stratejinizi oluştururken tamamen farklı (ve büyük ölçüde bağımsız) iki karardır. Sadece bağlantı, optimizasyon için işlevsel bir hedef olarak çapraz doğrulama tahminleri kullanabilirsiniz olmasıdır. Ancak kullanılmaya hazır başka hedef işlevler de var ve çapraz doğrulama tahminlerinin başka kullanımları da var (önemlisi, bunları modelinizin doğrulanması, yani doğrulama veya test için kullanabilirsiniz)
Ne yazık ki, makine öğrenme terminolojisi şu anda yanlış bağlantılar / nedenler / bağımlılıklar öneren bir karmaşa IMHO'dur.
Yaklaşım 3'e baktığınızda (optimizasyon için değil, model performansını ölçmek için çapraz doğrulama), bu bağlamda yanlış bir ikilik olarak tüm veri setinin eğitimine karşı "karar" çapraz doğrulamasını bulacaksınız: Çapraz doğrulamayı kullanırken sınıflandırıcı performansını ölçmek için, liyakat çapraz geçerlilik rakamı, tüm veri seti üzerinde eğitilmiş bir model için tahmin olarak kullanılır. Yani yaklaşım 3, yaklaşım 1'i içerir.
pparametreler / katsayılar, ancak optimizasyonun yaptığı hiperparametreler olarak adlandırılan diğer parametreleri tahmin etmektir. Model uydurma ve optimizasyon / ayarlama işlemini model parametrelerini aramak için tanımlarsanız, bu hiperparametre optimizasyonu çok daha geniş bir arama alanının dikkate alındığı anlamına gelir. Başka bir deyişle, yaklaşım 1 (ve 3) 'te bu hiperparametreleri belirterek arama alanını kısıtlarsınız. Gerçek dünya veri kümeniz, bu sınırlı arama alanına sığacak kadar büyük olabilir (yeterli bilgi içerir), ancak yaklaşımların 2 (ve 4) daha geniş arama alanında tüm parametreleri yeterince iyi düzeltmek için yeterince büyük olmayabilir.
Aslında, benim alanımda sıklıkla veri odaklı optimizasyon düşüncesine izin vermeyecek kadar küçük veri kümeleri ile uğraşmak zorunda kalıyorum. Öyleyse bunun yerine ne yapmalıyım: Hangi modelin veri ve uygulamanın fiziksel doğası ile iyi uyuştuğuna karar vermek için veri ve veri oluşturma süreçleri hakkındaki alan bilgimi kullanıyorum. Bunların içinde hala model karmaşıklığımı kısıtlamam gerekiyor.