Bu gerçekten sahip olduğunuz veri miktarına, yöntemlerin belirli maliyetine ve sonucunuzun tam olarak nasıl olmasını istediğinize bağlıdır.
Bazı örnekler:
Verileriniz çok azsa, muhtemelen çapraz doğrulamayı kullanmak istersiniz (k-kat, bir defa bırakma, vb.) Modeliniz muhtemelen zaten eğitmek ve test etmek için çok fazla kaynak almayacaktır. Verilerinizden en iyi şekilde yararlanmanın iyi yolları
Çok fazla veriniz var: Muhtemelen oldukça büyük bir test seti almak istiyorsunuz ve bazı garip örneklerin sonuçlarınıza çok fazla değişiklik gösterme olasılığının çok az olmasını sağlayacaksınız. Ne kadar veri almalısınız? Tamamen verilerinize ve modelinize bağlıdır. Örneğin konuşma tanımada, çok fazla veri alırsanız (diyelim ki 3000 cümle), deneyleriniz günler alacaktır, çünkü gerçek zamanlı bir 7-10 faktörü yaygındır. Çok az alırsanız, seçtiğiniz hoparlörlere çok fazla bağımlıdır (eğitim setinde izin verilmez).
Unutmayın, birçok durumda bir doğrulama / geliştirme ayarlaması da iyidir!