Bir sinir ağını eğitirken ne kadar az eğitim örneği çok azdır?


15

İlk projemi bir araya getirmeye çalışan bir acemiyim. Aklımda bir şarkı sınıflandırma projesi vardı, ancak elle etiketleme yapacağım için, sadece yaklaşık 1000 şarkı veya 60 saatlik müzikleri makul bir şekilde bir araya getirebilirdim.

Birkaç sınıfla sınıflandıracağım, bu yüzden bir sınıfın eğitim setinde 50-100 kadar şarkıya sahip olması mümkündür - bu çok az gibi görünüyor! Bir sinir ağını çalışırken denemek için ne kadar verinin gerekli olduğuna dair genel bir kural var mı?

Edit: Ben bir vanilya LSTM kullanmayı düşünüyordum. Giriş özellikleri 39 boyutuna, çıkış boyutu 6'ya sahip olacak, gizli katman boyutu için ilk girişimim 100 olacaktı.


2
Bu gerçekten sorumlu değildir, çünkü tüm görevler kolay değildir ve farklı ağ mimarileri ve hiperparametre seçimleri farklı modelleri farklı şekillerde iyileştirir / incitir.
Sycorax, Reinstate Monica

En azından ağ yapınızı ve eğitilecek kaç bağlantı olacağını belirtmeniz gerekir.
gung - Monica'yı eski

Yanıtlar:


17

Gerçekten veri kümenize ve ağ mimarisine bağlıdır. Okuduğum bir kural (2), sinir ağının çok iyi performans göstermeye başlaması için sınıf başına birkaç bin örnektir.

Pratikte insanlar dener ve görür. 1000 örnekten daha küçük bir eğitim seti ile iyi sonuçlar veren çalışmalar bulmak nadir değildir.


Daha fazla eğitim örneği almanın ne kadar yararlı olabileceğini kabaca değerlendirmenin iyi bir yolu, sinir ağının performansını eğitim setinin büyüklüğüne göre çizmektir, örneğin (1):

resim açıklamasını buraya girin


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.