Görevin görüntülerden spor ayakkabı türlerini tanımlamak olduğu bir projeye başlıyorum. Şu anda TensorFlow ve Torch uygulamalarını okuyorum . Sorum şu: makul bir sınıflandırma performansına ulaşmak için sınıf başına kaç görüntü gerekiyor?
Görevin görüntülerden spor ayakkabı türlerini tanımlamak olduğu bir projeye başlıyorum. Şu anda TensorFlow ve Torch uygulamalarını okuyorum . Sorum şu: makul bir sınıflandırma performansına ulaşmak için sınıf başına kaç görüntü gerekiyor?
Yanıtlar:
Gönderen bir sinir ağı eğitim, nasıl birkaç eğitim örnekleri çok az mı? CV'de:
Gerçekten veri kümenize ve ağ mimarisine bağlıdır. Okuduğum bir kural (2), sinir ağının çok iyi performans göstermeye başlaması için sınıf başına birkaç bin örnektir. Pratikte insanlar dener ve görür.
Daha fazla eğitim örneği almanın ne kadar yararlı olabileceğini kabaca değerlendirmenin iyi bir yolu, sinir ağının performansını eğitim setinin büyüklüğüne göre çizmektir, örneğin (1):
(2) Cireşan, Dan C., Ueli Meier ve Jürgen Schmidhuber. "Transfer derin sinir ağları ile Latin ve Çince karakterler için öğrenme." 2012 Uluslararası Sinir Ağları Ortak Konferansı'nda (IJCNN), ss. 1-6. IEEE, 2012. https://scholar.google.com/scholar?cluster=7452424507909578812&hl=tr&as_sdt=0,22 ; http://people.idsia.ch/~ciresan/data/ijcnn2012_v9.pdf :
Sınıf başına birkaç bin örnek içeren sınıflandırma görevleri için, (denetimsiz veya denetimli) ön eğitimin faydasını göstermek kolay değildir.
En iyi yaklaşım, elinizden geldiğince fazla veri toplamaktır. Ardından projeye başlayın ve bir veri modeli yapın.
Şimdi modelinizi Yüksek Sapma veya Yüksek Sapma olup olmadığını görmek için değerlendirebilirsiniz .
Yüksek Varyans : Bu durumda, Çapraz Doğrulama hatasının yakınsaklıktan sonra Egzersiz hatasından daha yüksek olduğunu göreceksiniz.
Yüksek Önyargı : Bu durumda Çapraz Doğrulama hatası, eğitim veri boyutuna göre çizildiğinde kendisinin yüksek olduğu eğitim hatasından biraz daha yüksektir. Eğitim veri boyutuna göre çizim yaparak, sahip olduğunuz egzersiz verilerinin alt kümelerini girebilir ve alt küme boyutunu artırmaya devam edebilirsiniz ve çizim hataları.
Modelinizin yüksek varyansa (overfit) sahip olduğunu görürseniz, yeni egzersiz verisi eklemenin yardımcı olmadığı yüksek yanlılık (underfit) modelinin aksine genellikle daha fazla veri eklemek yardımcı olacaktır.
Ayrıca sınıf başına aynı sayıda görüntü elde etmeye çalışmalısınız, aksi takdirde veri kümeleri eğri olabilir (bir türden daha fazla).
Ayrıca ben kullandığınız takdirde önermek TensorFlow , daha hakkında okumak GOOGLE en BAŞLAMA Görüntü Sınıflandırıcı. Google'ın görüntü veritabanında zaten eğitimli bir sınıflandırıcıdır ve resimleriniz için kullanabilirsiniz, bu şekilde görüntü sayısı için gereksinimler önemli ölçüde azalır.