ASL (Amerikan İşaret Dili) Hareketlerini sınıflandırmak için bir jest tanıma sistemi oluşturmaya çalışıyorum, bu yüzden girdim bir kameradan veya video dosyasından kare dizisi olması gerekiyordu, ardından diziyi algılıyor ve karşılık gelenlerle eşleştiriyor sınıf (uyku, yardım, yemek, koş, vb.)
Şey, zaten benzer bir sistem oluşturdum ama statik görüntüler için (hareket dahil değil), sadece bir CNN oluşturmanın elin çok fazla hareket etmediği ve veri kümesi yapısı da keras kullanırken yönetilebilirdi ve belki de hala bunu yapmak niyetindeydim (her klasör belirli bir işaret için bir dizi resim içeriyordu ve klasörün adı bu işaretin sınıf adıdır örn. A, B, C , ..)
Benim buradaki soru, ben içine girdi bunu yapabilmek için benim veri kümesini düzenleyebilirsiniz nasıl RNN keras içinde ve hangi belirli işlevleri ben etkili Modelimin ve gerekli parametreleri yetiştirmek için kullanması gereken, bazı insanlar kullanılarak önerdi TimeDistributed sınıfını ama yok benim lehime nasıl kullanılacağına dair net bir fikre sahip olun ve ağdaki her katmanın giriş şeklini dikkate alın.
Ayrıca benim veri seti görüntülerinin oluşacak düşünüyor, muhtemelen kıvrımlı bir katman gerekir, nasıl birleştirmek mümkün olacağını dönüşüm içine katman LSTM (Acımasız kod açısından) one.
Örneğin, veri setimin böyle bir şey olduğunu hayal ediyorum
'Çalıştır' adlı klasör 1, 2 ve 3 olmak üzere 3 klasör içerir, her klasör dizideki karesine karşılık gelir
Yani Run_1 ilk kare için görüntülerin bazı dizi içerecektir, Run_2 ikinci çerçeve ve için Run_3 üçte benim modelin amacı sözcüğü çıktı bu sekans ile eğitilecek olan Run .