Son zamanlarda LSTM'lerle ilgilenmeye başladım ve ağırlıkların zaman içinde paylaşıldığını öğrenmek beni şaşırttı.
Ağırlıkları zaman içinde paylaşırsanız, giriş zamanı dizilerinizin değişken bir uzunluk olabileceğini biliyorum.
Paylaşılan ağırlıklarla antrenman yapmak için daha az parametreye sahipsiniz.
Anladığım kadarıyla, bir başka öğrenme yöntemine karşı bir LSTM'ye dönüşmesinin nedeni, verilerinizde öğrenmek istediğiniz bir tür zamansal / sıralı yapı / bağımlılık olduğuna inanmanızdır. Değişken uzunlukta 'lüks'ü feda ederseniz ve uzun hesaplama süresini kabul ederseniz, paylaşılan ağırlıkları olmayan bir RNN / LSTM (yani farklı ağırlıklara sahip olduğunuz her adımda) yol daha iyi performans göstermez mi yoksa eksik olduğum bir şey var mı?