LSTM'leri denemek için theano kullanıyorum ve LSTM'ler için hangi optimizasyon yöntemlerinin (SGD, Adagrad, Adadelta, RMSprop, Adam, vb.) En iyi sonucu merak ediyordum? Bu konuda herhangi bir araştırma makalesi var mı?
Ayrıca, cevap LSTM için kullandığım uygulamanın türüne bağlı mı? Eğer öyleyse, metin sınıflandırma (metnin ilk kelime vektörlerine dönüştürüldüğü yer) için LSTM'ler kullanıyorum.
Son olarak, cevaplar RNN'ler için aynı mı yoksa farklı mı? Araştırma makaleleri veya kişisel bilgiler için herhangi bir işaretçi takdir edilecektir!
LSTM'ler oldukça güçlü görünüyor ve onları en iyi nasıl kullanacakları hakkında daha fazla bilgi edinmek istiyorum.