Keras paketi hakkındaki bilgilerimi genişletiyorum ve mevcut bazı modellerle çalışıyorum. Çözmeye çalıştığım ve farklı modeller uyguladığım bir NLP ikili sınıflandırma sorunum var.
Bazı sonuçlarla çalıştıktan ve LSTM hakkında daha fazla okuduktan sonra, bu yaklaşım denediğim her şeyden (birden çok veri kümesinde) çok daha üstün görünüyor. "Ne zaman neden / kendi kendime düşünmeye devam değil LSTM kullanabilir?". LSTM'ye özgü ek kapıların kullanımı, yok olan gradyanlardan muzdarip bazı modellere sahip olduktan sonra benim için mükemmel bir anlam ifade ediyor.
Peki LSTM ile yakalama nedir? Nerede bu kadar iyi yapmıyorlar? Ben "tek beden herkese uyar" algoritması diye bir şey olmadığını biliyorum, bu yüzden LSTM için bir dezavantajı olmalıdır.