«lstm» etiketlenmiş sorular

Uzun Kısa Süreli Bellek (LSTM), rasgele bir süre için bir değeri hatırlayabilen tekrarlayan NN blokları içeren bir sinir ağı mimarisidir.

2
LSTM ünitelerine sahip RNN'ler neden “patlayan gradyanlardan” muzdarip olabilir?
RNN'lerin (ve özellikle LSTM üniteleri ile) nasıl çalıştığı hakkında temel bilgiye sahibim. Değerlerin akışını düzenleyen bir hücre ve birkaç kapı olan bir LSTM biriminin mimarisi hakkında resimsel bir fikrim var. Bununla birlikte, görünüşe göre, LSTM'nin geleneksel bir RNN zaman içinde geri yayılım kullanarak, eğitim sırasında ortaya çıkan "yok olan ve …

2
LSTM kullanarak dil modelleme görevlerinde bilinmeyen kelimeleri işleme
Doğal bir dil işleme (NLP) görevi için sözcükler için gömme olarak genellikle word2vec vektörleri kullanılır. Bununla birlikte, word2vec vektörleri tarafından yakalanmayan birçok bilinmeyen kelime olabilir, çünkü bu kelimeler eğitim verilerinde yeterince sık görülmemektedir (birçok uygulama, kelimeye bir kelime eklemeden önce minimum sayıyı kullanır). Bu, özellikle kelimelerin genellikle yanlış yazıldığı Twitter'dan …

1
ARIMA vs LSTM kullanarak zaman serisi tahmini
Karşılaştığım sorun zaman serisi değerlerini tahmin etmektir. Bir seferde bir seferlik serilere bakıyorum ve örneğin giriş verilerinin% 15'ine dayanarak gelecekteki değerlerini tahmin etmek istiyorum. Şimdiye kadar iki modele rastladım: LSTM (uzun kısa süreli bellek; tekrarlayan sinir ağları sınıfı) ARİMA İkisini de denedim ve onlarla ilgili bazı makaleler okudum. Şimdi ikisini …

3
Tekrarlayan Sinir Ağının Yapısı (LSTM, GRU)
RNN'lerin mimarisini anlamaya çalışıyorum. Çok yardımcı olan bu öğreticiyi buldum: http://colah.github.io/posts/2015-08-Anlama-LSTMs/ Özellikle bu görüntü: Bu, ileri beslemeli bir ağa nasıl uyar? Bu görüntü her katmandaki başka bir düğüm mü?

1
LSTM topolojisini anlama
Diğerleri olduğundan, ilgili kaynaklar buldum burada ve burada LSTM hücrelerini anlamak için gayet yararlı olduğu. Değerlerin nasıl aktığını ve güncellendiğini anladığımdan eminim ve söz konusu "gözetleme deliği bağlantılarını" vb. Benim örnekte, her adımda uzunlukta bir giriş vektörü vardır ive uzunluktaki bir çıkış vektörü oburada, o < i. Her iki sayfanın …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.