LSTM, BiLSTM nedir ve ne zaman kullanılır?


11

Derin öğrenme konusunda çok yeniyim ve özellikle LSTM ve BiLSTM'nin ne zaman ve ne zaman kullanılacağını bilmekle ilgileniyorum (büyük uygulama alanları). LSTM ve BILSTM neden RNN'den daha popüler?

Bu derin öğrenme mimarilerini denetimsiz problemlerde kullanabilir miyiz?


2
BiLSTM, çift yönlü LSTM anlamına gelir; bu, sinyalin zamanda geriye ve ileriye doğru yayıldığı anlamına gelir. Bu mimariyi diğer RNN'lere de uygulayabilirsiniz. Ayrıntılar için lütfen en.wikipedia.org/wiki/Bidirectional_recurrent_neural_networks ve colah.github.io/posts/2015-08-Understanding-LSTMs Sitesine Hoşgeldiniz!
Emre

İşte bir yazı , RNN ve LSTM arasındaki fark ve burada LSTM ve Çift Yönlü-LTSM arasındaki farkı göstermek için bir blog
Benyamin Jafari

Yanıtlar:


7

RNNgibi mimariler LSTMve BiLSTMöğrenme problemi bir video var örneğin, sıralı olduğu durumlarda kullanılan ve size bir ajan istediğiniz veya hakkında tüm metin bir görüntü ve sizin için belgenin bir satır okumak için ne olduğunu bilmek istiyorum metin biçiminde değil. Ben çok bakmak teşvik burada .

LSTMsve çift yönlü varyantları popülerdir, çünkü mimarilerinde kapıları nasıl ve ne zaman unutulacağını ve ne zaman kullanmayacağını öğrenmeye çalışmışlardır. Önceki RNNmimarilerde, degradelerin yok edilmesi büyük bir sorundu ve bu ağların çok fazla öğrenmemesine neden oldu.

Çift Yönlü'yi kullanarak LSTMs, öğrenme algoritmasını orijinal verilerle bir kez baştan sona ve bir kez baştan sona beslersiniz. Burada tartışmalar var ama göreve bağlı olmasına rağmen genellikle tek yönlü yaklaşımdan daha hızlı öğreniyor.

Evet, bunları görevinize bağlı olarak denetimsiz öğrenmede de kullanabilirsiniz. buraya ve buraya bir bakın .


1
Harika cevap için çok teşekkürler. NLP'de anahtar kelime çıkarımı için lstm kullanabilir miyiz?
Volka

aslında onlar hakkında çok sayıda makale var, örneğin burada ve burada görebilirsiniz .
Medya

Çok teşekkürler. Sadece kullanabileceğimiz hazır anahtar kelime çıkarma derin öğrenme yaklaşımı olup olmadığını merak ediyorum?
Volka

aslında görmedim, belki sormak daha iyi :)
Media

4

İnsanlar her saniye düşüncelerine sıfırdan başlamazlar. Bu makaleyi okurken, önceki kelimeleri anladığınıza göre her kelimeyi anlarsınız. Her şeyi atmaz ve tekrar sıfırdan düşünmeye başlamazsınız. Düşüncelerinizin sürekliliği var.

Geleneksel sinir ağları bunu yapamaz ve büyük bir eksiklik gibi görünüyor. Örneğin, bir filmin her noktasında ne tür bir olayın olduğunu sınıflandırmak istediğinizi düşünün. Geleneksel bir sinir ağının, filmdeki önceki olaylar hakkındaki düşüncelerini daha sonraları bilgilendirmek için nasıl kullanabileceği belirsizdir.

Tekrarlayan sinir ağları bu sorunu ele almaktadır. Bunlar, içinde döngüler bulunan ve bilginin devam etmesine izin veren ağlardır.

Daha fazla okumak için Cohen'in Bloguna gidin


2

LSTM karşılaştırıldığında, BLSTMya BiLSTMiki ağ, bir erişim vardır pastbilgileri forwardyön ve başka erişime futureiçinde reverseyönünde. WIKI

Yeni bir sınıf Bidirectionalresmi doc başına olarak eklenir burada :

model = Sequential()
model.add(Bidirectional(LSTM(num_channels, 
        implementation = 2, recurrent_activation = 'sigmoid'),
        input_shape=(input_length, input_dim)))

IMDB verilerini kullanan tam örnek şöyle olacaktır

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.