Tekrarlayan sinir ağları sekans sınıflandırması için nasıl kullanılabilir?


19

RNN, tahmin veya sekanstan sekansa eşleme için kullanılabilir. Fakat RNN sınıflandırma için nasıl kullanılabilir? Demek istediğim, bütün diziye bir etiket veriyoruz.


Önceki terimi kullanarak bir sonraki terimi tahmin etmeye çalışırdım. Daha sonra girişleri serinin tahmin hataları olan ve çıkışları sınıf etiketleri olan bir radyal temel fonksiyona (3 * classlabelcount veya gaussian pdf nöronları) yerleştiririm. Giriş katmanında iyi sayıda nöron olurdu - dizinin kaç elementinin sınıflandırılması gerektiğini hesaplamak için yeterli. Bu sadece benim kişisel yaklaşımım.
EngrStudent - Monica'yı

Yanıtlar:


13

Birden fazla girişi tek bir girişle (etiket) eşleştirmek için RNN kullanılabilir, çünkü bu şekil ( kaynak ) gösterdiği gibi:

resim açıklamasını buraya girin

Her dikdörtgen bir vektördür ve oklar işlevleri temsil eder (örn. Matris çarpımı). Giriş vektörleri kırmızı renkte, çıkış vektörleri mavi renkte ve yeşil vektörler de RNN'nin durumunu tutuyor (daha fazlası yakında). Soldan sağa: (1) Sabit boyutlu girişten sabit boyutlu çıkışa (örn. Görüntü sınıflandırması) RNN'siz vanilya işleme modu. (2) Sekans çıkışı (örn. Resim altyazısı bir resim alır ve kelimelerin bir cümlesini verir). (3) Dizi girişi (örn. Belirli bir cümlenin pozitif veya negatif hissi ifade etme olarak sınıflandırıldığı duygu analizi). (4) Dizi girişi ve dizi çıkışı (örn. Makine Çevirisi: bir RNN İngilizce bir cümle okur ve sonra Fransızca bir cümle çıkarır). (5) Senkronize dizi girişi ve çıkışı (örn. Videonun her karesini etiketlemek istediğimiz video sınıflandırması).


4

Basit RNN durumunda, tüm diziyi ağınıza besleyin ve ardından son dizi öğesinde sınıf etiketini çıkarın (bu yaklaşımın ilk örneği için bu makaleye ve referanslara bakın ). Eğitim aşamasında, son sekans elemanından sekansın başlangıcına kadar olan zamandaki hatası geri verebiliriz. Genel olarak bu, RNN dizi etiketleme sorunundan farklı değildir, burada dizinin sadece bazı öğelerine etiket atamamız gerekir (veya diğer tüm öğeler DİĞER olarak etiketlenir).


Daha uzun sekanslar için dikkatli olunmalıdır. Sekansın başlangıcından itibaren bilgiler sekanstaki bilgiler tarafından boğulmuş olabilir.
Vladislavs Dovgalecs
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.