Neden otomatik kodlayıcılara ihtiyacımız var?


17

Son zamanlarda oto-kodlayıcılar üzerinde çalışıyorum. Doğru anladıysam, otomatik kodlayıcı, giriş katmanının çıkış katmanıyla aynı olduğu bir sinir ağıdır. Böylece sinir ağı, girdiyi altın standart olarak kullanarak çıktıyı tahmin etmeye çalışır.

Bu modelin faydası nedir? Bazı çıkış öğelerini yeniden oluşturmaya çalışmanın ve bunları giriş öğelerine mümkün olduğunca eşit hale getirmenin faydaları nelerdir? Neden tüm bu makineler aynı başlangıç ​​noktasına ulaşmak için kullanılmalı?

Yanıtlar:


17

Otomatik kodlayıcılarda bir giriş katmanı, gizli katman ve bir çıkış katmanı bulunur. Girdi, çıktıyla özdeş olmaya zorlanır, bu yüzden ilgilendiğimiz gizli katman.

Gizli katman , girdinin bir tür kodlamasını oluşturur. "Otomatik kodlayıcının amacı, bir veri kümesi için sıkıştırılmış, dağıtılmış bir temsili (kodlama) öğrenmek." Giriş 100 boyutlu bir vektörse ve gizli katmanda 60 nöron varsa, otomatik kodlayıcı algoritması girişi çıkış katmanında 100 boyutlu bir vektör olarak çoğaltır. .

Otomatik kodlayıcıların amacı, diğerlerinin yanı sıra boyutsallık azaltımıdır .


Teşekkürler @Madhulika, belki anladım. Algoritma şu şekilde çalışır: bir giriş katmanı vardır, giriş katmanı ile aynı bir çıkış katmanına sahip olmak için sinir ağını eğitir. Giriş katmanını çıkış katmanıyla karşılaştırır ve farklıysa, sinir ağını yeniden eğitmeye devam eder. Aynı olduklarında durur. Tamamlandığında, son gizli katmanı giriş katmanının en iyi boyutsal küçültme yaklaşımı olarak alır ve ihtiyacımız olan herhangi bir hedef için kullanırız. Bu doğru mu?
larry

Evet, neredeyse haklısın. :) Üzerine daha fazla literatür okuyun.
Madhulika Mukherjee

5

Ayrıca, popülasyonunuzu modelleyebilir, böylece yeni bir vektör girdiğinizde, çıktının girdiden ne kadar farklı olduğunu kontrol edebilirsiniz. Eğer bunlar "tamamen" aynıysa, girdinin popülasyonla eşleştiğini varsayabilirsiniz. Eğer "oldukça" farklılarsa, girdi muhtemelen modellediğiniz popülasyona ait değildir.

Verilerinizi tanımlayan bir işleve sahip olmaya çalıştığınız bir tür "sinir ağları tarafından gerileme" olarak görüyorum: çıktısı girdiyle aynı.


3

Belki bu resimler sana biraz sezgi verir. Yukarıdaki yorumcu olarak, bahsedilen otomatik kodlayıcılar eğitim örneklerinden bazı üst düzey özellikler elde etmeye çalışır. İkinci resimde derin NN için her gizli seviyeyi ayrı ayrı eğitmek için prognoz algoritmasının nasıl kullanıldığını görebilirsiniz.

resim açıklamasını buraya girin

resim açıklamasını buraya girin

Resimler Rus wikipedia'dan alınır.


2
Resimlere yorum yapmak yardımcı olacaktır.
Tim
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.