Kısıtlı Boltzmann Makineleri (RBM) için iyi bir öğretici


10

Kısıtlı Boltzmann Makinesi'ni (RBM) inceliyorum ve RBM'nin parametreleriyle ilgili günlük olabilirlik hesaplamalarını anlamada bazı sorunlar yaşıyorum. RBM hakkında birçok araştırma makalesi yayınlanmış olmasına rağmen, türevlerin ayrıntılı bir adımı yoktur. Çevrimiçi arama yaptıktan sonra bu belgede bulabildim:

  • Fischer, A. ve Igel, C. (2012). Sınırlı Boltzmann Makinelerine Giriş. L. Alvarez ve diğ. (Eds.): CIARP, LNCS 7441, s. 14–36, Springer-Verlag: Berlin-Heidelberg. ( pdf )

Ancak, bu belgenin ayrıntıları benim için çok ileri. Birisi beni RBM hakkında iyi bir öğretici / ders notlarına yönlendirebilir mi?


Düzenleme: @David, kafa karıştırıcı bölüm aşağıda gösterilmiştir (sayfa 26'daki denklem 29):

lnL(θ|v)wij=hp(h|v)E(v,h)wij+v,hp(v,h)E(v,h)wij=hp(h|v)hivjvp(v)hp(h|v)hivj(29)=p(Hi=1|v)vjvp(v)p(Hi=1|v)vj.

Hangi adımların sizi şaşırttığı konusunda daha açık olabilir misiniz?
David J. Harris

1
iyi bir okuma yapay zeka için derin mimarileri öğrenmenin 5. bölümüdür ( iro.umontreal.ca/~bengioy/papers/ftml_book.pdf )
dksahuji

@dksahuji INFO için teşekkürler, ayrıca prof: Bengio bir DL yazıyor ve inital
14'e

Bu derste RBM'nin matematiği ile ilgili açıklamalar bulunmaktadır ( Kısıtlı Boltzmann Makineleri Üzerine Bir Öğretici ).
Jiang Xiang

Yanıtlar:


7

Biraz geç olduğunu biliyorum, ama belki yardımcı olur. Denkleminizin ilk terimini elde etmek için şu adımları alır: Arasındaki koşullu bağımsızlığı varsaydık. görünür birimler göz önüne alındığında gizli birimler vardır. Böylece, gizli durumlar için koşullu ortak olasılık dağılımını çarpanlarına ayırabiliriz.

hp(h|v)hivj=vjh1...hi...hnp(h1,...,hi,...hn|v)hi=vjhih_ip(hi,h_i|v)hi
=vjhih_ip(hi|v)hip(h_i|v)=vjhip(hi|v)hih_ip(h_i|v)
Geçen dönem eşittir hepimiz devletleri üzerinde toplayarak olduğundan,. Böylece geriye kalan ilk terimdir. Yana sadece devletler alır ve ile biz sonuna kadar: 1hi10
=vjp(Hi=1|v)

7
  1. Derin öğrenme sitesinde RBM'lerin iyi bir öğreticisi var .

  2. Bu blog yazısı ( Kısıtlı Boltzmann Makinelerine Giriş ) daha basit bir dilde yazılmış ve RBMS'nin temellerini gerçekten iyi açıklıyor:

  3. Ayrıca, belki de en iyi referans Geoff Hinton'un Coursea'daki Sinir Ağları kursudur:

    Sınıf bittikten sonra derse ve videolara erişip erişemeyeceğinizden emin değilim.


2
Hala Coursera sınıfına kaydolan ve forumda yayın yapan insanlar var. Yine de tüm dersleri görebilir ve tüm sınavlara ve programlama ödevlerine (sınavlar arasında) erişebilirsiniz. Bu bilgiler, kurs tekrar önerilinceye kadar muhtemelen mevcut olacaktır. Sadece materyali görüntülemek veya indirmek için kursa kaydolmanızı öneririm.
Douglas Zare

1

Soldaki turuncu kutu, görünür bir vektörün görünür birimler üzerine kenetlendiği göz önüne alındığında, tüm gizli konfigürasyonlarda enerji gradyanının beklenen değerini verir (egzersiz setinizden bir örnek kullandığından veriler üzerinde beklenti). Terimin kendisi, (1) bir v vektörünün görünür birimler üzerine kenetlenmesi ve (2) belirli bir görünür birimin j durumu göz önüne alındığında, belirli bir gizli birimin i görülme olasılığıdır.

Sağ turuncu kutu, soldaki kutu ile aynı şeydir, ancak yalnızca görünür birimler üzerine sıkıştırılmış olan yerine, görünür her yapılandırma için sol turuncu kutuda ne yaptığınızı yaparsınız (hiçbir şey kelepçelenmediğinden modele olan beklentisi görünür birimlerde).


1

Hugo Larochelle'in makine öğrenimi ( video ) kursunun 5. Bölümü , şimdiye kadar bulduğum en iyi tanıtım.

Kayıp fonksiyonunun türevi bu derslerde türetilmemiştir, ancak bunu yapmak zor değildir (gerekirse hesaplamalarımın bir taramasını gönderebilirim, ama gerçekten o kadar zor değil). Hala bu konuyu kapsayan iyi bir ders kitabı arıyorum ama esas olarak sadece makaleler var. Bengio'nun Derin Öğrenme Kitabının 20. bölümünde yer alan makalelere iyi bir genel bakış vardır .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.