Bayes sinir ağı kullanmanın avantajları nelerdir?


12

Son zamanlarda bir sinir ağındaki girdi ve çıktı arasındaki olasılık ilişkisini veren Bayes sinir ağı (BNN) [Neal, 1992] , [Neal, 2012] hakkında bazı makaleler okudum . Böyle bir sinir ağını eğitmek, geleneksel geri yayılma algoritmasından farklı olan MCMC aracılığıyla yapılır.

Sorum şu: Böyle bir sinir ağını kullanmanın avantajı nedir? Daha spesifik olarak, NN yerine BNN'ye daha uygun bazı örnekler verebilir misiniz?

Yanıtlar:


9

Bayes sinir ağları, fazla sığmayı önlemenin bir yolu olarak, verilerin az olduğu alanlarda sorunların çözümünde faydalıdır. Bu gibi durumlarda genellikle diğer tüm yöntemleri yenerler. Örnek uygulamalar, moleküler biyoloji ( örneğin, bu çalışma ) ve tıbbi teşhisdir (verinin sıklıkla maliyetli ve zor expiremental çalışmalardan geldiği alanlar). Aslında, Bayes ağları tek yönlü olarak faydalıdır ve çok sayıda görev için daha iyi sonuçlar elde edebilirler, ancak büyük sorunlara ölçeklendirmek son derece zordur.


2
Bayes ağlarının ölçeklendirilmesinin neden zor olduğunu açıklayabilir misiniz?
Ellis Valentiner

6

BNN'nin NN'ye göre bir avantajı, bilinmeyen hedeflerin verileriyle uğraşırken tahminlerinizle ilişkili bir hatayı otomatik olarak hesaplayabilmenizdir. Bir BNN ile, şimdi Bayesci çıkarım yapıyoruz. BNN tahminimizi , burada NN işlevidir, girişlerinizdir , NN parametreleridir ve x, t eğitim girdileri ve hedefleridir. Bu, @forecaster tarafından sağlanan bağlantılarda Neal tarafından kullanılan sözdizimi ile uyumlu olmalıdır. Daha sonra, tahmin üzerinde doğruluk olarak safça kullanacağım posterior tahmin dağılımının standart sapmasını hesaplayabiliriz:f¯(x|x,t)=f(x,ω)p(ω|x,t)dωfxωσ(x)=[f(x,ω)f¯(x|x,t)]2p(ω|x,t)dω


1
Bu, konuşmaya ilginç bir ektir, ancak standartlarımıza göre biraz kısadır. Biraz ayrıntı verebilir ve belki bir referans ekleyebilir misiniz?
Sycorax: Reinstate Monica

Elbette. Bir BNN ile, şimdi Bayesci çıkarım yapıyoruz. BNN tahminimizi olarak tanımlayalım , burada f NN'dir işlevi, x 'girişlerinizdir, NN parametreleridir ve eğitim girişleri ve hedefleridir. Bu, @forecaster tarafından sağlanan bağlantılarda Neal tarafından kullanılan sözdizimi ile uyumlu olmalıdır. Daha sonra, tahmin üzerinde doğruluk olarak safça kullanacağım posterior tahmin dağılımının standart sapmasını hesaplayabiliriz:f¯(x|x,t)=f(x,ω)p(ω|x,t)dωωx,tσ(x)=([f(x,ω)f¯(x|x,t)]2p(ω|x,t)dω)
Michelle K

Lütfen bunu cevabınızda düzenleyin.
Sycorax, Reinstate Monica'nın
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.