Bayesian Networks'ün sinir ağlarından daha iyi performans gösterdiği bir alan var mı?


48

Yapay sinir ağları Computer Vision görevlerinde en iyi sonuçları alır (bkz. MNIST , ILSVRC , Kaggle Galaxy Challenge ). Computer Vision'daki diğer tüm yaklaşımlardan daha iyi performans gösteriyorlar. Ancak başka görevler de var:

ASR (otomatik konuşma tanıma) ve makine çevirisi hakkında pek emin değilim, ancak sanırım (tekrarlayan) sinir ağlarının da (başkalarının) diğer yaklaşımlardan daha iyi performans gösterdiğini duydum.

Şu anda Bayesian Networks'ü öğreniyorum ve bu modellerin hangi durumlarda genellikle uygulandığını merak ediyorum. Yani sorum şu:

Sanat devletinin Bayesian Networks veya en azından çok benzer modeller olduğu herhangi bir zorluk / (Kaggle) yarışması var mı?

(Yan Not: Ayrıca gördüğüm karar ağaçları , 2 , 3 , 4 , 5 , 6 , 7 çeşitli son Kaggle zorluklar içinde kazan)


Bu bir etki alanı meselesi değil. Ne kadar veriye sahip olduğunuz, önceliklerinizin ne kadar iyi olduğu ve posterior isteyip istemediğiniz sorusu.
Emre

1
@Emre Bu bir etki alanı meselesidir ... (ve elbette, yalnızca mevcut veri kümelerini kullanma imkanınız olmadığında, aynı zamanda insanları yeni veriler oluşturmak / etiketlemek için kiralamak için) para.
Martin Thoma

Verilerin bir özelliği, bir yapının, bir algoritmanın diğerinden daha iyi bir şekilde yararlandığından bir etki alanı sorunudur, ancak benim önerdiğim şey bu değil.
Emre,

2
Öyleyse sorunuzun cevabı, hayır . Sağ? Çünkü tüm cevaplar, Bayesian Networks'ün diğer öngörücü modellere göre avantajlarına işaret ediyor gibi gözüküyor, fakat aslında diğer modellerden daha iyi performans gösterdikleri herhangi bir Kaggle yarışması görmedim. Biri sağlayabilir mi? Çünkü tüm nedenler ve olası avantajlar, örneğin, yeterli veri eksikliği ve iyi öncelikleri seçme, cevaplarda verilen teoride harika görünmektedir, ancak yine de soruyu en azından bir örnek sunarak cevaplamamaktadır.
MNLR

Bayesian ağlarının, veri miktarının nispeten sınırlı olduğu denetlenmeyen öğrenme / görevler için yararlı olabileceği bir şey. Yapay sinir ağları sadece eğitilecek çok büyük miktarda veri olduğunda diğerlerinden daha iyi performans gösterir.
xji

Yanıtlar:


31

Bayesian yaklaşımlarının sıklıkla kullanıldığı alanlardan biri, tahmin sisteminin yorumlanabilirliğine ihtiyaç duyulan alanlardan biridir. Doktorlara Sinir Ağı vermek ve% 95 kesin olduğunu söylemek istemezsiniz. Yöntemin yaptığı varsayımları ve ayrıca yöntemin kullandığı karar sürecini açıklamak istersiniz.

Benzer bir alan, önceden güçlü bir etki alanı bilgisine sahip olduğunuz ve sistemde kullanmak istediğiniz zamandır.


1
Ayrıca bakınız: Model Yorumlanabilirliğinin
Mitleri

Ayrıca bakınız: kireç
Martin Thoma

18

Bayes ağları ve sinir ağları birbirini dışlamaz. Aslında, Bayesian ağları "yönlendirilmiş grafik model" için sadece başka bir terimdir. Yapay sinir ağlarının nesnel fonksiyonlarının tasarımında çok faydalı olabilirler. Yann Lecun bunu burada belirtti: https://plus.google.com/+YannLeCunPhD/posts/gWE7Jca3Zoq .

Bir örnek.

p(x)=zp(x|z)p(z)dz.
p(x|z)q(z|x)p(z|x)

İki parça ortak olarak eğitilebilir mi?
nn0p

16

Mükemmel cevaplar zaten.

Düşünebileceğim ve yoğun olarak çalıştığım bir alan, müşteri analitiği alanı.

Hem müşteri desteğini, hem pazarlamayı, hem de büyüme ekiplerini bilgilendirmek ve uyarmak için müşterilerin hareketlerini ve motivasyonlarını anlamalı ve tahmin etmeliyim.

Böylece sinir ağları karmaşanın öngörülmesinde gerçekten çok iyi bir iş çıkarıyor, vs. Ama Bayesian ağlarının tarzını buldum ve tercih ediyorum.

  1. Müşterilerin her zaman bir düzeni vardır. Her zaman harekete geçmek için bir sebepleri vardır . Ve bu sebep, ekibimin kendileri için yaptıkları ya da kendilerini öğrendikleri bir şey olurdu. Bu nedenle, burada her şeyin bir önceliği vardır ve aslında müşteri tarafından alınan kararın çoğunu beslediği için bu neden çok önemlidir.
  2. Müşterinin ve büyüme ekiplerinin pazarlama / satış hunisindeki her hareketi neden olur. Dolayısıyla, potansiyel bir müşteriyi müşteriye dönüştürmek söz konusu olduğunda, ön bilgi hayati önem taşır.

Yani, kavramı öncesinde bu alan adına çok önemli Bayes ağları kavramını yapar müşteri analitiği, geldiğinde çok önemlidir.


Önerilen öğrenme:

Yapay Sinir Ağları için Bayes Yöntemleri

İş analitiğinde Bayes ağları


15

Bazen sonucu değiştirmeyi, sonucu tahmin etmek kadar önemsersiniz.

Yeterli eğitim verisi verilen bir sinir ağı sonucu daha iyi tahmin etme eğiliminde olacaktır, ancak sonucu bir kez tahmin ederseniz, girdi özelliklerinde değişiklik yapmanın sonucu üzerindeki etkisini tahmin etmek isteyebilirsiniz.

Gerçek hayattan bir örnek, birinin kalp krizi geçirmesi muhtemel olduğunu bilmek faydalıdır, ancak kişiye XX yapmayı bırakması durumunda riskin% 30 oranında azalacağını söyleyebilmek çok daha büyük bir fayda sağlar.

Aynı şekilde, müşterilerin elde tutulması için de, müşterilerin neden sizinle alışveriş yapmayı bıraktıklarını bilmek, sizinle birlikte alışveriş yapmayı bırakması muhtemel müşterileri öngörmek kadar değerlidir.

Ayrıca daha az kestiren ancak daha fazla işlem yapılmasına neden olan daha basit bir Bayesian Ağı , genellikle daha “doğru” bir Bayesian Ağı'ndan daha iyi olabilir.

Bayesian ağlarının sinir ağları üzerindeki en büyük avantajı, nedensel çıkarım için kullanılabilecek olmalarıdır. Bu branş istatistik ve makine öğrenmesi için temel öneme sahiptir ve Judea Pearl bu araştırma için Turing ödülünü kazandı .


Ancak, farklı özelliklerin rolünü ve önemini belirlemek için sinir ağları da kullanılabilir, değil mi?
Hossein

7

Bayes ağları, küçük veri ayarlarında Yapay Sinir Ağlarından daha iyi performans gösterebilir. Ön bilgi ağ yapısı, öncelikler ve diğer hiperparametreler ile düzgün bir şekilde yönetiliyorsa, Sinir Ağları üzerinde bir kenarı olabilir. Yapay Sinir Ağları, özellikle daha fazla katmana sahip olanlar, veri aç olduğu için çok iyi bilinmektedir. Neredeyse tanımı gereği, onları doğru şekilde eğitmek için çok fazla veri gerekir.


4

Bu bağlantıyı Reddit'te yayınladım ve çok fazla geri bildirim aldım. Bazıları cevaplarını buraya yazmış, bazıları vermemiş. Bu cevap reddit kayıtlarını toplamalıdır. (Ben bunu topluluk wiki yaptım, böylece puan alamadım)



2

Bunun için küçük bir örnek yaptım. Bundan bir dağıtım yakalamak istiyorsanız Bayesian Networks'ün tercih edildiğini düşünüyorum ancak girdi eğitim setiniz dağıtımı iyi kapsamıyor. Bu gibi durumlarda, iyi genelleştirilmiş bir sinir ağı bile dağıtımı yeniden yapılandıramazdı.


-3

Sinir ağlarının diğer öğrencilerden daha iyi olduğu konusunda kesinlikle hemfikir değilim. Aslında sinir ağları diğer yöntemlere göre oldukça kötü. Bu arının tesadüfen çok sık yapılması gereken parametrelerin seçilmesi konusunda bazı tavsiyelere rağmen hiçbir metodoloji yoktur. Sinir ağlarının ne kadar iyi olduğu hakkında forumlarda rastgele konuşma yapan bazı ahbaplar da var, bununla ilgili kanıtları olmadığı için değil, süslü ve vızıltı kelimesi, sinirsel '' hakkında da tutuldukları için. xgboost ile karşılaştırmak için bir sinir ağını denediniz mi? Kendimi bilinçlendirene kadar herhangi bir sinir ağını denemeyeceğim. O zamana kadar mutlu sinir ağları :)


3
Bu iyi bir cevap veremeyecek kadar belirsiz ve konuşkan. Bazı özellikler, gerçekler ve kurgulama bunu iyileştirirdi.
Sean Owen,

Özel mesajlar '' sinir ağlarının en iyisi olduğunu söyleyen mesajlar gönderen insanlar tarafından belirtilmeli, sinir ağlarının sadece iyi göründüğü için sinir ağlarının iyi durumda olduğunu söyleyemezsiniz. O kadar kötü ki ki knn çok daha iyi sonuçlardan alıyor.
gm1

1
Görüşlerini inkar etmeme rağmen, cevabın soruyu gerçekten cevaplamadığından da söylememelisin. Öyleyse, pl bir yorum olarak eklemeyi düşünün. Ve lütfen cevabınızı destekleyen herhangi bir somut kanıt ve teori ekleyin, aksi takdirde gelecekteki izleyiciler tarafından rant olarak
bakılabilir

1
@ gm1 Beni demek istediğin ",, Özel gerçekler", sinir ağlarının en iyisi olduğunu söyleyen mesajlar gönderen insanlar tarafından belirtilmeli. Lütfen o kadar genel bir açıklama yazmadığımı unutmayın. NN'nin birçok yarışma / CV görevinde kazandığını yazdım. Ve sinir ağları yaklaşımlarının kazandığı bazı zorlukları da ekledim.
Martin Thoma

Merhabalar, elbette sinir ağlarının iyi çalıştığı bazı Kaggle yarışmaları var (diyelim ki diğer modellerle birlikte sinir ağları kullanmamışlarsa da), ama bu, tüm kaggle yarışmalarının küçük bir kısmı, gitmek için bir sinir ağı kullanabilir misiniz? Kaggle TFI'sında TOP 3? Doğrusal olmayan modeli ile hem kamu hem de özel LB için yapabileceğimi düşünüyorum.
gm1
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.