Yapay Sinir Ağı, Derin Öğrenme Sistemi ve Derin İnanç Ağı arasındaki fark nedir?


23

Yapay Sinir Ağı, Derin Öğrenme Sistemi ve Derin İnanç Ağı arasındaki fark nedir?

Temel sinir ağınızı hatırladığım kadarıyla, 3 katmanlı bir şey, ve ben de birbirlerinin üstüne yığılmış sinir ağları olarak tanımlanmış Derin İnanç Sistemlerine sahibim.

Son zamanlarda bir Derin Öğrenme Sistemleri duymadım, ama bunun Derin İnanç Sistemi ile eşanlamlı olduğundan şüpheleniyorum. Bunu onaylayan var mı?


belki "derin öğrenme" demek istiyorsun ? bakınız örneğin derin öğrenme haberleri / linkleri
vzn

Derin İnanç Sistemi, karşılaştığım terim, eş anlamlısı olabilir veya olmayabilir (Bir Google araması, Derin İnanç Sistemi için makaleler yayınlayacaktır)
Lyndon White,

Derin İnanç Ağı kanonik bir isimdir çünkü Deep Boltzmann Ağı'ndan türemiştir (ve bayes ağları ve olasılıksal karar teorisi ile ilgili olduğundan tamamen farklı olan bir inanç yayılma sistemi ile karıştırıcı olabilir).
gaborous

@gaborous Derin İnanç Ağı doğru addır (yıllardır bana tanıttığım belgede yazım hatası olmalı). ama derin boltzman ağlarından türetildiği için, bu adın kendisi kanonik değildir (AFAIK, bir alıntı gördüğüne sevinir). DBN'ler Sigmoid İnanç Ağları'ndan türetilmiş ve Yığılmış RBM'leri oluşturmuştur. Deep Boltzmann Network teriminin hiç kullanıldığını sanmıyorum. Öte yandan, Deep Boltzmann Makine kullanılmış bir terimdir, ancak Deep Boltzmann Makineleri Derin İnanç Ağları'ndan sonra yaratılmıştır
Lyndon White

@Oxinabox Haklısınız, bir yazım hatası yaptım, bu Deep Boltzmann Makineleri, buna rağmen gerçekten Derin Boltzmann Ağı olarak adlandırılması gerekir (ama o zaman kısaltma aynı olurdu, bu yüzden belki de bu yüzden). İlk önce hangi derin mimariyi icat ettiğimi bilmiyorum, ama Boltzmann makineleri yarı sınırlı bm'den önce. DBN ve DBM, yinelenen bir katman olarak kullanılan temel ağın bir SRBM'ye karşı BM olması dışında gerçekten aynı yapıya sahiptir.
gaborous

Yanıtlar:


10

Yapay sinir ağları modelleri, genellikle, birkaç yıldır, örneğin, 3 yıl boyunca, Kolmogorovs thm adında bir matematik kanıtı da dahil olmak üzere, çeşitli nedenlerle, düşük hata ile (sadece birçok nöronla) teorik olarak yaklaşık olarak çalışabileceklerini belirten çeşitli nedenlerle sınırlandırılmıştır.

Bunun ötesindeki çok katmanlı ağlar önceki öğrenme teknikleri ile mümkün / etkili değildi. Benzer bir atılım 2006'da 3 farklı araştırmacı Hinton, Le Cun, Bengio ve çok daha fazla katman yetiştirmeyi başarabildi. Bu alanda öne çıkan sorun, el yazısı tanıma idi.

"derin inanç ağı" terimi, Sinton ağlarıyla yakın kavramsal / teorik bağlantılara / analojiye sahip olan Bayesian ağlarına atıfta bulunan Hinton tarafından 2006 tarihli bir makale ile ortaya çıkmaktadır . "Derin inanç ağları için hızlı bir öğrenme algoritması"

Bu sunumun özellikle slayt 17 bkz derin sinir ağları

Bu nedenle, derin öğrenme alanı sadece ~ 10 yıl eski ve hızlı araştırma ve geliştirme geçiriyor. Google, Facebook, Yahoo tüm derin öğrenmeye dayalı girişimleri duyurdu ve Ar-Ge çalışmaları devam ediyor.


Alanında araştırmacılar tarafından derin öğrenmeye adanmış web sitesi
vzn

14

Yapay sinir ağları, grafiklere dayanan birçok farklı türde algoritma içeren bir algoritma sınıfıdır, bu yüzden burada sorduğunuzun ötesinde ayrıntıya girmeyeceğim, çünkü söylenecek çok fazla YSA olduğu için söylenecek çok fazla şey var.

İlk tür yapay sinir ağları, ünlü McCulloch-Pitts nöronları doğrusaldı ; bu, yalnızca doğrusal karar sorunlarını (yani, bir çizgi çizerek doğrusal olarak ayrılabilen veri kümeleri) çözebilecekleri anlamına geliyordu . Zamanla, bu doğrusal sinir ağı modeli Perceptron veya Adaline olarak bilinir (ağırlık güncellemesini nasıl hesapladığınıza bağlı olarak).

Doğrusal sinir ağları , sadece sol taraftaki düğümlerin girişler ve sağ taraftaki çıkış düğümleri olduğu iki taraflı bir grafikten oluşur. Yalnızca bu düğümler arasındaki kenarların ağırlıkları öğrenilir (düğümler aktivasyon eşiği de ayarlanabilir, ancak bu nadiren yapılır).

Adaline veya Perceptron gibi temel sinir ağları (gizli katman yok) Doğrusal karar sınırı

Sığ sinir ağları icat edildiğinde büyük bir adım atıldı : sadece iki parçalı bir grafiğe sahip olmak yerine, 3 parçalı bir grafik kullanıyoruz: giriş "katmanı", "katmanı" çıkışı ve aralarında bir "gizli katmanı" . Gizli katmana teşekkür ederiz, ağ artık doğrusal olmayan kararlar alabilir ve kanonik XOR gibi sorunları çözebilir.

Xor veya sinir ağı Xor sinir ağı örneği aktivasyon yolları Xor ağ karar sınırı

"Sığ" teriminin, derin sinir ağı ( n-katman sinir ağları olarak da bilinir ) icat edildiğinde geriye dönük olarak yazıldığını unutmayın. Bu, sadece bir gizli katmanı olan sinir ağlarına , n gizli katmanı olan derin sinir ağlarına karşı koymaktır . Tahmin edebileceğiniz gibi, daha gizli katmanları kullanmak, kararı modüle etmek için daha fazla katman bulunduğundan daha karmaşık veri kümelerine karar vermenize olanak sağlar (diğer bir deyişle, karar sınırlamanızın boyutsuzluğunu arttırırsınız, bu da fazla uydurmaya neden olabilir).

N katmanlı sinir ağı N katmanlı derin sinir ağı kullanarak karmaşık doğrusal olmayan karar sınırı

Sorabilirsiniz: neden kimse daha önce çok katmanlı (derin) sinir ağları kullanmaya çalışmamış? Aslında, Fukushima tarafından 1975 gibi erken bir tarihte Cognitron ve Neocognitron ile (ki bu aslında bir evrimsel sinir ağı, ama bu başka bir hikaye) yaptılar . Bununla birlikte, mesele kimsenin böyle ağları etkin bir şekilde öğrenmeyi bilmemesiydi, asıl mesele düzenli hale gelmek . Hinton'un AutoEncoder'ları yolu açtı ve daha sonra LeCun'un Rektifiye Doğrusal Birimleri sorunu çözdü.

Peki ya Derin İnanç Ağları (DBN)? Onlar sadece çok katmanlı yarı kısıtlamalı Boltzmann makineleri. Bu yüzden onlar bir tür derin sinir ağı, ama farklı bir temel ağ modeline sahip (yani: katman, bu tekrarlanan model): Boltzmann makineleri, üretken oldukları diğer ağlardan farklıdır , yani genellikle Verilerinizden onu yeniden üretmek için ("üret") öğrenmek için kullanılırken, olağan derin sinir ağları verilerinizi ayırmak için kullanılır (bir "karar sınırı" çizerek).

Başka bir deyişle, DNN veri kümenizdeki bir değeri sınıflandırmak / tahmin etmek için mükemmeldir, DBN ise bozuk bir veriyi "onarmak" için harikadır (onarımı söylerken, sadece bozuk verilerden değil, aynı zamanda mükemmel bir veri üzerinde de olabilir) sadece elle yazılmış rakamlar gibi başka bir sinir ağı ile daha kolay tanımak için biraz basmakalıp olmak için biraz düzeltmek istiyorum.

Aslında, düzgün bir şekilde özetlemek gerekirse, AutoEncoder'ların Deep In Faith Network'ün daha basit bir şekli olduğunu söyleyebilirsiniz. İşte yüzleri tanımak için eğitilmiş bir DBN örneği ancak NOT numaraları, sayılar otomatik olarak kayboluyor (bu, DBN'nin "sabitleme" etkisidir):

Yüz tanımaya ilişkin Derin İnanç Ağı örneği

Sonuçta, DBN ve DNN ters değil: tamamlayıcılar. Örneğin, bir karakterin görüntüsünü daha fazla basmakalıp yapmak için önce bir karakterin görüntüsünü besleyecek el yazısı karakterleri tanımak için bir sistem hayal edebiliyor ve sonra basmakalıp görüntünün daha sonra görüntünün hangi karakteri temsil edeceğini gösteren bir DNN'ye beslemek mümkün.

Son bir not: Derin İnanç Ağları, Derin Boltzmann Makinelerine çok yakındır: Derin Boltzmann Makineleri, Boltzmann Makinelerinin (çift yönlü sinir ağları, aynı zamanda tekrarlanan sinir ağları olarak da adlandırılır) katmanlarını, Derin İnanç Ağları ise yarı sınırlı Boltzmann Makinelerini (yarı- kısıtlı, tek yönlü olarak değiştirildikleri anlamına gelir; bu nedenle, tekrarlayan bir ağ öğrenmekten çok daha etkili olan ağı öğrenmek için geri yayılımın kullanılmasına olanak tanır). Her iki ağ da aynı amaç için kullanılır (veri setini yeniden oluşturur), ancak hesaplama maliyeti farklıdır (Deep Boltzmann Makineleri, tekrarlayan doğası nedeniyle öğrenmenin maliyeti oldukça yüksektir: ağırlıkları "stabilize etmek" daha zordur).

Bonus: Konvolüsyonel Sinir Ağları (CNN) hakkında birçok çelişkili ve kafa karıştırıcı iddia bulacaksınız ve genellikle bunların sadece derin sinir ağları olduğunu göreceksiniz. Bununla birlikte, fikir birliği Fukushima'nın Neocognitron'un orijinal tanımını kullanmak gibi görünüyor: bir CNN, aktivasyondan önce bir konvolüsyon uygulayarak farklı hiyerarşik seviyelerde farklı özellikler çıkarmak zorunda kalan bir DNN'dir (bir DNN doğal olarak yapabilir, ancak bunu zorlar) ağın farklı katmanlarına farklı bir evrişim / aktivasyon işlevi ayarlayarak daha iyi sonuç verebilir, en azından CNN'in bahsi:

Derin sinir ağının özellikleri Evrişimli sinir ağının özellikleri

Ve son olarak, Yapay Zekanın daha katı bir zaman çizelgesi için, buraya bakın .


1
Mükemmel cevap! Evrişimli derin ağların ana yönü (belki de tanımlayıcı yönü), her katmanın bir evrişim uygulamasına karşılık gelmesi ve ardından bir aktivasyon işlevi uygulamasına karşılık gelmesidir: bir çekirdek vardır ve bir katmanda bulunan tüm düğümler aynı çekirdeği uygular. Girişin bir görüntü olduğunu hayal edin. Genellikle, her piksel için bir düğümünüz vardır ve yakındaki piksellerden gelen bağlantıları vardır. Sıradan bir ağ, her pikselin gelen kenarlarda kendi ağırlık desenine sahip olmasını sağlar. Bir evrişimsel ağ, görüntüdeki her pikselde aynı ağırlık dizisi olması gerekliliğini dayatıyor.
DW

Evet, gerçekten haklısın ve ismin geldiği yer orası. Ancak kişisel olarak, bunun genellikle derin bir sinir ağını her şeyden daha fazla özelleştirmek için kesmek olarak kullanıldığını düşünüyorum (derin bir sinir ağının tanımlayıcı özelliği genel amaçlı ve veri setine agnostik olduğunda). Örneğin, HMAX, CNN bir tür, biyolojik sinir ağında belirginlik haritası kursu dinamik programlama kullanılarak hesaplanan değil iken açıkça kesmek hesaplama belirginlik haritalara konvolüsyonunu ... kullanır
gaborous

3

Derin Sinir Ağları, nispeten yüksek derinliğe sahip Sinir Ağlarıdır. Bunlar Sinir Ağları'nın bir alt sınıfıdır. Fikir aslında on yıllar öncesine dayanıyor ve yeni değil. Yeni olan, onları pratikte nasıl eğiteceğimizi çözmemiz. Son zamanlarda çok popüler olmasının nedeni, onları eğitmek mümkün hale geldi ve insanlar bunları sanat algoritmalarını yenmek için kullandılar. DNN, yıllar önce bulunmayan çok fazla veriye ve çok fazla hesaplama gücüne ihtiyaç duyuyor. Geoff Hinton ve öğrencileri ve meslektaşları, son on yılda pratikte onları nasıl eğiteceklerini buldu ve çoğu araştırmacının bunları tam olarak kullanma fikrinden vazgeçtiği birkaç alanda sanat makinesi öğrenme algoritmalarının durumunu yenmek için kullandı.

İnanç Ağları bir Olasılık Grafik Modelleri sınıfıdır, bir grafik kullanarak rasgele değişkenleri ve bağımlılıklarını modellemektedir (bunu yapmanın çeşitli yolları vardır). Bu değişkenlerin kendileri parametreli dağıtımlardan olabilir ve sinir ağları (veya parametreli dağıtımları temsil etmek için başka bir model) tarafından modellenebilir. Derin İnanç Ağları, nispeten yüksek derinliğe sahip İnanç Ağlarıdır.

İnanç Ağları üretken olma eğilimindedir, yani temsil ettiği dağıtımdan örnekler üretmek için eğitimli bir model kullanabiliriz.

Sinir ağları ayırt edici olma eğilimindedir, bunları belirli bir girişin olasılığını hesaplamak için kullanabiliriz (bu bir kedinin resmi mi? Bunun bir kedinin resmi olma olasılığı nedir?), Ancak genellikle örnekleme için değil Bir kedinin resmi).


ML konusunda uzman değilim, bu yüzden yazdıklarını bir tuz tuzu ile alın.
Kaveh

-1

Yapay sinir ağları normalde gizli katmanların ve ikinci dereceden denklemlerin gerekli olduğu yerlerde uygulanır. Derin Boltzmann ağları gibi verilerin işlenmesi için çoklu gizli katmanların gerekli olduğu yerlerde derin öğrenme ve derin inanç ağları kullanılır.


Yani her ikisi de gizli katmanlar gerektiriyor? Normal NN'de birden fazla gizli katman yapabilir misiniz? Bu Boltzmann ağları, Boltzmann makineleri mi demek istediniz? Öyleyse fark nedir? Soruyu cevaplamıyor (ya da belki de cevaplıyor, ama çok belirsiz).
Kötü
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.