NN mimarisini dinamik olarak ayarlamak: gereksiz olanı icat etmek?


9

Doktora yolculuğuma başlıyorum ve kendimden önce belirlediğim nihai hedef, çalıştıkları ortamı izleyecek ve mimarilerini eldeki soruna dinamik olarak ayarlayacak YSA'lar geliştiriyor. Açık olan sonuç verinin zamansallığıdır: eğer veri seti sürekli değilse ve zamanla değişmezse, neden hiç ayarlama yapmıyorsunuz?

Büyük soru şudur: derin öğrenmenin son zamanlarda artmasıyla birlikte, hala ilgili bir konu mu? FFNN'ler kavram sürüklenme problemlerinde kendilerine bir yer bulma şansı var mı?

Çok fazla soru ile iş parçacığı aşırı yüklemek için korkuyorum, ama bu tamamen konu dışı değil: Ben RNNs farkındayım, ama onlarla sınırlı (tamam, hiçbiri veya tamamen teorik) deneyimim var; Dinamik mimari adaptasyonun RNN'ler bağlamında ilgili bir konu olması gerektiğine inanıyorum. Soru, daha önce cevaplandı mı ve tekerleği yeniden keşfedecek miyim?

PS, MetaOptimize'e çapraz gönderildi


"Mimarilerini ayarlayın" derken, ağın gerçek yapısını (gizli düğümler, aktivasyon fonksiyonu, bağlantı vb. Ayrıca, birçok derin öğrenme uygulamasında, sonuç, gözetimsiz bir süreç tarafından başlatılan ağırlıklara sahip bir ileri beslemeli sinir ağıdır.
alto

@alto, gerçek NN yapısına atıfta bulunuyorum - gizli birimlerin ve (muhtemelen) katmanların sayısı - Farklı karmaşıklık düzeylerinde uygulanabileceğinden eminim. Eğer herhangi bir yere gidersem derin öğrenmeyi okumaya başlamak zorunda olduğumu hissediyorum.
anna-earwen

@ anna-earwen ilginç doktora konusu, nasıl gidiyor, henüz yayın var mı?
Dikran Marsupial

1
@Dikran Marsupial, yakında PSO'nun yüksek boyutlu NN'leri nasıl ve neden eğitemediğini konuşmak için IJCNN 2014'e gideceğim. Bu yüzden cevap evet ve biliyorum: Orijinal araştırma vektörünün büyük bir yolunu aldım ve hala ayarlanabilir mimarilere geri dönüp dönmeyeceğimi merak ediyorum. Sadece zaman ve ampirik sonuçlar söyleyecektir!
anna-earwen

İşlemlerde bunu göz önüne alacağım - şeylerin neden işe yaramadığını anlamak, bilimin daha fazla ihtiyaç duyduğu bir şeydir (ve sağlam ampirik çalışmalar).
Dikran Marsupial

Yanıtlar:


6

Kademeli Korelasyon Sinir Ağları, eğitim süreci sırasında gizli düğümler ekleyerek yapılarını ayarlar, bu nedenle burası başlangıç ​​için bir yer olabilir. Bir sinir ağının katman sayısını, gizli düğüm sayısını, vb. Otomatik olarak ayarlayan diğer çalışmaların çoğu evrimsel algoritmalar kullanır.

Ne yazık ki, bu çalışma benim alanım dışında, bu yüzden başlamanıza yardımcı olacak belirli makaleler veya referanslar öneremem. Size derin öğrenme topluluğunda ağ yapısını ve parametrelerini aynı anda optimize etmeye çalışan hiçbir çalışma görmediğimi söyleyebilirim. Aslında, en derin öğrenme mimarileri, bir seferde tek bir katmanı açgözlülükle öğrenmeye dayanır, böylece derin sinir ağlarının çevrimiçi öğrenmesini bile dokunulmamış bir alan haline getirir (Martens ve arkadaşlarının Hessian Free Optimization'ın çalışması dikkate değer bir istisnadır).


Çok teşekkürler, bana zaten altın kazmaya başlayacak kadar bilgi verdin. :)
anna-earwen

2

Yapıcı sinir ağlarına yeni yaklaşımlar geliştirmeyi düşünmenin bir başka nedeni (söz konusu CC algoritması @alto) istatistik dışındaki uygulamalardadır . Özellikle, teorik sinirbilim ve bilişsel bilimde, yapıcı sinir ağları, gelişime ve nörojeneze metaforik bir benzerlik nedeniyle sıklıkla kullanılır. Bunun için kaskad korelasyonunun ağır kullanımına bir örnek için , Thomas R. Shultz'un yayınlarına bir göz atın . Ne yazık ki, kademeli korelasyon yaklaşımı biyolojik gerçekçi değildir ve bir nörobilim eğilimi varsa, ayarlanabilir mimariye sahip yeni NN'lerin daha iyi gelişim ve / veya nörogenez modelleri olarak nasıl kullanılabileceğini düşünmeye değer.


1
Teşekkürler, Artem! Aslında, her şeyden çok saf bir bilgisayar bilimcisiyim, bu yüzden nöro ve kongnitif bilim hakkındaki bilgim kıttan daha az. Yine de heyecan verici geliyor ve tüm yollar hala açık olduğu için, bunu da inceleyebilirim - en azından bir ölçüde. Şu anda, kıyaslama için işe yarayabilecek gerçek yaşam mühendisliği ve veri analizi problemlerine yönelik uygulamalarla özellikle ilgileniyorum.
anna-earwen
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.