«deep-learning» etiketlenmiş sorular

Temelde derin sinir ağları ile yapılan verilerin hiyerarşik temsillerini öğrenmeyle ilgili makine öğrenimi alanı.

2
Toplu Normalleştirme, modelin eğitilirken doğruluğunu izlemek için hareketli ortalamaları nasıl ve neden kullanır?
Toplu normalizasyon (BN) kağıdını (1) okuyordum ve modelin doğruluğunu izlemek için hareketli ortalamalar kullanma ihtiyacını anlamadım ve bunun doğru bir şey olduğunu kabul etsem bile anlamıyorum tam olarak ne yaptıklarını. Anladığım kadarıyla (ki bu benim yanlışım) makalede, modelin eğitimi bittikten sonra istatistiklerini mini parti yerine nüfus istatistiklerini kullandığından bahsediliyor. Tarafsız …



3
Derin sinir ağını eğitmek için erken durdurma nasıl düzgün kullanılır?
Derin bir sinir ağı modelim var ve bunu yaklaşık 100.000 örnekten oluşan veri kümemde eğitmem gerekiyor, doğrulama verilerim yaklaşık 1000 örnek içeriyor. Her bir örneği eğitmek zaman aldığından (her örnek için yaklaşık 0,5s) ve aşırı sığmayı önlemek için, gereksiz hesaplamayı önlemek için erken durdurma uygulamak istiyorum. Ancak sinir ağımı erken …

2
Sinir ağlarında neden diğer meta-sezgisel yöntemlerden ziyade gradyan yöntemleri kullanılır?
Derin ve sığ sinir ağlarının eğitiminde, gradyan yöntemleri (örneğin, gradyan inişi, Nesterov, Newton-Raphson) neden diğer meta-sezgilerin aksine yaygın olarak kullanılmaktadır? Meta-sezgisel olarak, yerel bir minimada sıkışmayı önlemek için geliştirilen benzetilmiş tavlama, karınca kolonisi optimizasyonu vb. Yöntemleri kastediyorum.

4
Otomatik kodlayıcının aksine varyasyonel bir oto kodlayıcıyı ne zaman kullanmalıyım?
Varyasyonel oto-kodlayıcının ve normal (deterministik) oto-kodlayıcının temel yapısını ve bunların arkasındaki matematiği anlıyorum, ama ne zaman ve neden bir tip otomatik kodlayıcıyı diğerine tercih ederim? Aklıma gelen tek şey, varyasyonel oto-kodlayıcının gizli değişkenlerinin önceki dağılımı, gizli değişkenleri örneklememize ve sonra yeni görüntüyü oluşturmamıza izin veriyor. Varyasyonel otoenkoderin stokastikliğinin deterministik otoenkodere …

3
Sinir ağlarında önyargı düğümünün önemi
Önyargı düğümünün modern sinir ağlarının etkinliği için ne kadar önemli olduğunu merak ediyorum. Sadece birkaç girdi değişkeni olan sığ bir ağda önemli olabileceğini kolayca anlayabiliyorum. Bununla birlikte, derin öğrenme gibi modern sinir ağları, belirli bir nöronun tetiklenip tetiklenmediğine karar vermek için genellikle çok sayıda girdi değişkenine sahiptir. Bunları örneğin LeNet5 …


5
'Transfer öğrenimi' ve 'alan adı uyarlaması' arasındaki fark nedir?
'Transfer öğrenimi' ve 'alan adı uyarlaması' arasında herhangi bir fark var mı? Bağlam hakkında bir bilgim yok, ama benim anlayışım bazı veri setimiz 1 ve üzerinde çalıştığımız, bundan sonra modelimizi sıfırdan yeniden eğitmeden uyarlamak istediğimiz, 'transfer öğrenimi' ve 'alan adı uyarlaması' bu sorunun çözülmesine yardımcı olur. Evrişimli Sinir Ağları alanına …


3
Sinir ağlarının ikonik (oyuncak) modelleri
Lisansüstü okuldaki fizik profesörlerim ve Noble ödüllü Feynman, harmonik osilatör, sarkaç, topaç ve kara kutu gibi fizikteki temel kavramları ve yöntemleri göstermek için her zaman oyuncak modelleri dediklerini sunacaklardı. Sinir ağlarının uygulanmasının altında yatan temel kavram ve yöntemleri göstermek için hangi oyuncak modelleri kullanılır? (Referanslar lütfen.) Bir oyuncak modeli ile, …

2
Derin öğrenme vs. Karar ağaçları ve güçlendirme yöntemleri
Ben (ampirik veya teorik olarak) karşılaştırmak ve tartışmak kağıtları veya metin arıyorum: Arttırılması ve karar ağaçları gibi algoritmalar Rasgele Orman veya AdaBoost ve GentleBoost karar ağaçlarına uygulanmıştır. ile Kısıtlı Boltzmann Makineleri , Hiyerarşik Geçici Bellek , Konvolüsyonel Sinir Ağları , vb. Gibi derin öğrenme yöntemleri . Daha spesifik olarak, bu …


2
Mini-toplu eğitim sinir ağları için rastgele seçilen eğitim örnekleri değiştirilmeden mi çekilmelidir?
Bir çağı, mevcut tüm eğitim örneklerinin tamamından geçmiş olarak ve mini-parti boyutunu, degradeyi azaltmak için gereken ağırlık / sapma güncellemelerini bulmak için ortalama örnek sayısı olarak tanımlarız. Benim sorum, bir çığır içindeki her bir mini partiyi üretmek için bir dizi eğitim örneği yerine getirilmememiz gerekip gerekmediğidir. Dönem sonu gereksinimini karşılamak …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.