«neural-networks» etiketlenmiş sorular

Yapay sinir ağları (YSA), biyolojik sinir ağlarına gevşek bir şekilde dayanan geniş bir hesaplama modelleri sınıfıdır. İleri beslemeli NN'leri ("derin" NN'ler dahil), evrişimli NN'leri, tekrarlayan NN'leri, vb.

3
Derin sinir ağını eğitmek için erken durdurma nasıl düzgün kullanılır?
Derin bir sinir ağı modelim var ve bunu yaklaşık 100.000 örnekten oluşan veri kümemde eğitmem gerekiyor, doğrulama verilerim yaklaşık 1000 örnek içeriyor. Her bir örneği eğitmek zaman aldığından (her örnek için yaklaşık 0,5s) ve aşırı sığmayı önlemek için, gereksiz hesaplamayı önlemek için erken durdurma uygulamak istiyorum. Ancak sinir ağımı erken …

2
Sinir ağlarında neden diğer meta-sezgisel yöntemlerden ziyade gradyan yöntemleri kullanılır?
Derin ve sığ sinir ağlarının eğitiminde, gradyan yöntemleri (örneğin, gradyan inişi, Nesterov, Newton-Raphson) neden diğer meta-sezgilerin aksine yaygın olarak kullanılmaktadır? Meta-sezgisel olarak, yerel bir minimada sıkışmayı önlemek için geliştirilen benzetilmiş tavlama, karınca kolonisi optimizasyonu vb. Yöntemleri kastediyorum.

2
LSTM'ler için en iyi hangi optimizasyon yöntemleri işe yarıyor?
LSTM'leri denemek için theano kullanıyorum ve LSTM'ler için hangi optimizasyon yöntemlerinin (SGD, Adagrad, Adadelta, RMSprop, Adam, vb.) En iyi sonucu merak ediyordum? Bu konuda herhangi bir araştırma makalesi var mı? Ayrıca, cevap LSTM için kullandığım uygulamanın türüne bağlı mı? Eğer öyleyse, metin sınıflandırma (metnin ilk kelime vektörlerine dönüştürüldüğü yer) için …


5
Derin öğrenme: Hangi değişkenlerin önemli olduğunu nasıl bilebilirim?
Sinir ağı lingo açısından (y = Ağırlık * x + önyargı) hangi değişkenlerin diğerlerinden daha önemli olduğunu nasıl bilebilirim? 10 giriş, 1 düğüm 20 düğüm ve 1 düğüm olan 1 çıkış katmanı ile bir sinir ağı var. Hangi giriş değişkenlerinin diğer değişkenlerden daha etkili olduğunu nasıl bileceğimden emin değilim. Düşündüğüm …



3
Sinir ağlarında önyargı düğümünün önemi
Önyargı düğümünün modern sinir ağlarının etkinliği için ne kadar önemli olduğunu merak ediyorum. Sadece birkaç girdi değişkeni olan sığ bir ağda önemli olabileceğini kolayca anlayabiliyorum. Bununla birlikte, derin öğrenme gibi modern sinir ağları, belirli bir nöronun tetiklenip tetiklenmediğine karar vermek için genellikle çok sayıda girdi değişkenine sahiptir. Bunları örneğin LeNet5 …



5
SVM veya Sinir Ağı kullanılırken kategorik değişkeni sayısal değişkene yeniden kodlama
SVM veya Sinir Ağını kullanmak için, kategorik değişkenleri sayısal değişkenlere dönüştürmesi (kodlaması) gerekir, bu durumda normal yöntem 0-1 ikili değerleri, k. Kategorik değeri (0,0, .. olarak dönüştürülür) kullanmaktır. ., 1,0, ... 0) (1, k-th konumundadır). Bunu yapmak için başka yöntemler var mı, özellikle de 0-1 gösteriminin Sinir Ağı'nda oldukça istenen …

2
Sinir ağının kara kutu olarak anlamı nedir?
İnsanların sinir ağları hakkında, ne yaptığını veya ne anlama geldiğini anlamadığınız bir kara kutu gibi konuştuğunu sık sık duyuyorum. Aslında bunun ne anlama geldiğini anlayamıyorum! Geri yaymanın nasıl çalıştığını anlarsanız, o zaman bir kara kutu nasıl olur? Onlar, ağırlıkların nasıl hesaplandığını veya neyi anlamadığımızı mı kastediyorlar?

2
Geri yayılım algoritması
Çok katmanlı algılayıcıda (MLP) kullanılan geri yayılım algoritması üzerinde hafif bir karışıklık var . Hata, maliyet fonksiyonu tarafından ayarlanır. Geri çoğaltmada, gizli katmanların ağırlığını ayarlamaya çalışıyoruz. Anlayabildiğim çıkış hatası, yani e = d - y[Abonelikler olmadan]. Sorular: Gizli katman hatası nasıl alınır? Kişi nasıl hesaplar? Geri çoğaltırsam, uyarlanabilir bir filtrenin …


3
Sinir ağları bir işlev veya olasılık yoğunluk işlevi öğrenir mi?
Soru biraz garip gelebilir çünkü istatistiksel çıkarımda ve sinir ağlarında yeniyim. Sinir ağlarını kullanan sınıflandırma problemlerinde girişlerinin alanını çıkışlarının alanıyla eşleştiren fonksiyonunu öğrenmek istediğimizi söylüyoruz : x yf∗f∗f^*xxxyyy f∗(x;θ)=yf∗(x;θ)=yf^*(x; \theta) = y Parametreleri ( ) doğrusal olmayan bir işlevi modellemek veya bir olasılık yoğunluk işlevini modellemek için mi takıyoruz?θθ\theta Soruyu …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.