«deep-learning» etiketlenmiş sorular

Temelde derin sinir ağları ile yapılan verilerin hiyerarşik temsillerini öğrenmeyle ilgili makine öğrenimi alanı.

3
Sinir ağlarında sigmoid çıkış birimlerini, ve doğrusal olmayan normal olmayan günlük olasılıklarıyla başlayarak
Arka plan: Ian Goodfellow ve Yoshua Bengio ve Aaron Courville'in Deep Learning'in 6. bölümünü inceliyorum. Bölüm 6.2.2.2 olarak (sayfa 183 182 buradan görülebilir ) çıkışı sigmoid kullanımı harekete geçirilir.P(y=1|x)P(y=1|x)P(y=1|x) Malzemenin bazılarını özetlemek için, etkinleştirme uygulanmadan önce bir çıkış nöronu olmasını sağlarlar; burada , önceki gizli katmanın çıktısıdır, , ağırlıkların bir …


1
Derin Öğrenmede Derin Artık Ağlar bağlamında bir Artık Öğrenme bloğu tam olarak nedir?
Görüntü Tanıma için Derin Artık Öğrenme makalesini okuyordum ve artık bir bloğun hesaplamalı olarak neleri gerektirdiğini% 100 kesin olarak anlamakta zorlanıyordum. Kağıtlarını okurken şekil 2 var: Artık Blok'un ne olması gerektiğini gösterir. Bir artık bloğun hesaplanması sadece aşağıdakilerle aynı mıdır: y=σ(W2σ(W1x+b1)+b2+x)y=σ(W2σ(W1x+b1)+b2+x) \mathbf{y} = \sigma( W_2 \sigma( W_1 \mathbf{x} + b_1 …

2
Makine öğreniminde optimizasyon hedefi olarak Pearson korelasyon katsayısını kullanın
Makine öğreniminde (regresyon sorunları için) genellikle ortalama kare hatası (MSE) veya ortalama-mutlak hata (MAE) işlevini en aza indirgemek için (artı normalleştirme terimini) hata olarak kullanıyorum. Korelasyon katsayısının kullanılmasının daha uygun olacağı durumlar olup olmadığını merak ediyorum. böyle bir durum varsa, o zaman: Hangi durumlarda korelasyon katsayısı MSE / MAE'ye göre …


3
Sinir ağlarını matematiksel olarak modelleme
Bir sinir ağı ve bir grafik model arasındaki matematiksel bağlantıyı kurmak için uğraşıyorum. Grafik modellerde fikir basittir: olasılık dağılımı, grafikteki uçurumlara göre çarpanlara ayrılır ve potansiyeller genellikle üstel ailenin olur. Sinir ağı için eşdeğer bir gerekçe var mı? Bir Kısıtlı Boltzmann makinesinde veya CNN'nin enerjilerinin bir fonksiyonu olarak birimler (değişkenler) …

2
CNN'de filtre boyutu, adım vb. Seçilmeli mi?
Stanford'un CS231N derslerine bakıyordum ve kafamı CNN mimarilerindeki bazı sorunların etrafına sarmaya çalışıyorum. Anlamaya çalıştığım şey, evrişim filtre boyutu ve adım gibi şeyler seçmek için bazı genel kurallar varsa veya bu bir bilimden daha fazla bir sanat mı? Anladığım havuzlama esas olarak bir çeşit çeviri değişmezliğini bir modele sokmak için …



3
Bir evrişimli sinir ağında son Softmax katmanından önce doğrusal olmama
Evrişimli sinir ağlarını çalışıyorum ve uygulamaya çalışıyorum, ancak bu sorunun genel olarak çok katmanlı algılayıcılar için geçerli olduğunu düşünüyorum. Ağımdaki çıkış nöronları her sınıfın aktivasyonunu temsil eder: en aktif nöron, belirli bir girdi için öngörülen sınıfa karşılık gelir. Eğitim için çapraz entropi maliyetini göz önünde bulundurmak için, ağın sonuna bir …




1
Kayıp fonksiyonunun ikinci derece yaklaşımı (Derin öğrenme kitabı, 7.33)
Goodfellow'un (2016) derin öğrenme kitabında, erken durmanın L2 düzenlenmesi ile eşdeğerliğinden bahsetti ( https://www.deeplearningbook.org/contents/regularization.html sayfa 247). Maliyet fonksiyonu jjj dereceden yaklaşımı şu şekilde verilir: J^( θ ) = J( w*) + 12( w - w*)T'H( w - w*)J^(θ)=J(w*)+12(w-w*)T'H(w-w*)\hat{J}(\theta)=J(w^*)+\frac{1}{2}(w-w^*)^TH(w-w^*) 'H'HHf( w + ϵ ) = f( w ) + f'( w …

4
Olasılıksız çıkarsama - bu ne anlama geliyor?
Son zamanlarda, literatürde bantlanmış 'olasılıksız' yöntemlerin farkına vardım. Ancak, bir çıkarım veya optimizasyon yönteminin olasılıksız olmasının ne anlama geldiğinden emin değilim . Makine öğreniminde amaç genellikle bazı parametrelerin bir işleve uyma olasılığını en üst düzeye çıkarmaktır, örneğin sinir ağındaki ağırlıklar. Olasılıksız bir yaklaşımın felsefesi tam olarak nedir ve neden GAN'lar …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.