«deep-learning» etiketlenmiş sorular

Temelde derin sinir ağları ile yapılan verilerin hiyerarşik temsillerini öğrenmeyle ilgili makine öğrenimi alanı.


1
Doğrultulmuş lineer birimler neden doğrusal değildir?
Doğrultulmuş doğrusal birimlerin (ReLU) aktivasyon fonksiyonları neden doğrusal değildir? f(x)=max(0,x)f(x)=max(0,x) f(x) = \max(0,x) Girdi pozitif olduğunda doğrusaldırlar ve derin ağların temsili gücünü açmak benim anlayışımdan doğrusal olmayan aktivasyonlar bir zorunluluktur, aksi takdirde tüm ağ tek bir katmanla temsil edilebilir.

1
Varyasyonlu oto kodlayıcılar nelerdir ve hangi öğrenme görevlerinde kullanılırlar?
Gereğince bu ve bu cevap, autoencoders boyut azaltılması için sinir ağları kullanan bir tekniktir görünmektedir. Ek olarak, değişken bir otomatik kodlayıcının ne olduğunu ("geleneksel" otomatik kodlayıcılara göre başlıca farklılıkları / faydaları) ve bu algoritmaların kullanıldığı ana öğrenme görevlerinin ne olduğunu bilmek isterim.

3
Adam Optimizer'ın hiper parametrelerinin değerine sağlam olarak kabul edilmesinin nedeni nedir?
Deep Learning için Adam optimizerini okuyordum ve Bengio, Goodfellow ve Courville tarafından yazılan Deep Learning adlı yeni kitapta şu cümleyi okudum: Adam genel olarak hiper parametrelerinin seçimine oldukça sağlam olarak kabul edilir, ancak öğrenme oranının bazen önerilen varsayılan değerden değiştirilmesi gerekir. eğer bu doğruysa, bu büyük bir sorun çünkü hiper …

2
Krizhevsky'nin 12 CNN'i ilk katmanda 253,440 nöronu nasıl elde eder?
Gelen Alex Krizhevsky, ve diğ. Derin evrişimli sinir ağları ile Imagenet sınıflandırması , her katmandaki nöron sayısını numaralandırır (aşağıdaki şemaya bakınız). Ağın girişi 150.528 boyutludur ve ağın kalan katmanlarındaki nöron sayısı 253,440–186,624–64,896–64,896–43,264– 4096–4096–1000 arasında verilir. 3B Görünüm İlk kattan sonraki tüm katmanlar için nöronların sayısı açıktır. Nöronları hesaplamanın basit bir …

2
Filtre matrisinin elemanları nasıl başlatılır?
Daha iyi (Convnet veya TensorFlow gibi) kütüphanelere bağlı olmayan Python kodunu yazarak kıvrımlı sinir ağlarını daha iyi anlamaya çalışıyorum ve ne zaman çekirdek matris için değerleri seçmek için literatürde sıkışıp kalıyorum görüntü üzerinde evrişim yapmak. Bir CNN katmanları gösteren aşağıdaki resimde özellik haritaları arasındaki adımda uygulama ayrıntılarını anlamaya çalışıyorum . …

3
Yığılmış evrişimli bir otomatik kod çözücünün mimarisi nedir?
Bu yüzden evrişimsel ağları kullanarak insanların görüntülerini silmeye çalışıyorum. Kağıtları ( Paper1 ve Paper2 ) ve bu stackoverflow bağlantısını okudum , fakat ağların yapısını anladığımdan emin değilim (gazetelerde iyi tanımlanmamış). Sorular: Girişimi, ardından bir ses katmanı, ardından bir conv katmanı, ardından bir havuz katmanı izleyebilirim - sonra - çıktımı vermeden …

1
Dikkat mekanizmaları tam olarak nedir?
Son birkaç yılda çeşitli Derin Öğrenme makalelerinde dikkat mekanizmaları kullanılmıştır. Open AI araştırma başkanı Ilya Sutskever onları coşkuyla övdü: https://towardsdatascience.com/the-fall-of-rnn-lstm-2d1594c74ce0 Purdue Üniversitesi'nden Eugenio Culurciello, RNN'lerin ve LSTM'lerin tamamen dikkat odaklı sinir ağları lehine terk edilmesi gerektiğini iddia etti: https://towardsdatascience.com/the-fall-of-rnn-lstm-2d1594c74ce0 Bu bir abartı gibi gözüküyor, ancak tamamen dikkat temelli modellerin sıra …

3
Görüntü formatı (png, jpg, gif) görüntü tanıma sinir ağının nasıl eğitildiğini etkiler mi?
Derin, evrişimli sinir ağları ile görüntü tanıma, görüntü sınıflandırma vb. Konularında birçok ilerlemenin olduğunun farkındayım. Ama PNG görüntüleri üzerinde bir ağ eğitirsem, sadece bu şekilde kodlanmış görüntüler için çalışır mı? Başka hangi görüntü özellikleri bunu etkiler? (alfa kanalı, taramalı, çözünürlük vb.)



4
Softmax çıktı neden Derin Öğrenme modelleri için iyi bir belirsizlik ölçütü değildir?
Bir süredir Konvolutional Sinir Ağları (CNN) ile çalışıyorum, çoğunlukla semantik segmentasyon / örnek segmentasyonu için görüntü verileri üzerinde. Belirli bir sınıf için piksel başına aktivasyonların ne kadar yüksek olduğunu görmek için genellikle ağ çıkışının softmax değerini bir "ısı haritası" olarak görselleştirdim. Düşük aktivasyonları "belirsiz" / "belirsiz" ve yüksek aktivasyonları "belirli" …

2
Sınırlı Boltzmann Makinesi: Makine öğrenmesinde nasıl kullanılır?
Arka fon: Evet, Sınırlı Boltzmann Makinesi (RBM) bir sinir ağının ağırlığını başlatmak için CAN kullanılabilir. Ayrıca derin inanç ağı oluşturmak için bir "tabaka-katman" şekilde kullanılamaz CAN bir yetiştirmek olduğunu ( üstünde ıncı katmanı , 'inci katmanın ardından tren üstünde inci tabaka -inci tabaka durulama ve tekrar ...)nnn( n - 1 …

2
Yapay sinir ağlarının güçlendirilmesi
Son zamanlarda, adaboost, gradient boost gibi artırıcı algoritmalar öğrenmeye çalışıyordum ve en yaygın kullanılan zayıf öğrenicinin ağaçlar olduğu gerçeğini biliyordum. Gerçekten bilmek istiyorum, sinir ağlarını temel öğrenici olarak kullanmak için bazı başarılı örnekler (bazı makaleleri veya makaleleri kastediyorum) var mı?

2
Darboğaz mimarileri sinir ağlarında nasıl çalışır?
Bir darboğaz mimarisini, ResNet kağıdında bulunan ve [iki 3x3 dönüşümlü katman] 'ın [bir 1x1 dönş., Bir 3x3 dönş. 1x1 konveksiyon katmanlarının başka bir yazıda açıklanan boyut küçültme (ve restorasyonu) biçimi olarak kullanıldığını anlıyorum . Ancak, bu yapının neden orijinal düzen kadar etkili olduğu konusunda net değilim. Bazı iyi açıklamalar şunları …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.