Üç cümle sürümü:
Her katman, önceki katmana istediğiniz herhangi bir işlevi uygulayabilir (genellikle, doğrusal olmayan bir dönüşümü takip eden doğrusal dönüşüm).
Gizli katmanların görevi, girdileri, çıktı katmanının kullanabileceği bir şeye dönüştürmektir.
Çıkış katmanı, gizli katman aktivasyonlarını, çıktınızın açık olmasını istediğiniz ölçeğe dönüştürür.
5 yaşında gibisin:
Bilgisayarda, resimde bir veri yolu olup olmadığını size bildirmek istiyorsanız, doğru araçlara sahipse bilgisayarın daha kolay bir zamanı olabilir.
Böylece, otobüs dedektörünüz bir tekerlek dedektöründen (size bir araç olduğunu söylemenize yardımcı olmak için) ve bir kutu dedektöründen (otobüs büyük bir kutu şeklinde olduğundan) ve bir büyüklük dedektöründen (size bir araba olamayacak kadar büyük olduğunu söyleyebilir) ). Bunlar gizli katmanınızın üç elementi: ham görüntünün bir parçası değiller, otobüsleri tanımlamanıza yardımcı olmak için tasarladığınız araçlar.
Bu dedektörlerin üçü de yanarsa (veya özellikle aktiflerse), o zaman önünüzde bir otobüsün olması iyi bir ihtimal.
Sinir ağları kullanışlıdır, çünkü çok sayıda dedektör oluşturmak ve bunları bir araya getirmek için iyi araçlar (backpropagation gibi) vardır.
Mesela yetişkinsin
İleri beslemeli bir sinir ağı, verilere bir dizi işlev uygular. Kesin işlevler kullandığınız sinir ağına bağlı olacaktır: en sık olarak, bu işlevlerin her biri önceki katmanın doğrusal bir dönüşümünü ve bunu izleyen ezilme çizgisizliğini hesaplar. Bazen işlevler başka bir şey yapabilir (örneklerinizdeki mantıksal işlevleri hesaplama veya bir görüntüdeki bitişik piksellerin ortalaması alma gibi). Böylece farklı katmanların rolleri hangi fonksiyonların hesaplandığına bağlı olabilir, ama çok genel olmaya çalışacağım.
xhyfxhghy
f(x)g(f(x))
fg
g(f(x))fg
Mantıksal fonksiyonlara sahip bir örnek:
fg
İlk katman fonksiyonları:
- En az bir öğenin "TRUE" olduğundan emin olun (OR kullanarak)
- Hepsinin "DOĞRU" olmadığından emin olun (NAND kullanarak)
İkinci katman işlevi:
- Her iki birinci katman kriterinin de karşılandığından emin olun (AND kullanarak)
Ağın çıkışı sadece bu ikinci işlevin sonucudur. İlk katman , girişleri ikinci katmanın kullanabileceği bir şeye dönüştürür, böylece tüm ağ XOR gerçekleştirebilir.
Görüntüler içeren bir örnek:
Bu konuşmadaki 61 numaralı kaydırak - burada tek bir görüntü olarak da mevcut - belirli bir sinir ağındaki farklı gizli katmanların ne aradığını gösterir (görselleştirmenin bir yolu).
İlk katman, görüntüde kısa kenar parçaları arar: bunlar ham piksel verilerinden bulmak çok kolaydır, ancak bir yüze, otobüse veya file bakıp bakmadığınızı size söylemekte çok yararlı değillerdir. .
Bir sonraki katman kenarları oluşturur: altta gizli katmanın kenarları belirli bir şekilde birbirine uyuyorsa, en soldaki sütunun ortasındaki göz algılayıcılardan biri açılabilir. Ham piksellerden çok özel bir şey bulmakta çok iyi olan tek bir katman oluşturmak zor olurdu: göz dedektörleri, kenar dedektörlerinden oluşturmak için ham piksellerden çok daha kolaydır.
Bir sonraki katman, göz detektörlerini ve burun detektörlerini yüzlere dönüştürür. Başka bir deyişle, önceki katmanda bulunan göz dedektörleri ve burun dedektörleri doğru desenlerle açıldığında bunlar yanacaktır. Bunlar, belirli yüz türlerini aramakta çok iyidir: bir veya daha fazlası yanıyorsa, çıktı katmanınız bir yüzün mevcut olduğunu bildirmelidir.
Bu yararlıdır, çünkü yüz dedektörlerinin göz dedektörlerinden ve burun dedektörlerinden kolayca çıkarılabilir, ancak piksel yoğunluğundan çıkmak gerçekten zordur.
Böylece her katman sizi ham piksellerden daha uzak ve daha uzağa götürür ve nihai hedefinize daha yakın hale getirir (örneğin yüz algılama veya veri yolu algılama).
Çeşitli diğer soruların cevapları
"Giriş katmanındaki bazı katmanlar neden gizli katmana bağlı, bazıları değil?"
Ağdaki bağlantısı kesilen düğümlere "önyargı" düğümleri denir. Burada gerçekten güzel bir açıklama var . Kısa cevap, regresyondaki durdurma terimleri gibidirler.
"Resimdeki" göz algılayıcı "resimler nereden geliyor?"
Bağlandığım belirli görüntüleri iki kez kontrol etmedim, ancak genel olarak, bu görselleştirmeler giriş katmanındaki karşılık gelen nöronun aktivitesini maksimize eden piksel kümesini gösterir. Öyleyse, nöronu bir göz dedektörü olarak düşünürsek, bu nöronun en göze benzer olduğunu düşündüğü görüntüdür. Millet genellikle bu piksel kümelerini bir optimizasyon (tepe tırmanma) prosedürü ile bulur.
In Bu yazıda dünyanın en büyük nöral ağların biriyle bazı Google millet tarafından, bir "yüz dedektörü" nöron ve "kedi dedektörü" nöron bu şekilde, hem de ikinci bir yol gösterir: Onlar da göstermek gerçek görüntüleri etkinleştirmek en kuvvetli nöron (şekil 3, şekil 16). İkinci yaklaşım güzeldir, çünkü ağın ne kadar esnek ve doğrusal olmadığını gösterir - bu yüksek seviye "dedektörler" özellikle piksel düzeyinde görünmese de, tüm bu görüntülere duyarlıdır.
Buradaki herhangi bir şey net değilse veya başka sorunuz varsa bana bildirin.