LeNet'te nöronların alıcı alanı


9

CNN'in alıcı alanlarını daha iyi anlamaya çalışıyorum. Bunu yapmak için LeNet'teki her bir nöronun alıcı alanını hesaplamak istiyorum. Normal bir MLP için oldukça kolaydır (bkz. Http://deeplearning.net/tutorial/lenet.html#sparse-connectivity ), ancak bir veya daha fazla kıvrımlı katmanı takip eden bir katmanda bir nöronun alıcı alanını hesaplamak daha zordur ve havuz katmanları.

2. evrişimsel katmanda bir nöronun alıcı alanı nedir? Aşağıdaki alt örnekleme / havuzlama katmanında ne kadar büyük? Ve bunları hesaplamanın formülü nedir?


1
İlgili kenar çubuğu , düşündüğünüz ve ilginç düşündüğünüz şeyle ilgili olan bu soruyu önerdi .
Dougal

Yanıtlar:


2

Standart bir MLP örneği olarak kıvrımlı bir ağ düşünüyorsanız, alıcı alanları tam olarak bağladığınız örnekle aynı şekilde anlayabilirsiniz.

Bir kıvrımlı katmanın, bu görüntüde olduğu gibi, birçok tekrarlanan desene sahip bir katman için aslında bir kısayol olduğunu hatırlayın ( bu cevaptan , başlangıçta buradan ):

görsel evrişim örneği

Bu görüntünün "hedef piksellerinin" her biri, girişleri kaynak görüntüdeki mavi kare olan bir nörona karşılık gelir. Ağ mimarinize bağlı olarak, kıvrımlar tam olarak böyle piksellere karşılık gelmeyebilir, ancak aynı fikirdir. Tüm bu evrişimli nöronlar için girdi olarak kullanılan ağırlıklar bağlanır, ancak bu burada düşündüğünüzle alakasızdır.

Toplanan nöronlar aynı şekilde düşünülebilir ve girdilerinin her birinin alıcı alanlarını birleştirir.


Güzel görselleştirme! Örneğin mükemmel bir mantıklı. Evrişimsel kattan sonra 2x2'lik bir havuz katmanı ekleseydim, havuzlama katmanındaki her nöron, evrişimsel katmandaki nöronlar olarak dört 3x3 alanın karıştırılmasına rağmen, sadece 4x4'lük bir alıcı alana sahip olacaktır. Kolayca başımı bulabilir ve havuz boyutu vb. Dayalı alıcı alan için bazı basit formüller oluşturabilir. Ancak, alıcı alan şimdi de yoklama katmanı vb. İçin bağlı olduğundan, aşağıdaki evrişimsel katman için daha karmaşık hale gelir. RF için hangi formül bunu dikkate alıyor?
pir

kaynak pikseldeki mavi kare alıcı alanın büyüklüğü mü?
Charlie Parker

Aynı soruda, "Daha Hızlı R-CNN: Bölge Teklif Ağları ile Gerçek Zamanlı Nesne Tespitine Doğru" makalesinde, Bölüm 3.1'de ZF ve VGG16'nın alıcı alanının 171 ve 228 olduğunu söylüyor, ancak eklemiyor ağ yapılandırmasından yukarı. Umarım biri bunu benim için temizleyebilir.
Chan Kim

0

Daha hızlı-rcnn'de, etkili alıcı alan aşağıdaki gibi hesaplanabilir (VGG16):

Resim->
Konv1 (3) -> Konv1 (3) -> Havuz1 (2) ==>
Konv2 (3) -> Konv2 (3) ->
Havuz2 ( 2) ==> Konv3 (3) -> Konv3 (3 ) -> Konv3 (3) -> Havuz3 (2) ==>
Konv4 (3) -> Konv4 (3) -> Konv4 (3) -> Havuz4 (2) ==>
Konv5 (3) -> Konv5 (3 ) -> Konv5 (3) ====>
özellik haritasında 3 * 3 penceresi.
Basitlik için bir boyut alalım. Boyut 3'ten geri gelirsek, orijinal alıcı alan:
1). Konv5'in başlangıcında: 3 + 2 + 2 + 2 = 9
2). Konv4'ün başlangıcında: 9 * 2 + 2 + 2 + 2 = 24
3). Konv3'ün başlangıcında: 24 * 2 + 2 + 2 + 2 = 54
4). Konv2'nin başlangıcında: 54 * 2 + 2 + 2 = 112
5). Konv1 başlangıcında (orijinal giriş): 112 * 2 + 2 + 2 = 228

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.