Max Pooling görüntüyü alt örneklemek için neden kıvrılıyor?


14

Kenarları tanımlamak gibi bir şey yapmak için filtreler uygulama fikri oldukça güzel bir fikirdir.

Örneğin, 7 görüntüsünü alabilirsiniz. Bazı filtrelerde, orijinal görüntünün farklı özelliklerini vurgulayan dönüştürülmüş görüntüler elde edebilirsiniz. Orijinal 7:

resim açıklamasını buraya girin

ağ tarafından şu şekilde deneyimlenebilir:

resim açıklamasını buraya girin

Her görüntünün orijinalin farklı bir kenarını nasıl çıkardığına dikkat edin 7.

Bu harika, ama sonra ağınızdaki bir sonraki katmanın bir Max Pooling katmanı olduğunu varsayalım.

Benim sorum, genel olarak, bu biraz abartılı gibi görünmüyor mu? Filtreleri kullanarak kenarları tanımlamak konusunda çok dikkatli ve kasıtlıydık - şimdi, artık bunlardan hiçbirini umursamıyoruz, çünkü piksel değerlerinden cehennemi patlattık! Yanılıyorsam lütfen beni düzeltin, ama 25 x 25'ten 2 x 2'ye gittik! Neden doğrudan Max Pooling'e gitmiyorsun, temelde aynı şeyle karşılaşmayacağız?

Uzatma olarak sorum, yardım edemem ama tesadüfen, 4 karenin her birinin aynı maksimum değere sahip bir piksele sahip olması durumunda ne olacağını merak edemiyorum. Elbette bu nadir bir durum değil, değil mi? Aniden tüm eğitim resimleriniz aynı görünüyor.

Yanıtlar:


16

Maksimum havuz oluşturma görüntüyü aşağı örneklemez. Yeni çıkardığınız özellikleri (kenarlar gibi) aşağı örneklendirir. Bu, bu kenarların veya diğer özelliklerin yaklaşık olarak nerede bulunduğunu gösterir. Çoğunlukla bu, ağın genelleme için ihtiyaç duyduğu şeydir - sınıflandırmak için 10,5 ila 10,20 arasında çalışan dikey bir kenar olduğunu bilmesine gerek yoktur, ancak yaklaşık 1/3 sol kenar görüntünün yaklaşık 2/3 yüksekliğinde.

Bu daha kaba özellik kategorileri, çok düşük bir maliyetle giriş görüntüsünde daha fazla varyasyonu kapsar ve özellik haritasının boyutundaki azalma da ağı daha hızlı hale getiren hoş bir yan etkidir.

Bunun iyi çalışması için, başlangıçta maksimum havuz oluşturmanın yapmadığı özellikleri çıkartmanız gerekir, bu nedenle evrişimsel katman gereklidir. İlk maksimum havuzlama katmanını kullanmak yerine orijinal görüntüyü (14x14'e) aşağı örnekleyebileceğinizi ve yine de oldukça makul bir doğruluk elde edeceğinizi görmelisiniz. Ne kadar havuzlama yapılacağı ve bu katmanların nereye ekleneceği, derin bir sinir ağı oluştururken başka bir hiper parametre problemidir.


6

Aradaki katman nedeniyle doğrudan giriş katmanından maksimum havuzlamaya geçemeyiz convolution layer. Evrişimin nedeni özellikleri çıkarmaktır. Maksimum havuzlama, çıkartılan özellikleri örnekler. Büyük bir matristen maksimum havuzlama katmanına doğrudan atlama nedeniyle eksik olan özellikler olduğunu düşünüyorsanız, bir boyuttan memnun görünene kadar aralarında daha fazla konveksiyon katmanı ekleyebilir ve daha sonra üzerine maksimum havuzlama yapabilirsiniz. aşırıya kaçmamak değil.

Aşağı örnekleme biçimi olan maksimum havuzlama, en önemli özellikleri tanımlamak için kullanılır. Ancak ortalama havuzlama ve diğer çeşitli teknikler de kullanılabilir. Normalde resimlerle değil metinle çalışırım. Benim için, değerler normalde aynı değildir. Ama eğer onlar da, çok fazla fark etmezdi çünkü sadece en büyük değeri alır.

Dan çok iyi bir anlayış wiki -The intuition is that once a feature has been found, its exact location isn't as important as its rough location relative to other features. The function of the pooling layer is to progressively reduce the spatial size of the representation to reduce the amount of parameters and computation in the network, and hence to also control overfitting. It is common to periodically insert a pooling layer in-between successive conv layers in a CNN architecture. The pooling operation provides a form of translation invariance.


Son cümleyi açıklayabilir misiniz The pooling operation provides a form of translation invariance?
MerhabaDünya

@Öğrenci Özellik, görüntünün herhangi bir yerinde algılanırsa, maksimum havuzun çıktısının yaklaşık olarak aynı olacağı anlamına gelir. Görüntüdeki özelliği etkinleştiren şeyi taşıyın ve farklı bir giriş max-pool'a maksimum gelsin, ancak max-pool'un çıkış değeri aynı olmalıdır.
mrmcgreg

@mrmcgreg Bunun küresel havuzlama için geçerli olduğuna inanıyorum, maksimum havuzlama için değil. Maksimum havuzlama, havuz bölgesindeki yerel çevirilere bir çeşit değişmezlik sağlar (örn. 2x2). Bu özelliklerde biraz titremeye izin verir.
geometrikal

0

Konvolüsyon, pikseller (ağ parametreleri) arasındaki ilişkiyi kaybetmeden görüntünün boyutunu küçültmek için görüntüyü daha küçük bir piksel filtresi ile filtreliyor, Havuzlama ayrıca piksellerin Maks, Ort. Veya Toplamını boyuta çıkararak uzamsal boyutu da küçültür Bununla birlikte, büyüklükleri önemli ölçüde küçülterek kıvrımın yeniden elde ettiği işlemde önemli parametreyi kaçırabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.