Diyelim ki şekillendirilmiş bir tensörü veren bir konv katmanı var :(N,F,H,W)
- N parti büyüklüğüdür
- F , evrişimli filtrelerin sayısıdır
- H,W mekansal boyutlardır
Bu çıktının 1x1 filtreli, sıfır ve adım 1 olan bir konv katmanına beslendiğini varsayalım . Daha sonra bu 1x1 konv katmanın çıktısının şekli .F1(N,F1,H,W)
Bu nedenle, 1x1 conv filtreleri, filtre alanındaki boyutluluğunu değiştirmek için kullanılabilir. Eğer ise boyutsallığı arttırıyoruz, ise , filtre boyutunda.F1>FF1<F
Gerçekten de, Google Inception makalesinde , Convolutions ile Daha Derinlere Gitmek , onlar (orijinal yazarlar tarafından değil, benim kalın harflerle yazılmıştır):
Yukarıdaki modüller ile ilgili en büyük sorun, en azından bu naif formda, mütevazı sayıda 5x5 konvolüsyonun bile, çok sayıda filtreli konvolüsyonlu bir katmanın üstüne büyük ölçüde pahalı olabileceğidir.
Bu, önerilen mimarinin ikinci fikrine yol açar: hesaplama gereksinimlerinin çok fazla artacağı yerde, boyutsal küçültme ve projeksiyonların tedbirli bir şekilde uygulanması. Bu, yerleştirmelerin başarısına dayanır: düşük boyutlu yerleştirmeler bile göreceli olarak büyük bir görüntü yaması hakkında çok fazla bilgi içerebilir ... 1x1 konvolüsyonlar, pahalı 3x3 ve 5x5 konvolüsyonlardan önce indirimleri hesaplamak için kullanılır. İndirgeme olarak kullanılmasının yanı sıra, onları çift amaçlı yapan düzeltilmiş doğrusal aktivasyon kullanımını da içerir.
Dolayısıyla, Başlangıç mimarisinde, filtre boyutunda boyutsallığı azaltmak için 1x1 evrişimli filtreler kullanıyoruz. Yukarıda açıkladığım gibi, bu 1x1 konv katmanları genel olarak filtre alanı boyutluluğunu değiştirmek için kullanılabilir (artırma veya azaltma) ve Başlangıç mimarisinde, bu 1x1 filtrelerinin, filtre boyut alanında açıkça boyutsallık azaltma için ne kadar etkili olduğunu görüyoruz. , uzaysal boyut uzayı değil.
Belki de 1x1 konveksiyon filtrelerinin başka yorumları da var, ancak bu açıklamayı özellikle Google Inception mimarisi bağlamında tercih ediyorum.