Inception v2 ve Inception v3 arasındaki fark nedir?


18

Kıvrımlarla daha derine inen makalede orijinal başlangıç ​​modüllerini içeren GoogleNet açıklanmaktadır:

resim açıklamasını buraya girin

Başlangıç ​​v2'deki değişiklik, 5x5 kıvrımlarını iki ardışık 3x3 kıvrımla değiştirmeleri ve havuz oluşturmasıydı:

resim açıklamasını buraya girin

Inception v2 ve Inception v3 arasındaki fark nedir?


Basitçe parti normalizasyonu mu? Veya Inception v2'de zaten toplu normalleştirme var mı?
Martin Thoma

github.com/SKKSaikia/CNN-GoogLeNet Bu depo, GoogLeNet'in tüm sürümlerini ve farklarını içerir. Bir şans ver.
Amartya Ranjan Saikia

Yanıtlar:


22

Parti Normalizasyonu makalesinde , Sergey ve ark., 2015. Önerilen Başlangıç-v1 bir varyantı olan bir mimari GoogleNet kağıt helezonlarla Giderek daha derin ve bu arada da Başlangıçtan (BN-Başlangıç) Toplu Normalizasyon getirmiştir.

(Szegedy ve ark., 2014) 'te açıklanan ağ ile temel fark, 5x5 evrişim katmanlarının yerini 128 filtreye kadar iki ardışık 3x3 evrişim tabakası ile değiştirmesidir.

Ve yazarlar Bilgisayar Vizyonu için Başlangıç ​​Mimarisini Yeniden Düşünen makalede Inception-v2 ve Inception-v3'ü önerdiler.

In Başlangıç-v2 , onlar Çarpanlarına (küçük kıvrımlar halinde çarpanlara ayırmak helezonlar) ve Inception-v1 içine bazı küçük değişiklikler oldu.

Geleneksel 7x7 evrişimini üç 3x3 evrişim haline getirdiğimizi unutmayın

Gelince Başlangıç-v3 , bu BN-yardımcı ekler Başlangıç-v2 bir varyantıdır.

BN yardımcısı, yardımcı sınıflandırıcının tam bağlı katmanının da sadece kıvrımları değil, normalleştirildiği versiyonu ifade eder. [Inception-v2 + BN yardımcısı] modeline Inception-v3 olarak atıfta bulunuyoruz.


3

daoliker tarafından söylenenlerin yanında

başlangıç ​​v2'de, birinci derinlik katmanı olarak ayrılabilir evrişim kullanılmıştır 64

kağıttan alıntı

Modelimizde , birinci evrişimsel katmanda derinlik çarpanı 8 ile ayrılabilir evrişim kullanılmıştır . Bu, hesaplama sırasında bellek tüketimini arttırırken hesaplama maliyetini azaltır.

bu neden önemli? çünkü v3 ve v4'e ve başlangıç ​​resnetine düşürüldü, ancak yeniden tanıtıldı ve daha sonra cep telefonunda yoğun olarak kullanıldı .


1

Cevap, kıvrımlar belgesiyle daha derine inmek: https://arxiv.org/pdf/1512.00567v3.pdf

Tablo 3'ü kontrol edin. Başlangıç ​​v2, kıvrım kağıdı ile daha derine inme bölümünde anlatılan mimaridir. Başlangıç ​​v3, farklı eğitim algoritması (RMSprop, etiket yumuşatma düzenleyici, eğitimi iyileştirmek için parti normuna sahip bir yardımcı kafa ekleyerek) ile aynı mimaridir (küçük değişiklikler).


1

Aslında, yukarıdaki cevaplar yanlış gibi görünüyor. Gerçekten de, adlandırmada büyük bir karmaşa vardı. Bununla birlikte, Inception-v4'ü tanıtan makalede düzeltilmiş gibi görünüyor (bkz. "Inception-v4, Inception-ResNet ve Artık Bağlantıların Öğrenmeye Etkisi"):

Inception derin evrişimsi mimarisi, burada Inception-v1 olarak adlandırılan (Szegedy ve diğerleri 2015a) 'da GoogLeNet olarak tanıtıldı. Daha sonra Inception mimarisi, öncelikle toplu normalizasyonun getirilmesi ile çeşitli şekillerde rafine edildi (Ioffe ve Szegedy 2015) (Inception-v2). Daha sonra bu raporda Inception-v3 olarak anılacak olan üçüncü yinelemedeki ek faktörizasyon fikirleri (Szegedy ve ark. 2015b) ile.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.