CNN eğitiminde hangi katman daha fazla zaman harcar? Konvolüsyon tabakaları ve FC tabakaları


11

Evrişimli Sinir Ağında hangi katman eğitimde azami zaman harcar? Evrişim katmanları mı yoksa Tam Bağlı katmanlar mı? Bunu anlamak için AlexNet mimarisini alabiliriz. Eğitim sürecinin zaman içinde dağılmasını görmek istiyorum. Herhangi bir sabit GPU yapılandırmasını alabilmemiz için göreceli bir zaman karşılaştırması istiyorum.

Yanıtlar:


11

NOT: Bu hesaplamaları spekülatif yaptım, bu yüzden bazı hatalar içeri girmiş olabilir. Düzeltmek için lütfen bu tür hataları bildirin.

Genel olarak herhangi bir CNN'de maksimum eğitim süresi, Tam Bağlantılı Katmandaki hataların Geri Yayılımına gider (görüntü boyutuna bağlıdır). Ayrıca maksimum bellek de onlar tarafından işgal edilir. İşte Stanford'dan VGG Net parametreleri hakkında bir slayt:

resim açıklamasını buraya girin

resim açıklamasını buraya girin

Tamamen bağlı katmanların parametrelerin yaklaşık% 90'ına katkıda bulunduğunu açıkça görebilirsiniz. Böylece maksimum hafıza onlar tarafından işgal edilir.

(3*3*3)(3*3*3)224*224224*224*(3*3*3)64224*22464*224*224*(3*3*3)87*106

56*56*25656*56(3*3*256)56*56256*56*56*(3*3*256)1850*106

strbende=1

chbirnnelsÖutput*(pbenxelÖutputhebenght*pbenxelÖutputwbendth)*(fbenlterhebenght*fbenlterwbendth*chbirnnelsbennput)

Hızlı GPU'lar sayesinde bu büyük hesaplamaları kolayca halledebiliyoruz. Ancak FC katmanlarında tüm matrisin yüklenmesi gerekir, bu da genellikle evrişimli katmanlar için geçerli olmayan bellek sorunlarına neden olur, bu nedenle evrişimli katmanların eğitimi hala kolaydır. Ayrıca tüm bunlar CPU'nun RAM'ine değil, GPU belleğine yüklenmelidir.

Ayrıca AlexNet'in parametre çizelgesi:

resim açıklamasını buraya girin

Ve burada çeşitli CNN mimarilerinin performans karşılaştırması:

resim açıklamasını buraya girin

CNN mimarilerinin köşe ve cephelerini daha iyi anlamak için Stanford Üniversitesi'nden CS231n Ders 9'a göz atmanızı öneririm .


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.