Adını verdiğiniz tüm konulara bir giriş metni olarak, derin öğrenme kitabını tavsiye ederim . Alan hakkında geniş bir genel bakış sağlar. Bu parametrelerin her birinin oynadığı rolü açıklar.
Bence en popüler mimarilerden bazılarını (resnet, başlangıç, alex-net) okumak ve tasarım kararlarına yol açan temel fikirleri çıkarmak çok yararlıdır. Yukarıda belirtilen kitabı okuduktan sonra.
Bahsettiğiniz derslerin müfredatında, evrişim katmanının nasıl çok sayıda parametre (ağırlık, önyargı) ve nöron eklediği ayrıntılı olarak açıklanmaktadır. Bu katman, bir kez eğitildikten sonra, görüntüden anlam kalıpları çıkarabilir. Alt katmanlar için bu filtreler kenar çıkarıcılara benzer. Daha yüksek katmanlar için, bu ilkel şekiller daha karmaşık formları tanımlamak için birleştirilir. Bu filtreler çok sayıda parametre içerir ve karmaşık ağların nasıl tanımlanabileceği ve yine de parametre sayısını azaltabileceği konusunda derin ağların tasarımında büyük bir sorun vardır.
Komşu pikseller güçlü bir şekilde ilişkilendirildiğinden (özellikle en alt katmanlarda), filtre yanıtını alt örnekleyerek (havuzlaştırarak) çıktının boyutunu küçültmek mantıklıdır. İki piksel birbirinden ne kadar uzak olursa, o kadar az ilişkilidir. Bu nedenle, havuzlama katmanında büyük bir adım yüksek bilgi kaybına yol açar. Bilinçsiz konuşma. Havuzlama katmanı için 2 adımlı bir adım ve 2x2 boyutunda bir çekirdek yaygın bir seçimdir.
Daha sofistike bir yaklaşım, daha geniş ağlar için bir başlangıç modülüne karşı evrişimsel bir katmandaki parametre sayısını alıp fikrin seyrekliği arttırmak, ancak daha yüksek bir doğruluk elde edebilmek olan Başlangıç ağıdır ( kıvrımlarla daha derine inmek ).
Mevcut mimariler ve tasarım boyutlarının bazılarının yapılandırılmış, sistematik bir şekilde rolü hakkında ipuçları veren güzel bir kağıt SqueezeNet: 50 kat daha az parametre ve <0,5 MB model boyutuyla AlexNet düzeyinde doğruluk . Daha önce bahsedilen modellerde tanıtılan fikirler üzerine kuruludur.