Bazı derslerde, "Xavier" kilo başlatmanın (kağıt: Derin ileri beslemeli sinir ağlarını eğitmenin zorluğunu anlamanın ) sinir ağlarının ağırlıklarını başlatmanın etkili bir yolu olduğunu ifade ettim .
Tamamen bağlı katmanlar için bu öğreticilerde temel bir kural vardı:
burada , normal dağılımla başlatılan ve , , bir katman için ağırlıkların varyansıdır ve , üst ve mevcut katmandaki nöron miktarıdır.
Evrişimsel katmanlar için benzer kurallar var mı?
Bir evrişimsel katmanın ağırlıklarını başlatmak için neyin en iyi olacağını bulmak için uğraşıyorum. Örneğin, ağırlıkların şeklinin olduğu bir katmanda (5, 5, 3, 8)
, böylece çekirdek boyutu, 5x5
üç giriş kanalını (RGB girişi) filtrelemek ve 8
özellik haritaları oluşturmak ... 3
giriş nöronlarının miktarı olarak kabul edilir mi? Daha doğrusu 75 = 5*5*3
, girdi 5x5
her renk kanalı için yamalar olduğu için mi?
Her ikisini de, sorunu açıklığa kavuşturan belirli bir cevabı veya ağırlıkların doğru şekilde başlatılmasını ve tercihen kaynakları bağlamanın genel sürecini açıklayan daha "genel" bir cevabı kabul ediyorum.