Soru Derin Artık Ağların ( ResNets ) mimarisi ile ilgili . Beş ana parkurun hepsinde "Büyük Ölçekli Görsel Tanıma Yarışması 2015" (ILSVRC2015) ' de birincilik kazanan model :
- ImageNet Sınıflandırması: “Ultra derin” (alıntı Yann) 152 katmanlı ağlar
- ImageNet Detection: 2'den% 16 daha iyi
- ImageNet Yerelleştirmesi: 2'den% 27 daha iyi
- COCO Tespiti: 2'den% 11 daha iyi
- COCO Segmentasyonu: 2'den% 12 daha iyi
Kaynak: MSRA @ ILSVRC ve COCO 2015 yarışmaları (sunum, 2. slayt)
Bu çalışma aşağıdaki makalede açıklanmıştır:
Microsoft Araştırma ekibi (ResNets: Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun):
derinliğin önemli bir rol oynadığını belirtin :
" Bu sonuçları basit ama temel bir kavramla elde ediyoruz - daha derine iniyoruz. Bu sonuçlar derinlik sınırlarını zorlama potansiyelini gösteriyor. "
Sunumlarında da vurgulanmıştır (daha derin - daha iyi):
- "Daha derin bir modelde daha yüksek eğitim hatası olmamalıdır."
- "Daha Derin ResNets daha düşük eğitim hatasına ve daha düşük test hatasına sahiptir."
- "Daha Derin Resnet'lerde hata daha düşük."
- "Tümü daha derin özelliklerden daha fazla faydalanıyor - birikimli kazançlar!"
- "Daha derin daha iyidir."
İşte 34 katmanlı artık yapısı (referans için):
Ancak son zamanlarda, artık ağların üstel topluluklar olduğunu gösteren yeni bir yorum getiren bir teori buldum:
Artık Ağlar Nispeten Sığ Ağların Üstel Topluluklarıdır (2016)
Derin Resnet'ler, çıktıları çeşitli derinliklerde toplanan birçok sığ ağ olarak tanımlanır. Makalede bir resim var. Açıklama ile ekliyorum:
Artık Ağlar geleneksel olarak Denklem (1) 'in doğal bir temsili olan (a) olarak gösterilmektedir. Bu formülasyonu Denklem (6) 'ya genişlettiğimizde, 3 bloklu artık ağın (b) çözülmüş bir görünümünü elde ederiz. Bu görünümden, artık ağların giriş ve çıkışı bağlayan O (2 ^ n) örtülü yollara sahip olduğu ve bir blok eklemenin yol sayısını iki katına çıkardığı açıktır.
Makalenin sonunda şöyle belirtilmektedir:
Derinlik değil, artık ağları güçlü kılan topluluktur . Kalan ağlar, ağ derinliğinin değil, ağ çokluğunun sınırlarını zorlar. Önerdiğimiz çözülmemiş görüşümüz ve lezyon çalışması, artık ağların üstel olarak birçok ağın örtülü bir topluluğu olduğunu göstermektedir. Gradyan katkı yolların en çok kısa bir ağın genel derinliğine göre ise, derinliği artan tek başına temel özelliği olamaz kalıntı ağlar. Şimdi inanıyorum çokluğu , yolların sayısı bakımından ağın expressability, oynadığı kilit rol .
Ancak, doğrulanabilen veya reddedilebilen yalnızca yeni bir teoridir. Bazen bazı teoriler çürütülür ve makaleler geri çekilir.
Sonuçta derin Resnet'leri bir topluluk olarak mı düşünmeliyiz? Topluluk veya derinlik artık ağları bu kadar güçlü kılıyor mu? Geliştiricilerin bile kendi modellerinin neyi temsil ettiğini ve içindeki anahtar kavramın ne olduğunu tam olarak algılamaması mümkün müdür?