Bir sinir ağının ne öğrendiğini anlamak zor ama doğru o kadar çok iş var ki. Ağımızın aradığı şey hakkında kesinlikle bir fikir edinebiliriz.
Görüntüler için evrişimli bir sinir ağını düşünelim. İlk katmanımız için filtrelerini görüntünün üzerine kaydırdığımızı yorumluyoruz , bu nedenle ilk gizli katmanımız görüntünün küçük parçaları ile çeşitli filtrelerimiz arasındaki anlaşmaya tekabül ediyor. İlk temsil katmanımızın ne olduğunu görmek için bu filtreleri görselleştirebiliriz:K
Bu resim, bir AlexNet'teki ilk filtre katmanına ait ve bu harika dersten alınmıştır: http://cs231n.github.io/understanding-cnn/ . Bu, ilk gizli katmanı, ham piksellerden oluşan görüntüyü temsil etmeyi öğrenme olarak yorumlamamıza izin verir, burada her bir koordinat, görüntünün küçük bir bölgesi ile bir filtrenin anlaşmasıdır. Bir sonraki katman bu filtre aktivasyonları ile çalışmaktadır.
⎡⎣⎢0101−41010⎤⎦⎥.
0
Erhan ve arkadaşlarının (2009) bu makalesi buna katılıyor: ilk gizli katman görselleştirmelerinin ortak olduğunu (ve 2009'da geri döndüğünü) ancak daha derin katmanları görselleştirmenin zor olduğunu söylüyorlar. Bu kağıttan:
Bu araştırmanın temel deneysel bulgusu çok şaşırtıcı: bir iç birimin girdi görüntülerine, görüntü uzayındaki bir işlev olarak yanıtı tekdüze görünüyor veya en azından test edilen tüm rasgele başlatmalar için maksimum ve güvenilir bir şekilde bulundu. . Bu ilginç çünkü bu baskın modu bulmak oldukça kolaydır ve daha sonra gösterilmesi ünitenin yaptıklarının iyi bir karakterizasyonunu sağlar.
Chris Olah ve arkadaşları ( https://distill.pub/2017/feature-visualization/ ) bunun üzerine inşa edilir ve genel olarak ağın ne olduğunu anlamak için nasıl büyük aktivasyonlara yol açan görüntüler üretebileceğinizi tartışır (1). için bakıyor; veya (2) gerçek giriş görüntülerini çekin ve görüntünün farklı bölümlerinin ağı nasıl etkinleştirdiğini görün. Bu yazı üzerinde duruluyor (1).
Aşağıdaki resimde Olah ve arkadaşlarının bu makalesinden alınan yazarlar, ağın inceleyebileceğiniz farklı yönlerini tartıştılar. En soldaki resim, belirli bir nöronun aktivasyonunun giriş görüntüsü alanı üzerinde optimize edilmesinin sonucunu gösterir.
Bunu daha iyi anlamak istiyorsanız, bu makalenin tamamını okumanızı şiddetle tavsiye ediyorum ve referanslarını okuyarak bununla neler yapıldığını çok iyi anlamanız gerekir.
Tabi ki bu sadece insanların girdiği girişleri anlayabildiğimiz görüntüler içindi. Eğer yorumlamak için daha zor bir şeyle çalışıyorsanız, sadece büyük bir sayı vektörü gibi, o zaman böyle güzel görselleştirmeler yapamayabilirsiniz, ancak prensipte, çeşitli nöronları, katmanları vb. Değerlendirmek için hala bu teknikleri düşünebilirsiniz. .