Tamamen bağlanmış katmanlar CNN'lerde ne yapar?


19

Katlamalı ve havuzlama katmanlarını anlıyorum, ancak CNN'lerde tamamen bağlı bir katmanın nedenini göremiyorum. Önceki katman neden çıktı katmanına doğrudan bağlı değil?

Yanıtlar:


31

Evrişimsel katmanlardan elde edilen veriler, verilerdeki üst düzey özellikleri temsil eder. Bu çıktı düzleştirilip çıktı katmanına bağlanabilirken, tamamen bağlı bir katman eklemek, bu özelliklerin doğrusal olmayan kombinasyonlarını öğrenmenin (genellikle) ucuz bir yoludur.

Esasen kıvrımlı katmanlar anlamlı, düşük boyutlu ve biraz değişmez bir özellik alanı sağlar ve tam olarak bağlı katman o alanda (muhtemelen doğrusal olmayan) bir işlevi öğrenir.

NOT: FC katmanlarından Conv katmanlarına dönüştürmek önemsizdir. Bu üst FC katmanlarını Conv katmanlarına dönüştürmek, bu sayfada açıklandığı gibi yardımcı olabilir .


Cevabınız için teşekkürler James. Yani geri yayılım ile bağlı katmanlar arasındaki ağırlıkları öğreniyoruz, doğru mu?
jeff

Evet, hata tamamen bağlı katmandan evrişimli ve havuzlu katmanlara geri yayılır.
jamesmf

Tamam. Böylece fc katmanının amacı doğrusal olmayan PCA gibi düşünülebilir, "iyi" özellikleri düzeltir ve tüm ağırlık setini öğrenerek diğerlerini azaltır.
jeff

1
Çoğunlukla doğrusal olmayan özellik kombinasyonuna izin verir. Tüm özellikler iyi olabilir ("ölü" özelliklere sahip olmadığınız varsayılarak), ancak bu özelliklerin kombinasyonları daha da iyi olabilir.
jamesmf

@jamesmf: Ölü özellik nedir? ve bahsettiğiniz özelliklerin kombinasyonları nelerdir? doğrusal olmayan bir kombinasyonla ne demek istiyorsun? CNN'de tam bağlantılı bir katman kullanmak zorunlu mudur? veya doğruluk üzerinde olumsuz bir etkisi olmadan ikame edilebilir mi? Şimdiden çok teşekkürler. Sorduğum sorular üzerine bir sezgi verebilirseniz minnettar olurum.
Rika

4

Ben bu cevabı bulundu Anıl-Sharma üzerinde Quora'daki yararlı.

Tüm ağı (sınıflandırma için) iki kısma ayırabiliriz:

  • Özellik çıkarımı : SVM'ler gibi geleneksel sınıflandırma algoritmalarında, sınıflandırma işlemini yapmak için verilerden özellikler çıkarırdık. Evrişimsel katmanlar aynı özellik çıkarma amacına hizmet etmektedir. CNN'ler verilerin daha iyi temsil edilmesini sağlar ve bu nedenle özellik mühendisliği yapmamız gerekmez.

  • Sınıflandırma : Özellik çıkarıldıktan sonra verileri çeşitli sınıflara sınıflandırmamız gerekir, bu tamamen bağlı (FC) bir sinir ağı kullanılarak yapılabilir. Tamamen bağlanmış katmanlar yerine, SVM gibi geleneksel bir sınıflandırıcı da kullanabiliriz. Ancak genellikle modeli uçtan uca eğitilebilir hale getirmek için FC katmanları ekliyoruz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.