Son yıllarda, Konvolüsyonel Sinir Ağları (CNN'ler) bilgisayar vizyonunda nesne tanıma konusunda son teknoloji haline geldi. Tipik olarak, bir CNN birkaç evrimli tabakadan sonra bunu iki tam bağlı tabakadan oluşur. Bunun arkasındaki sezgisi, evrişimli katmanların girdi verilerinin daha iyi bir gösterimini öğrenmesi ve tam olarak bağlı olan katmanlar daha sonra bu gösterimi bir etiket kümesine göre sınıflandırmayı öğrenmesidir.
Bununla birlikte, CNN'ler baskın hale gelmeden önce, Destek Vektör Makineleri (SVM'ler) en gelişmiş teknolojisiydi. Bu nedenle, bir SVM'nin hala iki katmanlı, tamamen bağlı bir sinir ağından daha güçlü bir sınıflandırıcı olduğunu söylemek mantıklı görünüyor. Bu nedenle, en gelişmiş CNN'lerin neden SVM yerine sınıflandırma için tamamen bağlantılı katmanları kullanma eğiliminde olduklarını merak ediyorum? Bu şekilde, her iki dünyanın en iyisine sahip olacaksınız: güçlü bir özellik gösterimi ve güçlü bir özellik gösterimi yerine güçlü bir sınıflandırıcı, ancak zayıf bir sınıflandırıcı ...
Herhangi bir fikir?