Konvolüsyonlu Ağlar (CNN), sinyal işleme için yaygın olarak kullanılan matematiksel konvolüsyona (örneğin 2D veya 3D konvolüsyonlar) dayanmaktadır. Görüntüler bir tür sinyaldir ve evrişim ses, titreşimler vb. Üzerinde eşit olarak kullanılabilir. Bu nedenle, ilke olarak, CNN'ler herhangi bir sinyale ve muhtemelen daha fazlasına uygulamalar bulabilir.
Uygulamada, bazı kişilerin özyinelemeli ağlardan ziyade CNN'lerle metin işlediği NLP (Matthew Graves tarafından bahsedildiği gibi) çalışmaları zaten var. Bazı diğer işler ses işleme için geçerlidir (burada referans yok, ancak henüz yayınlanmamış çalışmalar var).
Orijinal içerik: Şimdi değişen orijinal başlık sorusuna cevap olarak. Belki bunu silmek gerekiyor .
Karşılıklı ağlar (ve ilgili) üzerine yapılan araştırmalar, derin ağların bile kolayca kandırılabileceğini göstermektedir; bu , insanlara baktığında (makalede net örnekler varken) rastgele gürültü gibi görünen bir köpeği (veya herhangi bir nesneyi) görmelerini sağlar.
Diğer bir konu, bir sinir ağının genelleştirme gücüdür. Evrişimli ağlar, diğer tekniklerden daha iyi genelleme kabiliyetleri ile dünyayı hayrete düşürdü. Fakat eğer ağ sadece kedilerin beslenmesiyle besleniyorsa, sadece kedileri tanıyacaktır (ve ters ağ sonuçlarında olduğu gibi muhtemelen her yerde kedileri göreceksiniz). Başka bir deyişle, CN'ler bile öğrendiklerinin çok ötesinde bir genelleme yapmakta zorlanıyorlar .
Tanıma sınırını tam olarak tanımlamak zor. Sadece öğrenim verilerinin çeşitliliğinin limiti zorladığını söyleyebilirim (daha fazla detayın tartışma için daha uygun bir yer açması gerektiğini düşünüyorum).