CNN'lerin örüntü tanıma yeteneği görüntü işleme ile sınırlı mı?

21

Bir Döngüsel Sinir Ağı, önceden var olan görüntülerin bulunmadığı bir problem alanında örüntü tanıma için kullanılabilir, örneğin soyut verileri grafiksel olarak göstererek kullanılabilir mi? Bu her zaman daha az verimli olur mu?

Bu geliştirici , mevcut geliştirmenin daha ileriye gidebileceğini, ancak görüntü tanımanın dışında bir sınır olması halinde olmadığını söylüyor.

— dynrepsys
kaynak

1

Burada en az iki soru görüyorum. Ayrılmayı nasıl düşünüyorsun? Ayrıca, başlık sorusunda ne aradığınızı genişletebiliyorsanız, sorunun kalitesi çok daha yüksek olur.

— Eric Platon

@EricPlaton Biraz sıkıldı. Asıl sorum CNN'ler ve imgeler arasındaki ilişkinin doğası hakkında. İkinci soru için öneriniz ne olurdu?

— dynrepsys

Teşekkürler, soru benim için iyi (ancak cevabımı şimdi silmeliyim ~). İkinci soruya gelince, "yakalamak nedir" yaklaşımına ne dersiniz? "Her zaman daha az verimli mi?" Birisi bir karşı örnek bulabilirse hala iyidir.

— Eric Platon

"Bir Evrimsel Sinir Ağı, önceden var olan görüntülerin olmadığı bir problem alanında örüntü tanıma için kullanılabilir mi, yani soyut verileri grafiksel olarak göstererek mi?" Herhangi bir veriyi bir resim olarak temsil edip, CNN uygulayabiliyor muyuz? 100 özellikli bir veri kümesini okumak ve onu 10x10 görüntü olarak göstermek gibi mi?

— rcpinto

10

Konvolüsyonlu Ağlar (CNN), sinyal işleme için yaygın olarak kullanılan matematiksel konvolüsyona (örneğin 2D veya 3D konvolüsyonlar) dayanmaktadır. Görüntüler bir tür sinyaldir ve evrişim ses, titreşimler vb. Üzerinde eşit olarak kullanılabilir. Bu nedenle, ilke olarak, CNN'ler herhangi bir sinyale ve muhtemelen daha fazlasına uygulamalar bulabilir.

Uygulamada, bazı kişilerin özyinelemeli ağlardan ziyade CNN'lerle metin işlediği NLP (Matthew Graves tarafından bahsedildiği gibi) çalışmaları zaten var. Bazı diğer işler ses işleme için geçerlidir (burada referans yok, ancak henüz yayınlanmamış çalışmalar var).

Orijinal içerik: Şimdi değişen orijinal başlık sorusuna cevap olarak. Belki bunu silmek gerekiyor .

Karşılıklı ağlar (ve ilgili) üzerine yapılan araştırmalar, derin ağların bile kolayca kandırılabileceğini göstermektedir; bu , insanlara baktığında (makalede net örnekler varken) rastgele gürültü gibi görünen bir köpeği (veya herhangi bir nesneyi) görmelerini sağlar.

Diğer bir konu, bir sinir ağının genelleştirme gücüdür. Evrişimli ağlar, diğer tekniklerden daha iyi genelleme kabiliyetleri ile dünyayı hayrete düşürdü. Fakat eğer ağ sadece kedilerin beslenmesiyle besleniyorsa, sadece kedileri tanıyacaktır (ve ters ağ sonuçlarında olduğu gibi muhtemelen her yerde kedileri göreceksiniz). Başka bir deyişle, CN'ler bile öğrendiklerinin çok ötesinde bir genelleme yapmakta zorlanıyorlar .

Tanıma sınırını tam olarak tanımlamak zor. Sadece öğrenim verilerinin çeşitliliğinin limiti zorladığını söyleyebilirim (daha fazla detayın tartışma için daha uygun bir yer açması gerektiğini düşünüyorum).

— Eric Platon
kaynak

5

Basit cevap "hayır, görüntülerle sınırlı değil" dir: CNN'ler ayrıca doğal dil işleme için kullanılıyor. ( Giriş için buraya bakınız .)

Onları henüz grafik verilere uygularken görmedim, ancak bakmadım; Denenecek bazı şeyler var ve işe yarayacağı konusunda iyimserim.

— Matthew Graves
kaynak

3

Evrişimli sinir ağı sadece görüntü tanıma için değil aynı zamanda video analizi ve tanıma, doğal dil işleme, oyunlarda (örneğin Go ) ve hatta moleküller ve biyolojik proteinler arasındaki etkileşimi ^{wiki ile} tahmin ederek ilaç keşfi için de uygulanabilir .

Bu nedenle, daha tam olarak bağlı katmanlara bağlanmış evrişimli ve alt örnekleme katmanları kullanarak çeşitli problemler için kullanılabilir. Eğitilmesi daha kolaydır, çünkü aynı sayıda gizli üniteye sahip olan tamamen bağlı ağlardan daha az sayıda parametreye sahiptir. ^UFLDL

— kenorb
kaynak

3

Konvolüsyonel bir sinir ağı, kalıpların lokal olarak bağıntılı ve çevrilebilir olduğu yerlerde (değiştirilebilir). Bu durum, CNN'lerin girişin her yerinde belirli yerel kalıpları arayan filtreleri içermesi nedeniyle geçerlidir. Resimlerde, metinlerde, zaman serilerinde vb. Yerel ve çevrilebilir kalıpları bulacaksınız.

Verileriniz alakasız bir düzende bir özellik çantası gibi görünüyorsa, CNN kullanmanın bir anlamı yoktur. Bu durumda, giriş vektörünüzde birbirinden daha uzak olan özellikleri içeren kalıpları tespit etmekte sorun yaşayabilirsiniz. Girdi vektörlerinin veri noktalarını bilgileri kaybetmeden yeniden düzenleyebiliyorsanız, verilerinizde yerel ve çevrilebilir kalıpları bulamazsınız.

— BlindKungFuMaster
kaynak