Derin sinir ağları - Sadece görüntü sınıflandırması için mi?


14

Derin inanç veya evrişimli sinir ağları kullanarak bulduğum tüm örnekler, bunları görüntü sınıflandırma, chatacter algılama veya konuşma tanıma için kullanır.

Derin sinir ağları, özelliklerin yapılandırılmadığı (örneğin, bir sıra veya tablo halinde düzenlenmemiş) klasik regresyon görevleri için de yararlı mıdır? Evetse, bir örnek verebilir misiniz?


3
İlk cümleniz evrişimli sinir ağlarını getirir. Onları derin inanç ağlarıyla karıştırdığınız anlaşılıyor. Her ikisi de sinir ağlarının formları olmasına rağmen, aynı değildirler.
MSalters

1
Msalters ile aynı fikirde olurdum, ancak derin inanç ağlarının gerçekten derin ağlar olduğunu ve sınırlı başarıya sahip olduklarını söyleyebilirim, evrişimli ağlar daha çok evrişim katmanlarındaki melez - uyarlanabilir bir görüntü filtreleri ve ardından sığ nn gibidir.
seanv507

"Gözlemler" in yapılandırılmamış (bir sekans veya ızgarada düzenlenmemiş) "ile ne demek istiyorsun? Tek tek piksellerin bir ızgara üzerinde düzenlendiği anlamında "yapılandırılmış" görüntülerden bahsediyor musunuz? Ama sonra "gözlemler" değil, "yapılandırılmış" özellikler (bunlar bireysel görüntüler olurdu)?
amip diyor Reinstate Monica

Tüm Evrişim ağlarının derin olduğunu, hepsinin derin ağların evrim olmadığını ve benzer şekilde tüm derin inanç ağlarının derin olduğunu, tüm derin ağların derin inanç ağları olmadığını söyleyebilirim. Aslında ne derin ne de evrişimsel olmayan derin ağlara sahip olabilirsiniz, sadece eğitilmesi zor olma eğilimindedir. Yine de terminoloji üzerine anlamsız bir tartışma konusu var.
Lyndon White

Yapılandırılmamış (sıra / ızgara vb. Değil) verilere kıvrımlı bir ağ uygulayamazsınız. Temelde mantıklı değil. Bir evrişimsel ağ, girişinizin Fourier dönüşümünü almakla yakından ilişkilidir - örneğin, onu zaman alanından frekans alanına dönüştüren diziler için.
Lyndon White

Yanıtlar:


8

Derin bir sinir ağı ile sınıflandırmaya uygun hale getiren görüntülerin özellikleri, tonlarca özellik (muhtemelen RGB, yoğunluk vb. Milyarlarca piksel değilse milyonlarca) ve doğru etiketleriniz varsa, gürültülü veriler değildir. Bugünlerde kameralar çok iyi ve hiçbir şeyi yanlış ölçmüyorlar. İnternet sayesinde artık çok sayıda doğru etiketlenmiş görselimiz var. Derin bir ağ, gürültülü verilerle çok kolay bir şekilde geçebildiğiniz için gürültülü verilerle ilgili bir sorun olan keyfi olarak karmaşık işlevleri ifade edebilir, bu nedenle birçok öğrenme yöntemi neden karmaşık modelleri cezalandırma eğilimindedir. Ancak görüntü tanıma durumunda, gerçek işlev aslında çok karmaşık gibi görünüyor, fonksiyonel formun neye benzediğine dair hiçbir fikrimiz yok ve birçok durumda ilgili özelliklerin ne olduğunu bile bilmiyoruz.

Bu, görüntülerle ilgisi olmayan işlevleri öğrenmek için derin ağları kullanamayacağınız anlamına gelmez. Sadece olumsuzluklara karşı çok dikkatli olmanız gerekir, çoğunlukla aşırı takmaya çok eğilimlidir, ancak aynı zamanda hesaplama açısından pahalıdır ve eğitilmesi uzun zaman alabilir (bu günlerde paralel SGD ve GPU'larla ilgili bir sorun değil). Diğer dezavantajı, görüntü sınıflandırması için gerçekten önemli olmayan çok az model veya hiçbir yorumlanabilirliğe sahip olmanızdır. Biz sadece bilgisayarların bir şempanze ve bir orangutan arasındaki farkı tanımasını sağlamaya çalışıyoruz. İnsanların formülü anlaması önemli değil. Diğer alanlar için, özellikle tıbbi teşhis, politika araştırması vb. İçin, insan anlayışına ihtiyacınız olabilir veya hatta ihtiyacınız olabilir.


5

Tabii görüntü veya konuşma tanıma dışında birçok sorun için derin sinir ağları kullanabilirsiniz. Sorun gerçekten ihtiyacınız varsa.

Derin sinir ağları basit bir MLP'den çok daha güçlüdür, ancak daha fazla kaynak alırlar ve geliştirilmesi daha zordur. Böylece gerçekten karmaşık alanlarda kullanılırlar. Bunları daha kolay sorunları çözmek için kullanabilirsiniz, ancak genellikle daha basit modeller de iyi sonuçlar alır.

Kolay problemler için derin sinir ağlarını kullanmak, bir bazuka ile sinekleri öldürmek gibi olacaktır, onları öldüreceğinizden emin olabilirsiniz, ancak daha basit bir yol bulamadınız mı?


2
Bu cevap vermiyor. Kolay olan nedir zor olan nedir? Borsa tahmin / sınırlı örneklerden tahmin / / ... Bir sürü zor sorun var derin nns iyi hepsi?
seanv507

Derin sinir ağlarının herhangi bir şeyi çözebileceğini söylemedim. Demek istediğim, çok sayıda girişe sahip olduğunuz karmaşık alanlarda kullanılıyor. Her problemi çözemeyeceklerini biliyorum ama bu sorunun konusu bu değil. Mesele, görüntü / konuşma tanıma dışında başka sorunlara da uygulanabileceğini vurgulamaktır, ancak diğer modellerin uygulanabileceği durumlarda dikkate değer dezavantajları vardır.
davidivad

5

Davidivad'ın cevabına katılıyorum. Ama aynı zamanda derin sinir ağlarının görüntülere uygulanmasının, görüntülerin (ve daha da önemlisi, etiketlenmiş görüntülerin) toplanmasının nispeten ucuz olması olduğunu düşünüyorum. Diğer alanlarda, özellikle tipik bir sanayi veya devlet teşebbüsünün kısıtlamaları dahilinde, büyük ölçekte veri toplamak çok pahalı olabilir. Bu meseleyi birleştirmek, birçok uygulamada, ilgi fenomeni nispeten nadirdir, bu yüzden öğrenilecek değerli birkaç örnek olacaktır, bu nedenle nispeten büyük ölçekli bir veri toplama çabası bile bir sınıfın az sayıda üyesini verebilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.