(Neden) Kohonen tarzı SOM lehine düştü mü?


33

Söyleyebileceğim kadarıyla, Kohonen tarzı SOM'lerin 2005 yıllarında zirveye çıktıkları ve son zamanlarda pek fazla bir ricada bulunmadıkları görülüyor. SOM'lerin başka bir yöntemle yerine getirildiğini veya başka bir şeye eşdeğer olduğunu kanıtlayan herhangi bir makale bulamadım (yine de daha yüksek boyutlarda). Ancak, tSNE ve diğer metotlar günümüzde çok daha fazla mürekkep alıyor gibi gözüküyor, örneğin Vikipedi'de veya SciKit Learn'de ve SOM daha çok tarihsel bir yöntem olarak bahsedilir.

(Aslında bir Wikipedia makalesi, SOM’lerin rakipler karşısında bazı avantajlar sağlamaya devam ettiğini gösteriyor, ancak aynı zamanda listedeki en kısa giriştir. EDIT: İsteğin üzerine, düşündüğüm makalelerden biri: Doğrusal Olmayan Boyut Azaltma SOM’un bu konuda diğer yöntemlerden daha az yazıldığını unutmayın. SOM’lerin diğer yöntemlerin çoğunda tuttukları gibi bir avantajdan bahseden makaleyi bulamıyorum.

Herhangi bir görüş var mı? Birisi neden SOM'lerin kullanılmadığını sordu ve bir süre önce referanslar aldı ve ben SOM konferanslarından bir ilerleme buldular, ancak SVM'lerin veya tSNE ve arkadaşlarının yükselişinin SOM'leri pop-makinesi öğreniminde tutup tutmadığını merak ediyordum.

EDIT 2: Tamamen tesadüf eseri olarak, bu akşam doğrusal olmayan boyutsallığı azaltma üzerine bir 2008 anketi okuyordum ve sadece örnekler için: Isomap (2000), yerel olarak doğrusal gömme (LLE) (2000), Hessian LLE (2003), Laplacian eigenmaps (2003) ve yarı kesin gömme (SDE) (2004).


3
Bahsettiğiniz kaynaklardan herhangi birine bağlanabilir misiniz? (Örneğin, hangi Wikipedia makalesi "gösteriyor ki ..."?)
gung - Reinstate Monica

11
SOM'un neyi kastettiğini bilmediğim bir dereceye kadar iyilikten düştüler.
Matthew Drury

5
görünüşe göre, kendini organize eden harita
Christoph Hanck

SOM, sadece çok daha eski olan çok boyutlu bir ölçekleme (MDS) çeşididir.
kjetil b halvorsen

@kjetilbhalvorsen: SOM ve MDS ile ilgili herhangi bir referansınız var mı? Anladığım kadarıyla MDS doğada küresel (PCA ile ilgili), SOM ise doğada yerel. Ya da belki onları yanlış anlıyorum.
Wayne

Yanıtlar:


18

Makinenin öğrendiği şeylerin boyutsallığı azaltma için 'en iyi' algoritmalar olarak kullandıklarının etkisine dikkat çekerek bir şey üzerinde olduğunuzu düşünüyorum. T-SNE, Merck Viz Challenge gibi yarışmalarda etkinliğini göstermiş olsa da, SOM'u hem özellik çıkarımı hem de ikili sınıflandırma için uygulamakta başarı elde ettim. Algoritmanın yaşının yanı sıra, SOM'ları haklı göstermeden kesinlikle reddeden bazı kişiler olsa da (bu tartışmayı inceleyin , SOM'leri uygulayan ve olumlu sonuçlar elde eden son birkaç yıl içinde yayınlanan birkaç makale de vardır (bkz. Mortazavi ve ark. 2013 ; Frenkel ve diğerleri, 2013Örneğin). Bir Google Akademik araştırması, SOM'lerin hala bir dizi uygulama alanında kullanıldığını ortaya çıkaracaktır. Bununla birlikte, genel bir kural olarak, belirli bir görev için en iyi algoritma tam olarak şudur - belirli bir görev için en iyi algoritma. Rastgele bir ormanın belirli bir ikili sınıflandırma görevi için iyi çalıştığı durumlarda, başka bir yerde korkunç performans gösterebilir. Aynısı kümeleme, regresyon ve optimizasyon görevleri için de geçerlidir. Bu fenomen No Free Lunch Teoremine bağlıdır , ancak bu başka bir tartışma konusu. Özetle, eğer SOM sizin için belirli bir görevde en iyi şekilde çalışıyorsa, popüler olan ne olursa olsun, bu görev için kullanmanız gereken algoritma budur.


5

SOM'leri t-SNE ve daha fazlasıyla karşılaştırmaya yönelik araştırmalar yaptım ve SOM üzerinde yeni bir verimlilik seviyesine götüren bir gelişme önerdim. Lütfen buradan kontrol edin ve görüşlerinizi bize bildirin. İnsanların bu konuda ne düşündüğü ve insanların kullanması için pitonda yayınlanmaya değer olup olmadığı hakkında biraz fikir edinmek isterim.

IEEE makaleye bağlantı: http://ieeexplore.ieee.org/document/6178802/

Matlab uygulaması. https://www.mathworks.com/matlabcentral/fileexchange/35538-cluster-reinforcement--cr--phase

Geri bildiriminiz için teşekkürler.


4
Doğrulanmış Cross'a Hoşgeldiniz! Bulgularınızın kısa bir özetini, yaptığınız iyileştirmeyi ve belki de soruyu daha doğrudan ele almak yardımcı olacaktır.
Scortchi

1

Sübjektif görüşüm, SOM'lerin diğer pek çok yöntemden daha az 'seksi' olarak daha iyi tanındığı ve algılandığı, ancak bazı problem sınıfları için hala yüksek derecede ilgili olduğu yönünde. Daha yaygın olarak kullanıldıysa yapmak için önemli bir katkı sağlayabilecekleri iyi olabilir. Çok değişkenli verilerin 'peyzajı' veya 'topolojisi' hakkında bir fikir edinmek için keşif veri biliminin ilk aşamalarında paha biçilmezdirler.

Somoclu gibi kütüphanelerin gelişimi ve Guénaël Cabanes'in (diğerleri arasında) yaptığı araştırmalar, SOM'lerin hala ilgili olduğunu göstermektedir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.