Yüksek boyutlu verileri görselleştirme


11

Yüksek boyutlu uzayda vektör olan iki sınıftan örneklerim var ve bunları 2D veya 3D olarak çizmek istiyorum.

Boyut azaltma teknikleri hakkında biliyorum, ama gerçekten basit ve kullanımı kolay bir araç (matlab, python veya önceden oluşturulmuş bir .exe) gerekir.

Ayrıca merak ediyorum 2D temsil "anlamlı" olacak? (Örneğin, iki sınıf nasıl kesişebilir veya ayrılabilir olabilir).

Yanıtlar:


8

Sen verebilir tSNE bir deneyin. Kullanımı oldukça basittir. Matlab ve Python'a ek olarak Octave ile birlikte çalışır. Bir dakika içinde ilk arsa almak için rehbere bir göz atın .


10

Yüksek boyutlu verileri görselleştirmek için önceden oluşturulmuş bir araç ggobi'dir . Noktaları grupları temsil edecek şekilde renklendirmenize olanak tanır ve ardından yüksek boyutları 2 boyutlu bir gösterime indirgemek için birkaç seçeneğe sahiptir. Özellikle güzel bir araç, veri bulutunu temel olarak birden çok boyutta döndüren ve size rotasyonun 2D projeksiyonunun bir animasyonunu gösteren 2D büyük tur. İlginç desenler gördüğünüzde dönüşü yavaşlatabilir veya duraklatabilirsiniz.


R ile de çalışan çok iyi bir araç
Yves


2

Klasik yaklaşım, doğrusal boyutsallık azalması gerçekleştirmek için PCA ( Ana Bileşen Analizi ) kullanmak olacaktır . Temel olarak, bu, verilerinizin varyansını mümkün olduğunca korurken, verilerinizi daha düşük boyutlu bir alana (2B durumda bu sadece bir düzlemdir) yansıtır.

PCA'yı çalıştırmak genellikle çoğu programlama dilinde tek bir komut yürütmeyi içerir, bu yüzden çok basittir.

Verilerinizin 2 veya 3 boyutta doğru bir şekilde temsil edilemediğini unutmamalısınız. PCA size otomatik olarak bunun kantitatif bir tahminini verecektir: Sonuçta ortaya çıkan düşük boyutlu gösterimde varyansın yüzde kaçının yakalandığını size söyleyecektir. Bu, bu basitleştirilmiş görselleştirmeye bakarak ne kadar bilgi kaybettiğinizi hissetmenizi sağlayacaktır.



1

Sınıf üyeliği olasılığı, boyutun azaltılması için harika bir yöntemdir. A ve B'ye üyelik olasılığı 0 ile 1 arasında değişmektedir. Tüm örnekleriniz için ve nin bir çizimini yapabilirsiniz . p(bir|xben)p(B|xben)

Görüntüleme seçenekleri için aşağıdaki örneği düşünün. http://www.mathworks.com/help/stats/gmdistribution.cluster.html


1

@ Juampa'nın önerisinin yanı sıra , " doğrusal olmayan boyutsallığın azaltılmasına yönelik ilkeli bir bilgi erişim tabanlı yaklaşım " olan NeRV'yi de denemelisiniz ve SNE / t-SNE özel NeRV vakaları olarak görülebilir. NERV ana noktası arasında bir takası minimize etmektir hatırlama ve hassas orijinal boşluk ve ekran arasında. NeRV, C ++ ile yazılmış bir komut satırı aracı olarak sağlanır.

Web sitelerinden bir demo resim: sol sonuç hatırlamada daha az vurgulanır (daha az "özledim"), sağdaki ise hassasiyet üzerinde daha az vurgulanır (daha az "yanlış komşular").

resim açıklamasını buraya girin


1

Ticari yazılıma herhangi bir itirazınız yoksa, PCA, LDA, SMACOF, tSNE, CCA, Sammon, Kohonen Haritası vb.Gibi yöntemler de dahil olmak üzere yüksek boyutlu veriler için düzinelerce doğrusal ve doğrusal olmayan haritalama algoritması uygulayan VisuMap yazılımını deneyebilirsiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.