Yüksek boyutlu alanı iki boyutlu bir düzleme nasıl yansıtırım?


11

N boyutlu bir alanda bir dizi veri noktam var. Buna ek olarak, aynı N boyutlu alanda da bir sentroidim var. Göreceli mesafe bilgilerini orijinal alanda tutarken bu veri noktalarını iki boyutlu bir uzaya yansıtmama izin verebilecek herhangi bir yaklaşım var mı? PCA doğru mu?


1
Mesafeleri korumaya çalışmak istiyorsanız, ilk düşüncem mesafelerin kendileri üzerinde çok boyutlu ölçeklendirme olurdu (PCA ile ilgili), ancak sadece mesafelere değil, konumlara sahip olduğunuzdan, anlayışımla PCA bunun için çalışmalı .
Glen_b Monica Monica'yı

1
@Glen_b, kilit noktası MDS mesafeler girdi içindir ve PCA koordinatları girişi için, ama bu değil o PCA birkaç boyutlarını korur iken tekrarlı uyan kaç boyutlarını MDS. Böylece MDS mesafeleri klasik PCA'dan biraz daha iyi korur. Sorunun cevabı Evet, PCA uygundur, ancak MDS daha uygundur.
ttnphns

1
Metrik uzay gömme alanında büyük ölçüde incelenen bu , yani mesafelerin bozulmasını en aza indirirken verilerinizin boyutsallığını nasıl azaltabilirsiniz.
Bitwise

Yanıtlar:


6

Sorununuzu ele alan genel bir çerçeveye boyutsallık azaltma denir. Verilerinizdeki "temel bilgileri" korurken, verileri N boyutlarından 2 boyuta yansıtmak istiyorsunuz. En uygun yöntem verilerinizin dağılımına, yani N-boyutlu manifolda bağlıdır. PCA, en küçük kareler kriterini kullanarak bir uçağa uyacaktır. Bu muhtemelen "swiss roll" örneği için kötü çalışır: swiss roll .

Daha modern yöntemler arasında Çekirdek PCA, LLE, difüzyon haritaları ve seyrek sözlük gösterimleri bulunmaktadır. Uzaklığın korunması ile ilgili olarak, bazı yöntemler öklidyen olmayan mesafeleri koruyabilir.


2
Bu "boyut indirgeme" yöntemler genellikle anlamına nota önemlidir değil korumak "göreli mesafesi bilgileri." Bu yöntemlerin yapılıp yapılmayacakları kısmen yönteme ve kısmen amaçlanan "mesafeye" bağlıdır.
whuber

2

Önceki cevapta belirtildiği gibi, boyutsal azaltmanın birtakım yöntemleri vardır ve dikkate alınması gereken önemli bir şey neyi temsil etmeye çalıştığınızdır - Öklid uzaklık ölçümleriyle ilgileniyor musunuz? Veya numuneler arasındaki benzerlik ölçüsü mü?

İlki için PCA uygun olabilir. Genellikle numunelerin ölçümü (hayvanlar, bitkiler vb.) Gibi sürekli ölçümlerle kullanılır. Yine de önceki cevaptaki daha modern sözlere bakardım.

Öklidyen olmayan bir mesafe metriği kullanarak benzerliği karşılaştırmaya çalıştığınız ikincisi için, Prensip Bileşenleri Sıralaması (PCoA) ve metrik Olmayan Çok Boyutlu Ölçekleme (NMDS) gibi birkaç iyi yöntem vardır. Bunları ne zaman kullanabileceğinize bir örnek, farklı alanlar arasındaki ekolojik toplulukları karşılaştırdığınızda ve bulunan farklı türde organizmaların olduğu zamandır. Yani, verileriniz "sayım" verileridir. Jaccard, Sorensen, Bray-Curtis gibi sitelerin organizmaların bileşiminde ne kadar benzer olduğunu etkili bir şekilde tahmin etmenizi sağlayan bir dizi benzerlik metriği vardır. PCoA ve NMDS temel olarak ekolojik mesafeyi (benzerlik) temsil etmek için örnekleri (sahaları) çizmenize izin verir ve her eksendeki alan için bir puanınız vardır.

Çok değişkenli analiz için birçok iyi kitap ve diğer kaynaklar vardır. Google'da "Ordination" ifadesini arayın. Ayrıca, 'vegan' adında bir R paketi var ve bu işin çoğunu gerçekleştirmek için gerçekten iyi.


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.