@gung, mesafe matrisinden veri oluşturmak için bir ön araç olarak çok boyutlu ölçeklendirmeyi (YTH) önermek için kesinlikle doğrudur points X dimensions
. Sadece birkaç vuruş ekleyeceğim. K-aracı kümelemesi öklid mesafelerini ifade eder . MDS size boyut-içi koordinatlar verecek ve böylece öklid mesafelerini garanti edecektir. Metrik MDS kullanmalı ve olabildiğince büyük boyutlarda talep etmelisiniz, çünkü amacınız verileri yeniden oluşturma hatasını en aza indirmektir, 2D veya 3D olarak eşlemek değil.
Elinizde MDS yazılımınız yoksa, özdeğer ayrışması veya tekil değer ayrıştırması gibi bazı matris fonksiyonlarına sahipseniz ne olur? O zaman basit metrik MDS'yi kendiniz de yapabilirsiniz - Ana Koordinatlar analizi (PCoA) olarak da bilinen Torgerson MDS. Biraz "bükülmüş" Temel Bileşenler analizi anlamına gelir. Oldukça basit olmasına rağmen, burada açıklamayacağım. Bu konuda birçok yerde okuyabilirsiniz, örneğin burada .
Son olarak, "uzaklık matrisi girişi için K araçları" nı doğrudan programlamak mümkündür - PCoA veya başka bir metrik MDS yapan işlevleri çağırmak veya yazmaksızın. Biliyoruz ki, (a) merkezden kare sapmaların toplamı, nokta sayısına bölünen çift kareli kare Öklid mesafelerinin toplamına eşittir ; ve (b) küme centroidleri arasındaki mesafenin uzaklık matrisinden nasıl hesaplanacağını bilmek ; (c) ve ayrıca , Toplam Kareler toplamının K-araçlarıyla nasıl ilişkili olduğunu da biliyoruz . Hepsi bir arada, istediğiniz algoritmayı basit ve karmaşık bir taahhüt değil yazıyor. K-araçlarının sadece Öklid mesafeleri / öklid uzayları için olduğu hatırlanmalıdır. Öklid olmayan mesafeler için K-medidler veya başka yöntemler kullanın.
Benzer bir soru .