Kümeleme yöntemi olarak sıklıkla kullanılan bir vektör niceleme yöntemi olan K-Means prosedürü, açıkça hiyerarşik ve rastgele yakınlık ölçüsü sağlayan bazı diğer kümelemelerin aksine, kesinlikle çift / çift b / w veri noktalarını kullanmaz . Tekrar tekrar en yakın centroid noktalarına atanır ve böylece veri noktalarından bir centroid'e Öklid mesafesini kullanır . Bununla birlikte, K-Means , örtülü olarak çift taraflı Öklid mesafelerinin s / b veri noktalarına dayanmaktadır , çünkü merkezden kare sapmaların toplamı, sayıların bölünmesiyle, çift kare kare Öklid mesafelerinin toplamına eşittir.. "Centroid" terimi, Öklid geometrisinden gelmektedir. Öklid uzayında çok değişkenli ortalamadır. Öklid uzayı öklid mesafeleri ile ilgilidir. Öklid dışı mesafeler genellikle Öklid uzayını kapsamaz. Bu yüzden K-Means sadece Öklid mesafeleri içindir.
Ancak, Öklid mesafesinin s / b iki veri noktası, çeşitli alternatif yollarla gösterilebilir . Örneğin, bir yakından bağlı nokta ağırlık / kosinüs veya sayısal ürünü b. Eğer kosinüsünüz, kovaryansınız veya korelasyonunuz varsa , her zaman (1) onu (kare) Öklid mesafesine dönüştürebilir ve sonra (2) bu Öklid mesafelerinin matrisi için veri oluşturabilirsiniz (Asli Koordinatlar veya diğer metrik formlar aracılığıyla). Çok Boyutlu Ölçeklendirme) ila (3) bu verileri K-anlamına gelir. Bu nedenle, K- Means'ı çift kosinüslerle "çalışma" yapmak mümkündür ; Aslında, K-Means kümelenmesinin bu gibi uygulamaları mevcuttur. Ayrıca bakınız hakkında "mesafe matrisi için K araçları" uygulaması.
Öyle mümkün bunun bir şekilde K-araçları programlamak için doğrudan elbette İkili Öklid mesafeler, kare matris üzerine hesaplayın. Ancak, yavaş çalışacak ve bu yüzden daha etkili yol, bu mesafe matrisi için veri oluşturmaktır (mesafeleri skaler ürünlere dönüştürmek ve böylece - önceki paragrafta belirtilen geçiş) - ve sonra standart K-aracı prosedürünü uygulamaktır. Bu veri kümesine.
Ben Öklid veya Öklid dışı farklılık olmadığını konuyu değerlendiriyordu unutmayınız veri noktaları arasındaki K-araçlarla uyumludur. Centroidden (geniş anlamda, merkez veya kuasententroid) hiç bir iltihap sapmasının K-aracına dahil edilip edilemeyeceği veya "K-vasıtaları" olarak değiştirilip değiştirilemeyeceği ile ilgili değildir.
İlgili soruya bakın K-ne anlama gelir: Neden WCSS’yi minimize etmek kümeler arasındaki mesafeyi maksimize ediyor? .