K-ortalamaları kümelemede toplam ss ve ss arasındaki anlam nedir?


10

Küme analizinde çok yeniyim. R'yi k-araçları kümelemesi için kullanıyorum ve bunların ne olduğunu merak ediyorum. Ve oranları daha küçük veya daha büyükse daha iyi olan nedir?

Yanıtlar:


12

Temel olarak, k-araçlarının bulduğu sınıflamanın iyiliğinin bir ölçüsüdür. SS, Karelerin Toplamı anlamına gelir, bu yüzden "Arasında" sapma ve "İçinde" sapmadaki sapmaların olağan ayrışmasıdır. İdeal olarak, iç bütünlük ve dış ayırma özelliklerine sahip bir kümeleme istiyorsunuz, yani BSS / TSS oranı 1'e yaklaşmalıdır.

Örneğin, R dilinde:

data(iris)
km <- kmeans(iris[,1:4], 3)

% 88.4 (0.884) BSS / TSS oranı verir. Dikkatli olmalısınız ve bu sayı önceden belirtilmesi gerektiğinden, WSS'yi küme sayısına göre çizmek genellikle iyi bir fikirdir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.