GMM sonsuza kadar uzanan örtüşen tepeler kullanır (ancak pratik olarak sadece 3 sigma için sayılır). Her puan tepelerin tüm olasılık puanlarını alır. Ayrıca, tepeler "yumurta şeklindedir" [tamam, simetrik elipslerdir ] ve tam kovaryans matrisi kullanılarak eğilebilir .
K- , tek bir kümeye bir nokta atamak anlamına gelir , böylece diğer küme merkezlerinin puanları yok sayılır (örtük olarak sıfırlanır / umursamaz). Tepeler küresel sabun köpüğüdür. İki sabun köpüğünün temas ettiği yerde, aralarındaki sınır düz (hiper-) bir düzlem haline gelir. Tıpkı birçok sabun köpüğünden oluşan bir köpüğü üflediğinizde, içerideki kabarcıklar düz değildir, ancak kutudur, bu nedenle birçok (hiper-) küre arasındaki sınırlar aslında alanın bir Voronoi bölümünü oluşturur. 2D'de, bu altıgen yakın ambalaj gibi belirsiz bir şekilde görünme eğilimi gösterir, bir arı kovanını düşünür (tabii ki Voronoi hücrelerinin altıgen olması garanti edilmez). K-tepesi yuvarlaktır ve eğilmez, bu nedenle temsil gücü daha azdır; ancak özellikle yüksek boyutlarda hesaplamak çok daha hızlıdır.
K-araçları Öklid uzaklık metriğini kullandığından, boyutların karşılaştırılabilir ve eşit ağırlıkta olduğunu varsayar. Bu nedenle, X boyutunun saatte mil birimi, 0 ila 80 arasında değişen ve Y boyutunun birimi 0 ila 400 arasında değişen bir birimi varsa ve bu XY alanına daireler ekliyorsanız, bir boyut (ve yayılması) olacak daha güçlü başka boyuttan daha ve sonuçları gölge düşürecektir. Bu nedenle K-ortalamalarını alırken verileri normalleştirmek gelenekseldir .
Hem GMM hem de K-araçları , verilere en iyi yaklaşımları sığdırmak suretiyle verileri modeller . GMM eğik yumurtalara ve K-araçları eğik kürelere uyuyor. Ancak temeldeki veriler herhangi bir şey gibi şekillendirilebilir, spiral veya Picasso resmi olabilir ve her algoritma yine de çalışır ve en iyi görüntüsünü alır. Ortaya çıkan modelin gerçek verilere benzeyip benzemeyeceği, veriyi oluşturan temel fiziksel sürece bağlıdır. (Örneğin, zaman gecikmesi ölçümleri tek taraflıdır; Gausslu iyi bir uyum mudur? Belki.)
R,n
Böylece 8x8 ikili görüntünüz ilk hiper kadranda 64 boyutlu hiperküp olarak yorumlanacaktır. Algoritmalar daha sonra kümeleri bulmak için geometrik analojiler kullanır. K-araçlarıyla uzaklık, 64 boyutlu uzayda Öklid mesafesi olarak görünür. Bunu yapmanın bir yolu var.