Bildiğim kadarıyla, bir kümenin "ortalaması" ve tek bir kümenin centroidi aynı şeydir, ancak "centroid" terimi çok değişkenli verilerle uğraşırken "ortalama" dan biraz daha kesin olabilir.
Centroid'i bulmak için, puanların konumlarının (aritmetik) ortalaması her bir boyut için ayrı ayrı hesaplanır. Örneğin, puanınız varsa:
- (-1, 10, 3),
- (0, 5, 2) ve
- (1, 20, 10),
daha sonra, merkez ((-1 + 0 + 1) / 3, (10 + 5 + 20) / 3, (3 + 2 + 10) / 3) 'te bulunur, bu da basitleştirir (0, 11 2/3, 5). (Not: Centroid olması gerekmez - ve nadiren --- orijinal veri noktalarından biridir)
Merkeze bazen fiziksel yorumuna göre (noktaların tanımladığı bir cismin kütle merkezi) kütle merkezi veya barycenter adı da verilir. Ortalamalar gibi, merkezin konumu da diğer noktalardan toplam kareler arasındaki mesafeyi en aza indirir.
İlgili bir fikir, diğer tüm veri noktalarından "en az benzeyen" veri noktası olan mediddir . Centroidin aksine, medyanın orijinal noktalarından biri olması gerekiyor. Ayrıca, medyan için analgo olan geometrik çok değişkenli, ancak çok değişkenli veriler için de ilginizi çekebilir . Bunların ikisi de sentroidden farklı.
Ancak Gabe'nin cevabında işaret ettiği gibi , kümeleri karşılaştırırken "centroid mesafesi" ile "ortalama mesafe" arasında bir fark vardır. Ağırlık merkezi mesafe kümesi arasında ve sadece arasındaki mesafedir ve . Ortalama mesafe , kümede bulunan noktalar arasındaki ortalama ikili mesafe bulunması ile hesaplanır. Başka bir deyişle, her nokta için küme içinde , sen hesaplamak , , ...B centroid ( A ) centroid ( B ) a i A dist ( a i , b 1 )ABcentroid(A)centroid(B)aiAdist(ai,b1)dist ( bir i , B , n )dist(ai,b2)dist ( birben, bn) ve hepsini birlikte ortalayın.