Ben giriş parametresi (küme sayısı ) ile bir kümeleme algoritması (k-anlamına gelir) var . Kümeleme yaptıktan sonra bu kümelemenin niceliksel bir ölçüsünü almak istiyorum. Kümeleme algoritmasının önemli bir özelliği vardır. İçin k = 2 Beslemem halinde N sonucu bu algoritmaya aralarında anlamlı bir fark gözetilmeksizin veri noktaları I ihtiva eden tek bir küme alacak N - 1 veri noktaları ile bir küme 1 veri noktası. Açıkçası istediğim bu değil. Bu yüzden, bu kümelenmenin makul olduğunu tahmin etmek için bu kalite ölçüsünü hesaplamak istiyorum. İdeal olarak bu önlemleri farklı k için karşılaştırabileceğim.. Bu yüzden aralığında kümeleme yapacağım ve en iyi kaliteyi seçeceğim. Bu kalite ölçüsünü nasıl hesaplayabilirim?
GÜNCELLEME:
İşte kötü bir kümeleme olduğunda bir örnek . Diyelim ki bir düzlemde eşkenar üçgen oluşturan 3 nokta var. Bu noktaları 2 kümeye ayırmak, onları 1 veya 3 kümeye ayırmaktan daha kötüdür.