Hiyerarşik bir kümelemenin geçerli olması için bir mesafenin “metrik” olması gerekir mi?


9

N öğesi arasında bir metrik olmayan bir mesafe tanımladığımızı varsayalım .

Bu mesafeye dayanarak daha sonra Aglomeratif hiyerarşik bir kümeleme kullanıyoruz .

Anlamlı sonuçlar elde etmek için bilinen algoritmaların her birini (tek / maksimum / avaerage bağlantısı vb.) Kullanabilir miyiz? Veya farklı bir deyişle, mesafe bir metrik değilse bunları kullanmayla ilgili sorun nedir?


Sizin durumunuzdaki "öğeler" nedir? (Psikometri ile bir ilgisi olup olmadığını soruyorum çünkü durum buysa, madde kümelemesine veya Revelle, W'ye bakmanızı tavsiye ederim. Hiyerarşik küme analizi ve testlerin iç yapısı , MBR (1979) 14 : 57.)
chl

Yanıtlar:


7

Mesafeler için gereksinimler hiyerarşik kümeleme yöntemine bağlıdır. Tek, tam, ortalama yöntemler negatif olmayan ve simetrik olmak için mesafelere ihtiyaç duyar. Ward, centroid, medyan yöntemlerin geometrik olarak anlamlı sonuçlar elde etmek için (kare) öklid (metrikten daha dar bir tanımdır) mesafelerine ihtiyacı vardır.

(Mesafe matrisinin iki katına [öyleyse buraya bakın ] ve özdeğerlere bakarak öklidyen olup olmadığını kontrol edebilir; negatif bir özdeğer bulunmazsa mesafeler öklid uzayında birleşir.)


Teşekkürler. Başka soru: üçgen eşitsizliğinin tek, tam, ortalama yöntemler için tutması gerekiyor mu? ve eğer bir mesafe (örneğin) simetrik değilse, bu yöntemlerde ne gibi bir sorun var? (Teşekkürler!)
Tal Galili

1
Klasik hiyerarşik kümeleme yöntemleri simetrik matristen başka bir şey alamaz : A'dan B'ye bir mesafe = B'den A'ya. Asimetrik ile başa çıkmak için özel başka yöntemler vardır (google olabilirsiniz). Üçgen eşitsizliğe gelince - bahsettiğiniz yöntemler için gerekli bir koşul değildir. (Bununla birlikte, yaygın bilgelik eşitsizliği açıklamak "mesafeyi" düşünür, bu yüzden eğer eksikse onu empoze etmeyi düşünmeye değer. Bunu yapmak için, mesafelere tekrar tekrar küçük bir sabit ekleyin ve kontrol edin. o zaman yakında öklid mesafelerine ulaşacaksınız)
ttnphns

5

Hayır, mesafenin bir metrik olması gerekmez. Örneğin, bir ultrametrik olabilir:

d(A,B)max(d(A,C),d(B,C))

Kümeleme algoritmasındaki birbirini izleyen adımlardan elde edilen ultrametrik mesafeler, bu bağlamda görmüş olabileceğiniz dendrogramlar kullanılarak temsil edilebilir.


Teşekkürler Hong. Bazı objelerin dendrogramın ultrametrik olmasını talep etme yöntemlerini hatırladığımı hatırlıyorum - bunun yazdıklarınızla ilgisi varsa yaralıyorum. Her durumda, cevap için teşekkür ederim.
Tal Galili
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.