Herkes kullanımı mu veya yerine kümeleme ilişkin metrikleri ?
Aggarwal ve ark.,
Yüksek boyutlu uzayda mesafe ölçütlerinin şaşırtıcı davranışı üzerine
(2001 yılında)L .5 L 2
L 2 , yüksek boyutlu veri madenciliği uygulamaları için Öklid uzaklık metriği sürekli olarak daha fazla tercih edilir
ve veya daha iyi olabileceğini iddia etti .L .1
veya kullanmanın nedenleri teorik veya deneysel olabilir, örn. Aykırı değerlere / Kaban'ın belgelerine duyarlılık veya gerçek veya sentetik veriler üzerinde çalışan programlar (lütfen tekrarlanabilir). Bir örnek ya da resim mesleğimin sezgisine yardımcı olur.L .5
Bu soru Bob Durrant'ın bugün en yakın-komşusu-anlamlı-bugünkü cevabının bir devamıdır . Dediği gibi, seçimi hem veriye hem de uygulamaya bağlı olacaktır; yine de, gerçek deneyim raporları yararlı olacaktır.
7 Haziran Salı günü eklenen notlar:
"L1 normuna ve ilgili yöntemlere dayanan istatistiksel veri analizi" ile karşılaştım, Dodge ed., 2002, 454p, isbn 3764369205 - düzinelerce konferans makalesi.
Herkes iid üstel özellikler için mesafe konsantrasyonunu analiz edebilir mi? Üstel olmanın bir nedeni ; bir diğeri (uzman olmayan) maksimum entropi dağılımı ≥ 0 olmasıdır; üçüncüsü, bazı gerçek veri kümelerinin, özellikle SIFT'lerin kabaca üstel göründüğüdür.