Doğru mesafeyi seçmek temel bir görev değildir. Bir veri kümesinde küme analizi yapmak istediğimizde, farklı mesafeler kullanılarak farklı sonuçlar ortaya çıkabilir, bu nedenle hangi mesafeyi seçeceğine dikkat etmek çok önemlidir, çünkü değişkenliği iyi yakalayan yanlış iyi bir artefakt yapabiliriz, ancak aslında bizim sorunumuzda.
Öklid Ben sürekli sayısal değişkenler var ve mutlak mesafeleri yansıtmak istediğinizde mesafe uygundur. Bu mesafe her değişkeni hesaba katar ve fazlalıkları kaldırmaz, bu yüzden aynı şeyi açıklayan (değişkenler) üç değişkenim varsa, bu etkiyi üçe kadar ağırlıklandıracağım. Dahası, bu mesafe ölçek değişmez değildir, bu yüzden genellikle mesafeyi kullanmak için daha önce ölçeklemeliyim.
Örnek ekoloji: Uzmanların bazı mikrobiyolojik, fiziksel ve kimyasal faktörlerin örneklerini aldığı birçok bölgeden farklı gözlemlerimiz var. Ekosistemlerde örüntüler bulmak istiyoruz. Bu faktörlerin yüksek bir korelasyonu vardır, ancak herkesin alakalı olduğunu biliyoruz, bu nedenle bu fazlalıkları kaldırmak istemiyoruz. Birimlerin etkisini önlemek için Öklid mesafesini ölçeklendirilmiş verilerle kullanıyoruz.
Mahalonobis Ben sürekli sayısal değişkenler var ve mutlak mesafeleri yansıtmak istiyoruz ama biz fazlalıklar kaldırmak istediğinizde mesafe uygundur. Tekrarlanan değişkenlerimiz varsa, tekrarlanan etkileri ortadan kalkar.
Hellinger , Türler Profili ve Akor mesafesi ailesi , değişkenler arasındaki farklara vurgu yapmak istediğimizde, profilleri farklılaştırmak istediğimizde uygundur. Bu mesafeler, her gözlemin toplam miktarlarına göre ağırlıklandırılır, öyle ki, mutlak büyüklüklerde çok farklı olmasına rağmen, değişkenler değişkenlere göre değişken olduğunda bireyler daha benzerdir. Dikkat et! Bu mesafeler profiller arasındaki farkı çok iyi yansıtır, ancak büyüklük etkisini kaybetmiştir. Farklı örnek boyutlarımız olduğunda çok yararlı olabilirler.
Örnek ekoloji: Birçok arazinin faunasını incelemek istiyoruz ve gastropodun envanterinin bir veri matrisine sahibiz (satırlardaki örnekleme yerleri ve sütunlardaki tür adları). Matris, birçok sıfırın ve farklı büyüklüklerin olmasıyla karakterizedir, çünkü bazı yerelliklerin bazı türleri ve diğerlerinin de başka türleri vardır. Hellinger mesafesini kullanabiliriz.
Bray-Curtis oldukça benzerdir, ancak profilleri farklılaştırmak ve göreceli büyüklükleri hesaba katmak istediğimizde daha uygundur.