7
Öklid mesafesi genellikle seyrek veriler için iyi değil mi?
Bir yerlerde, çok boyutlu ve seyrek verilere sahip olduğumuzda klasik mesafelerin (Öklid mesafesi gibi) zayıf şekilde ayırt edici hale geldiğini gördüm. Neden? Öklid mesafesinin iyi performans göstermediği iki seyrek veri vektöründen bir örneğiniz var mı? Bu durumda hangi benzerliği kullanmalıyız?