1999 yılında Beyer ve ark. sorulduğunda, ne zaman "Yakın Komşu" anlamlıdır?
1999'dan bu yana mesafe düzlüğünün NN araştırması üzerindeki etkisini analiz etmenin ve görselleştirmenin daha iyi yolları var mı?
[Belirli bir] veri kümesi 1-NN problemine anlamlı cevaplar veriyor mu? 10-NN sorunu mu? 100-NN sorunu mu?
Uzmanlar bugün bu soruya nasıl yaklaşırsınız?
Düzenlemeler Pazartesi 24 Oca:
"Artan boyutla uzaklık düzlüğü" için daha kısa bir isim olarak "mesafe beyazlığı" ne dersiniz?
"Mesafe beyazlığı" na bakmanın kolay bir yolu 2-NN çalıştırmak ve en yakın komşu ve en yakın ikinci komşulara mesafeleri çizmektir. Aşağıdaki grafik , Monte Carlo'nun çeşitli kümeleri ve boyutları için dist 1 ve dist 2'yi göstermektedir . Bu örnek, ölçeklendirilmiş mutlak fark | dist 2 - dist 1 | için oldukça iyi mesafe kontrastını göstermektedir . (Göreceli farklılıklar | dist 2 / dist 1 | → 1 boyut olarak → ∞, bu yüzden işe yaramaz olun.)
Belirli bir bağlamda mutlak hataların veya göreli hataların kullanılıp kullanılmayacağı elbette "gerçek" gürültüye bağlıdır: zor.
Öneri: her zaman 2-NN çalıştırın; 2 komşu yakın olduklarında faydalı, yakın olmadığında da faydalıdır.