Bir neden kullanacağınızı iyi bir argüman aramaya çalışıyorum Manhattan mesafe üzerinde Öklit mesafesi Machine Learning'de.
Şimdiye kadar iyi bir argümana bulduğum en yakın şey bu MIT dersinde .
36: 15'te slaytlarda aşağıdaki ifadeyi görebilirsiniz:
"Genellikle Öklid metriği kullanın; farklı boyutlar karşılaştırılamazsa Manhattan uygun olabilir. "
Profesör, sürüngen bacaklarının sayısının 0 ila 4 arasında değiştiği için (diğer özellikler ikili, sadece 0 ila 1 arasında değiştiği için) söyledikten kısa bir süre sonra, "bacak sayısı" özelliği çok daha yüksek olacak Euclid mesafesi kullanıldığında ağırlık. Tabii ki, bu gerçekten doğru. Ama Manhattan mesafesini kullanırken de bu problemi yaşar (sadece sorunun biraz azaltılması gerekir, çünkü Öklid mesafesindeki gibi kareyi fark etmiyoruz).
Yukarıdaki sorunu çözmenin daha iyi bir yolu, "bacak sayısı" özelliğini normalleştirmek, böylece değeri her zaman 0 ile 1 arasında olacaktır.
Bu nedenle, sorunu çözmenin daha iyi bir yolu olduğundan, bu durumda Manhattan mesafesini kullanma argümanı, en azından benim görüşüme göre daha güçlü bir noktaya sahip değildi.
Birisi Manhattan'ın Öklid üzerindeki mesafesini neden ve ne zaman kullanacağını gerçekten bilen var mı? Birisi bana Manhattan mesafesini kullanmanın daha iyi sonuçlar vereceği bir örnek verebilir mi?