Coğrafi kodlama algoritmaları için iyi kaynaklar


19

Coğrafi kodlama algoritmaları hakkında iyi kaynaklar biliyor musunuz?

Özellikle sorgunun bölümlerini eşleştirme ve ağırlıklandırma, yanlış yazımlar ve varyasyonlarla ilgilenme ve fiziksel veri depolama ile ilgili ayrıntılar (örneğin, ilişkisel veritabanı sorguları için şemalar, veri dizine ekleme yaklaşımları vb.) Dahil olmak üzere adres sorgusu ayrıştırma ile ilgileniyorum. .

ArcGIS 10 coğrafi kodlama ile ilgili bazı belgeleri inceledim, ancak gerçek uygulama ayrıntılarına biraz dokunuyorlar. Diğer yüksek kaliteli üretim uygulamalarının ayrıntılı dokümantasyonu da yararlı olabilir. Ne kadar teknik olursa o kadar iyidir. Teorik algoritma kağıtları da harika.

Teşekkürler.

Yanıtlar:


14

Metinden Coğrafi Koordinatlara: Coğrafi Kodlamanın Mevcut Durumu

Daniel W. Goldberg, John P. Wilson ve Craig A. Knoblock Özet: Bu makale, mevcut literatürün disiplinler arası tarihsel bir incelemesi yoluyla coğrafi kodlama uygulamalarında en son teknolojinin bir araştırmasını sunmaktadır. Gelişen coğrafi kodlama kavramını ve sürecin temel bileşenlerini araştırıyoruz. Sık karşılaşılan hata ve belirsizlik kaynakları ve bunları ölçmek için kullanılan mevcut önlemler tartışılmaktadır. Coğrafi kodlama sürecindeki yaygın tuzakların ve sürekli zorlukların incelenmesi sunulmaktadır ve bunların üstesinden gelmek için geleneksel yöntemler açıklanmaktadır.

10.1.1.119.714.pdf

PDF (sayfa 34 sonrası) http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.119.714&rep=rep1&type=pdf


Yanlış bağlantınız olduğuna inanıyorum, citeseerx.ist.psu.edu/viewdoc/…
Andy W

@thanks 10.1.1.119.714.pdf doğru güncellenmiş gönderi - farklı bir adlandırma kuralı daha iyi olurdu.
Mapperz

6

Mapperz ile bağlantılı kağıt çok iyi ve muhtemelen ilgi çekici olacak bir sürü alıntı var, ancak dize eşleşmesini ve coğrafi kodlama sürecine önemini anlatmak için çok iyi bir iş yaptıklarını düşünmüyorum. Kısaca Soundex'ten bahsettiler , ancak Soundex, IMO adresleri için en iyi seçenek değil, tek seçenek değil. Konuyla ilgili birkaç alıntı listelediler, bu yüzden bu makaleler ilginizi çekecek.

İstatistikler değişim sitesindeki bu iş parçacığı , iki dizenin bulanık eşleşmesinden bahseder ve adreslerin eşleştirilmesinde aynı tekniklerin tümü geçerlidir. Özellikle düzenleme mesafelerinin kullanılmasının Soundex'ten daha mantıklı olduğunu düşünüyorum , özellikle Soundex analogu olmayan adres bilgileriyle. İki dize arasındaki Levenshtein mesafesini hesaplamak o kadar da karmaşık değildir ve internette yüzen çok sayıda örnektir ( burada Python'da bir tane vardır).

Geçen saati ESRI'nin yazım hassasiyetlerini, farklı aday ve maç puanlarını nasıl uyguladığını bulmaya çalıştım. Basit açıklamalardan başka bir şey bulamadım (bu PDF'de ve 9.3'ün çevrimiçi yardım bölümünde bulduğumlardan en iyisi ). Eğer birisi beni daha ayrıntılı belgelere yönlendirebilirse, OP'nin yanı sıra takdir ediyorum.




Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.