R? Kullanarak enlem / boylam çiftlerinden nokta grupları oluşturma


11

Ben ilgi noktalarının yerini belirlemek için Lat / Long çiftleri içeren bir veritabanı var. İlgilenilen noktaları 10'luk gruplara ayırmak istiyorum. Grup coğrafi olarak yerel olmalı ve tam olarak 10 puan içermelidir. Her grup minimum alana sahip olmalıdır.

R çeşitli uygulamalar baktım ama hiçbiri (görebiliyorum) kesin bir küme boyutu belirtmek için izin verir.

Daha önce harita noktalarını sabit küme boyutlarında gruplandırmayı mı sormuştum ? ama sorumda iyi bir cevap alabilecek kadar kesin olduğumu düşünmüyorum.


Coğrafi olarak yerel - Bence gruplar önemli ölçüde örtüşmemelidir. Uygulamamda (insanları izleme amacıyla gruplara ayırmak), her bir grubun fiziksel alanda mümkün olduğunca küçük olması idealdir.
Minimum alan - yine, grup alanını minimumda tutmaya çalışıyor. Sanırım bu, her grubun alanını belirli bir eşiğin altında tutabilir (düzinelerce küçük ve bir büyük gruptan kaçınmak için).


2
Aradığın şey konusunda biraz daha kesin olmana yardımcı olur. "Coğrafi olarak yerel" ve "minimum alanı" nasıl ölçersiniz?
whuber

Bazı durumlarda, "minimum alan" ve "tam olarak 10 puan" birbirini dışlamaz mı? Her ikisinin de kullanılmasını nasıl bekleyebilirsiniz, örneğin, 1 mil "minimum alan" ve 10 mil içinde başka özelliği olmayan 1 özellik (muhtemelen bir aykırı değer) var mı?
RyanKDalton

Bazı istisnalar olmasını bekliyorum, ancak bunlar elle halledilebilir. Sabit boyutlu bir veri setim var ve birkaç grubun manuel olarak uğraşmasını umursamıyorum, ancak geri kalanı için gerçekten otomatik bir çözüm istiyorum! :)
Graeme Hilton


Açıklama hala otomatik bir şekilde çözülemeyecek kadar "el-dalgalı". Verileri herkese açık hale getirebilir misiniz?
BradHards

Yanıtlar:


1

Sanırım en yakın k komşu aracı arıyor olabilirsiniz. Bu tür araç, veri kümenizdeki tüm noktaların en yakın 10 komşusunu tanımlamak için kullanılabilir. Bunun için birkaç farklı seçenek var gibi görünüyor (bazı farklı algoritmalar kullanarak veya biraz farklı işlevlere sahip) ve hangisinin en iyi seçenek olacağından emin değilim. Ancak işte birkaç bağlantı:

http://stat.ethz.ch/R-manual/R-patched/library/class/html/knn.html http://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R/Classification/kNN

Çok az çakışmayan veya çakışmayan noktaların sınıflandırmalarına ulaşmak için benzer komşu kümeleri olan nokta kümelerini tanımlamak için sonuçları bir kümeleme algoritması veya küme topluluğu aracıyla birleştirmeniz gerekebilir. Çıktıyla biraz manuel uğraşmanız gerekebilir, ancak işin büyük bir bölümünü otomatikleştirmenize izin vermelidir

Bazı bağlantılar: http://jmlr.csail.mit.edu/papers/volume3/strehl02a/strehl02a.pdf http://cran.r-project.org/web/packages/clue/vignettes/clue.pdf

Ayrıca, hepsini tek adımda yapacak ve bir küme kuralında 10 noktayı uygulayacak bir k-ortalama kümeleme aracı bulabilir (toplam nokta sayısını 10'a bölün ve bunu istediğiniz küme sayısı olarak seçin alet).


Ayrıca, YaRi eğitimini R için yararlı buldum: ahandel.myweb.uga.edu/resources.htm
Jezibelle
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.