Çekirdek yoğunluğuna göre puanlar nasıl kümelenir?


10

Ticari arazi kullanımlarını temsil eden 36k puana sahip büyük bir veri setim var, her biri kare görüntüleri içeren bir alana sahip. Bu veri kümesinde bir çekirdek yoğunluk analizi yaptım ve tüm metro alanı üzerindeki ticari kare görüntülerin yoğunluğunu gösteren bir tarama ürettim. Bu raster "merkezi" dediğim yerel maxima karşılık gelen bölgelere bölmek gerekir. Merkezlerin yerlerini zaten belirledim ve şimdi iki şeyden birini yapmam gerekiyor:

  • noktaları tanımladığım merkezlerin etrafındaki kümeler halinde gruplandırmak için "medoidlerin etrafında bölümleme" gibi bir nokta kümeleme aracı kullanın. Bu yöntemin problemi, hesaplama açısından yoğun olması ve daha da fazla, noktaları boyuta göre ağırlıklandırmak için bir benzerlik matrisi kullanmaya çalışırsam.

  • bir şekilde çekirdek yoğunluğu rasterini (kabaca bir arazi rasterine benzeyen) her merkezin çevresindeki ayrı ayrı "tepelere" ayırın. Ama bunu yapmak için herhangi bir araç düşünemiyorum.

Bu sorun bir süre beni rahatsız etti ve ben kümeleme yöntemini R'de yapabileceğimi umdum, ama bu zaman alıcı ve zamanım bitiyor. Herkes yoğunluk yoğunluğunu yoğunluk mahallelerine bölmek veya büyük veri kümelerini hızlı bir şekilde kümelemek için basit bir yöntem biliyor mu?


1
Bu soru yakından ilişkili: stats.stackexchange.com/questions/13995/…
whuber

1
Ve aynı zamanda benim tarafımdan yayınlandı, ortaya çıkıyor.
Patrick

Sanırım Patrick için 1 pt olurdu .....
BWill

Yanıtlar:


6

Yakın ilişkili bir görevi takip eden tartışma basit ve etkili bir çözüm ortaya koydu : "tepeleri" bulmak, ızgarayı baş aşağı çevirmek (değerlerini yok ederek) ve havzaları bulmak. Tepeler lavabolar ve havza sınırları ızgarayı bu lavabolara ayırır.


Bu çözüm basit, hızlı ve tam olarak aradığım şey. Teşekkürler.
Patrick

3

En basit cevap, eşiğin altına düşen alanları maskelemek için bir eşik kullanmak olacaktır. Bu size merkezlerinizi çevreleyen farklı alanlar sağlamalıdır. Daha sonra bu alanları şekle dönüştürebilmelidir.

Konumsal istatistik araçlarını da bulabilirsiniz : Raster veriler üzerinde kümeleme analizi, benzer bir sorunun yararlı bir tartışmasını.


Evet, bu çok alakalı bir tartışma! MSc tezinizi okuyorum ve bazı yöntemleri deneyeceğim.
Patrick

2
Bir eşik kullanmak muhtemelen burada işe yaramayacaktır, çünkü merkezleri hemen bitişikteki diğer merkezlerden ayırmaya çalışıyorum. Şehir merkezinde, ikisi arasındaki sınır çok yüksek bir yoğunluğa sahip olacak, ancak banliyö saçaklarında çok düşük bir yoğunluğa sahip olacak. Ancak ikinci türevi kullanmanın etkili olacağını umuyorum.
Patrick

3

Sanırım ilk sorununuza geri dönmelisiniz: Tüm metro bölgesinde ticari kare görüntüleri içeren kümeleri bulun.

Puanlarınızın kare görüntüleri ticari değerlere sahip parsellerin sentroidleri olduğunu varsayıyorum? Her parsel için toplam kare görüntüleri olan çokgen bir parsel tabakasına sahip olabileceğinizi varsayalım? Bu size kare görüntüleri ticari ve kare görüntüleri için bir vaka seti (centroids) ve bir popülasyon (parsel çokgenler) verir.

SatScan http://www.satscan.org/ adresine gidin ve yalnızca Poisson dağıtılmış bir model çalıştırın ve ticari kare çekim kümelerinizi oldukça hızlı bir şekilde hazırlayın. (Arazinin kare görüntülerini bina alanının kare görüntülerinden ziyade nüfusunuz olarak da kullanabilirsiniz. Bu daha iyi nüfus olabilir.)


Noktaların sentroid olduğu konusunda haklısınız, ancak maalesef veri seti her ülkenin parsel katmanından diğerleri tarafından derlendi ve sadece puan olarak dağıtıldı. Ancak SatScan çok kullanışlı bir yazılım parçası gibi görünüyor, bu yüzden diğer uygulamaları aklımda tutacağım.
Patrick
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.