İki uzamsal nokta paterninin karşılaştırılması?


41

Aynı coğrafi bölgede iki nokta desen dağılımına sahipsem, bu iki dağılımı nasıl görsel olarak ve kantitatif olarak karşılaştırabilirim?

Ayrıca daha küçük bir bölgede birçok noktaya sahip olduğumu varsayalım, bu nedenle sadece bir pin haritası görüntülemek gösterişsizdir.

Yanıtlar:


32

Her zaman olduğu gibi, hedeflerinize ve verilerin niteliğine bağlıdır. İçin tamamen eşlenen veriler, güçlü bir araç Ripley'in L işlevi, bir yakın akrabası olan Ripley'in K fonksiyonu . Birçok yazılım bunu hesaplayabilir. ArcGIS bunu şimdi yapabilir; Kontrol etmedim. CrimeStat yapar. Yani do GeoDa ve R . İlişkili haritalarla kullanımına bir örnek

Sinton, DS ve W. Huber. Polka'yı ve Amerika'daki etnik mirasını haritalamak. Coğrafya Dergisi Cilt. 106: 41-47. 2007

Ripley's K'nin "L function" versiyonunun bir CrimeStat ekran görüntüsü:

Ripley's K fonksiyonunun ekran görüntüsü

Mavi eğri, rastgele olmayan bir nokta dağılımını belgelemektedir, çünkü sıfırı çevreleyen kırmızı ve yeşil bantlar arasında yer almamaktadır; bu, rastgele bir dağılımın L işlevi için mavi izin yatması gereken yerdir.

İçin örneklenmiş veriler, çok örnekleme doğasına bağlıdır. Bunun için iyi bir kaynak, matematikte ve istatistiklerde sınırlı (ancak tamamen bulunmayan) geçmişe sahip olanlar için erişilebilir, Steven Thompson'ın Sampling ders kitabıdır .

Genellikle istatistiksel karşılaştırmaların çoğu grafiksel olarak gösterilebilir ve tüm grafiksel karşılaştırmalar istatistiksel bir karşılığı temsil eder veya gösterir. Bu nedenle, istatistiksel literatürden edindiğiniz herhangi bir fikrin iki veri setini haritalandırmak veya grafiksel olarak karşılaştırmak için yararlı yollar önerme olasılığı yüksektir.


Dixon gazetesi için teşekkürler, mükemmel bir kaynak gibi görünüyor. Mekansal etkileşim ve çok değişkenli desenler için rasgele etiketleme arasındaki ayrımı hiç görmedim. Okumam gerekecek.
Andy W

+1 İyi kaynaklar. Yani "balıkların% 90'ının gölün% 10'unda olduğu" eski balık avcılığı gerçekten örnekleme yöntemine mi bağlı?
Kirk Kuykendall

@Kirk Birçoğumuz için balıkların% 0'ı gölün% 10'undayız ve gerçekten ulaşmayı başardık!
whuber

14

Not: Aşağıdaki yorum whuber'un yorumundan sonra düzenlendi

Bir Monte Carlo yaklaşımını benimsemek isteyebilirsiniz. İşte basit bir örnek. Suç olaylarının dağılımının A'nın B'ninkine istatistiksel olarak benzer olup olmadığını belirlemek istediğinizi varsayalım, A ve B olayları arasındaki istatistiği rastgele atanmış 'işaretler' için bu tür bir önlemin ampirik bir dağılımıyla karşılaştırabilirsiniz.

Mesela, A (beyaz) ve B (mavi) dağılımı göz önüne alındığında,

görüntü tanımını buraya girin

A ve B etiketlerini, birleşik veri kümesindeki TÜM noktalara rasgele yeniden atarsınız. Bu tek bir simülasyon örneğidir:

görüntü tanımını buraya girin

Bunu birçok kez tekrarlarsınız (999 kez söylersiniz) ve her bir simülasyon için, rasgele etiketlenmiş noktaları kullanarak bir istatistik (bu örnekte en yakın komşu istatistiği) hesaplarsınız. Aşağıdaki kod Parçacıkları olan R (kullanımını gerektirir spatstat kütüphanesi).

nn.sim = vector()
P.r = P
for(i in 1:999){
  marks(P.r) = sample(P$marks)  # Reassign labels at random, point locations don't change
  nn.sim[i] = mean(nncross(split(P.r)$A,split(P.r)$B)$dist)
}

Daha sonra sonuçları grafiksel olarak karşılaştırabilirsiniz (kırmızı dikey çizgi orijinal istatistiktir),

hist(nn.sim,breaks=30)
abline(v=mean(nncross(split(P)$A,split(P)$B)$dist),col="red")

görüntü tanımını buraya girin

veya sayısal olarak.

# Compute empirical cumulative distribution
nn.sim.ecdf = ecdf(nn.sim)

# See how the original stat compares to the simulated distribution
nn.sim.ecdf(mean(nncross(split(P)$A,split(P)$B)$dist)) 

Ortalama en yakın komşu istatistiğinin, probleminiz için en iyi istatistiksel önlem olmayabilir. K-fonksiyonu gibi istatistikler daha açıklayıcı olabilir (whuber'in cevabına bakınız).

Yukarıdakiler ArcGIS içinde Modelbuilder kullanılarak kolayca uygulanabilir. Bir döngüde, her bir noktaya özellik değerlerini rastgele yeniden atama ve uzamsal bir istatistik hesaplayın. Bir tablodaki sonuçları taklit edebilmelisiniz.


2
Çekirdek yoğunluğu yaklaşımı yerine bir permütasyon testi düşünebilirsiniz, Manny. Boş hipotez, mavi ve beyaz etiketlerin noktalardan bağımsız olduğu şeklindedir. Bunu test etmek için, mahalle için uygun bir istatistik benimseyin (örneğin mavi ve beyaz noktalar arasındaki en yakın mesafe, cadde boyunca seyahat). Renkleri tüm noktalara rastgele yeniden atayın, aynı miktarlarda mavi ve beyazı tutun ve istatistiği yeniden hesaplayın. İstatistiğin null dağılımını tahmin etmek için birçok kez tekrarlayın. Bir p değeri almak için istatistiğin gerçek değerini bu dağılıma yönlendirin.
whuber

Teşekkürler whuber. Bunu belirgin bir nokta problemi olarak görmek hiç aklıma gelmedi. Bu yaklaşımı yansıtacak şekilde cevabımı güncelledim. Bununla birlikte, orijinal yaklaşımımın (yani, rastgele noktalar oluşturmak için bir çekirdek yoğunluğu ızgarası kullanılması) neden farklı bir sonuçla sonuçlandığına dair net değil. Aslında, (benim asıl çözümüm), hem A hem de B'nin benzer bir süreçten geldiği gerçeğini sadık bir şekilde yansıtmadı. Bunun nedeni, çekirdek yoğunluğu yaklaşımının bize nokta verilerinin sağladığı ayrıntıdan yararlanmamasıdır mı?
MannyG

1
Çekirdek yoğunluğu, ona göre küçük bir keyfilik unsuruna sahiptir (yarım genişlik seçimi ile ilişkili). Bu bir fark yaratabilir. Aynı zamanda, gerçekten olup bitenlerden de bir miktar uzaklaştı: temel bir süreç üreten nokta var; bu sürecin bir farkına vardığını görüyorsunuz; Eğer bir KDE yapmak o ; o zaman KDE'den yeni gerçekleşmeler çiziyorsun. Aslında gözlemlediğiniz tek yapılandırma gibi yeni yapılandırmaları çoğaltıyorsunuz. Permütasyon yaklaşımında, her iki dağılımın da aynı olduğu hipotezi, işaretlemelere izin vermeyi haklı kılar: bu doğrudan ve güçlüdür.
whuber

1
Girişiniz için teşekkürler, daha fazla zamanım olduğunda daha fazla yorum yapacağım. Bu R kodunu not etmek iyi olurdu (cevapta R kodu olduğunu bile söylediniz mi?) Ve spatstatpaketteki fonksiyonları kullanır .
Andy W.

2
+1, Bu gibi permütasyon testlerinin kullanılmasıyla ilgili güzel şeylerden biri, 1) jeokoderin spesifikliği ile sınırlandırıldığında (çoğu durumda suç verileri için adres veya adres aralıkları), tam mekansal rastgelelikle karşılaştırılan nokta modellerini değerlendirmek de değildir. çok mantıklı. 2) Bu tür permütasyon testleri kenar etkileri ile ilgili problemleri önler. Elbette bunlar aşırı genellemeler, ancak böyle bir çerçevenin birçok farklı nokta modeli istatistiklerini değerlendirmek için genelleştirilebileceğini düşünüyorum.
Andy W,

4

CrimeStat'ı kontrol etmek isteyebilirsiniz.

Web sitesine göre:

CrimeStat, Ulusal Adalet Enstitüsü'nün (2011 1997-IJ-CX-0040, 1999-IJ-CX-0044 hibeleri ile finanse edilen) Ned Levine & Associates tarafından geliştirilen, suç olay yeri konumlarının analizi için kullanılan bir mekansal istatistik programıdır. 2002-IJ-CX-0007 ve 2005-IJ-CX-K037). Program Windows tabanlı ve çoğu masaüstü CBS programına sahip. Amaç, kanun uygulayıcı kurumlara ve ceza adaleti araştırmacılarına suç haritalama çabalarında yardımcı olacak ilave istatistiksel araçlar sağlamaktır. CrimeStat, dünyadaki pek çok polis departmanı tarafından, ceza adaleti ve diğer araştırmacılar tarafından kullanılıyor. En son sürüm 3.3'tür (CrimeStat III).


2

Basit ve hızlı bir yaklaşım, sıcaklık haritaları oluşturmak ve bu iki sıcaklık haritasının fark haritasını oluşturmak olabilir. İlgili: Etkili ısı haritaları nasıl kurulur?


3
Ne yazık ki, iki enterpolasyonlu veya düzleştirilmiş haritanın farklılaşması enterpolasyon veya pürüzsüzleştirme metodu hakkında verilerden çok daha fazla şey söylemeye meyillidir :-(. veri kümelerinden birini enterpolasyona sokun Bir setteki gerçek verileri diğerinin enterpolasyon değerleriyle karşılaştırabilir, böylece iki enterpolasyonlu haritanın karşılaştırılması hatasının yarısını ortadan kaldırabiliriz. diğer veri türleri
whuber

Bu yöntemin pek çok girdi verisi için uygun olmadığını kabul ediyorum. Nokta yoğunluğu düzenlerini analiz ederken iyi bir ilk izlenim verebileceğini düşünüyorum.
underdark

İnterpolasyon bir uzman tarafından yapıldığında ve makul bir şekilde yorumlanırken haklı olduğunuza dair hiçbir şüphem yok.
whuber

2

Mekansal Oto-korelasyon hakkındaki literatürü gözden geçirdiğinizi varsayalım. ArcGIS'in sizin için Araç Kutusu komut dosyası ile yapması için çeşitli nokta ve tıklama araçlarına sahiptir: Mekansal İstatistik Araçları -> Modelleri Analiz Etme .

Geriye doğru çalışabilirsiniz - Bir araç bulun ve senaryonuza uygun olup olmadığını görmek için uygulanan algoritmayı inceleyin. Toprak minerallerinin oluşumundaki mekansal ilişkiyi araştırırken bir süre önce Moran Endeksini kullandım.


2

İki değişken ile anlamlılık düzeyi arasındaki istatistiksel korelasyon seviyesini belirlemek için birçok istatistik yazılımında iki değişkenli bir korelasyon analizi yapabilirsiniz. Daha sonra, bir kloroplet şeması kullanarak bir değişkeni ve diğer değişkenleri dereceli simgeleri kullanarak eşleyerek istatistiksel bulgularınızı yedekleyebilirsiniz. Bindirildikten sonra, hangi alanların yüksek / yüksek, yüksek / düşük ve düşük / düşük mekansal ilişkiler gösterdiğini belirleyebilirsiniz. Bu sunumun bazı iyi örnekleri var.

Ayrıca bazı eşsiz jeo-görselleştirme yazılımlarını deneyebilirsiniz. Bu tür görselleştirme için CommonGIS'i gerçekten seviyorum. Bir mahalle (örneğin) seçebilirsiniz ve tüm faydalı istatistikler ve grafikler hemen size açık olacaktır. Çok değişkenli haritaların analizini oldukça zahmetsiz hale getirir.


2
Bunlar iyi fikirlerdir, ancak atıfta bulunduğunuz örneklerin başarılı olduğunu fark ediyorum çünkü özellikler ortak özellik kümelerine karşılık geliyor. Bu soruda, özelliklerin farklı konumları var ve bu konumlar rasgele değişkenler (örneğin sabit idari birimler değil). Bunlar önemli komplikasyonlardır, çünkü şimdi bir konumdaki değerleri diğer konumlardakilerle ilişkilendirmek için anlamlı bir prosedür bulmamız ve konumların rastgele karakterleriyle başa çıkmamız gerekir.
whuber

Bu açıklama için teşekkürler! OP'yi yanlış okudum ve bir konum / coğrafi kapsamı paylaşan iki bağımsız değişken için olduğunu varsaydım (DA / CT vb. Gibi)
Michael Markieta

1

Bir kuadrat analizi bunun için iyi olurdu. Farklı nokta veri katmanlarının uzamsal kalıplarını vurgulayabilen ve karşılaştırabilen bir GIS yaklaşımıdır.

Çok noktalı veri katmanları arasındaki uzamsal ilişkileri ölçen bir kuadrat analizinin ana hatları http://www.nccu.edu/academics/sc/artsandsciences/geospatialscience/_documents/se_daag_poster.pdf adresinde bulunabilir .


1
(1) Bağlantı 404'tür (bu yüzden tüm bağlantıların özetlerini eklemek için cevaplar istiyoruz). (2) Kuadrat analizi iki nokta dağılımını ne kadar kesin olarak karşılaştırır ?
whuber

(1) Bağlantı şimdi işe yarayabilir. (2) Bir kuadrat analizi, belirli bir alanı, uygun büyüklükte eşit büyüklükte birimlere böler. Daha sonra her bir kadran içindeki gerçek nokta frekansını belirlemek için her bir frekans için beklenen bir değere karşı olasılık analizini kullanır. Nokta yoğunluğu komutunu ve bölgesel istatistikleri ArcMap için uzamsal analist uzantısındaki tablo araçları olarak kullanarak, bu nokta özellik sınıflarını regresyon analizi için özetlemenin yanı sıra, yüksek yoğunluklu nokta konumlarının yakınındaki bölgeleri vurgulayabiliriz.

Nokta dağılımlarının tek değişkenli analizi için bir prosedür açıkladınız . İki sürecin eşzamanlılık derecesini karşılaştırmak için uyarlanabilir (kuadrat korelasyonları değerlendirilerek), ancak iki önemli sınırlamadan muzdariptir. İlk olarak, süreçler arasındaki ilişkileri mesafenin bir işlevi olarak incelemez; İkinci ile kümeleştirme quadrats noktaları bu gücünü kaybeder. Bir güç kaybı, önemli kalıpları tanımlayamayacağınız anlamına gelir ya da araştırma hedeflerine ulaşmak için daha fazla veri toplamanız gerektiği anlamına gelir.
whuber

Bu "prosedürü" nokta dağılımlarının çok değişkenli analizi için kullandım. Bir güç kaybı anlamına gelse de, benzersiz toplama düzeylerinde iki nokta örüntü dağılımını görsel ve nicel olarak karşılaştırmanın bir yolunu sunar (burada asıl soru için bir çözüm).

Umarız sitemizde okuduklarınızın gelecekte alternatif yaklaşımları göz önünde bulundurmanızı sağlar: verilerinizden ve sınırlı araştırma kaynaklarınızdan en iyi şekilde yararlanabilmenizi sağlar.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.