Uzamsal korelogramda U şekilli bir desene ne sebep olur?


12

Kendi çalışmamda , değişen mesafelerde uzamsal bir korelogramı incelerken bu örüntüyü fark ettim , korelasyonlarda U şeklinde bir desen ortaya çıkıyor. Daha spesifik olarak, küçük mesafe kutularındaki güçlü pozitif korelasyonlar mesafeyle azalır, daha sonra belirli bir noktada bir çukura ulaşır ve sonra yukarı tırmanır.

İşte Koruma Ekolojisi blogundan bir örnek, Makroeknoloji oyun alanı (3) - Mekansal otokorelasyon .

Moran'ın I Korelasyonu

Daha büyük mesafelerde bu daha güçlü pozitif oto-korelasyonlar teorik olarak Tobler'in ilk coğrafya yasasını ihlal ettiğinden, verilerdeki başka bir modelden kaynaklanmasını beklerdim. Belirli bir mesafeden sıfıra ulaşmalarını beklerim ve daha sonra uzak mesafelerde 0'ın etrafında gezerim (tipik olarak düşük dereceli AR veya MA terimleri olan zaman serisi grafiklerinde olan şey budur).

Bir google görsel arama yaparsanız, aynı desen türünün başka birkaç örneğini bulabilirsiniz ( başka bir örnek için buraya bakın ). CBS sitesindeki bir kullanıcı, Moran'ın I için paternin göründüğü, ancak Geary's C ( 1 , 2 ) için görünmediği iki örnek yayınladı . Kendi çalışmalarımla birlikte, bu modeller orijinal veriler için gözlemlenebilir, ancak bir modeli mekansal terimlerle takarken ve kalıntıları kontrol ederken, kalıcı görünmüyorlar.

Benzer bir ACF çizimini gösteren zaman serisi analizlerinde örneklerle karşılaşmadım, bu yüzden orijinal verilerdeki hangi desenin buna neden olacağından emin değilim. Bu yorumdaki Scortchi, sinüzoidal bir paternin, o zaman serilerinde atlanan mevsimsel bir paternden kaynaklanabileceğini tahmin etmektedir . Aynı tip mekansal eğilim mekânsal bir korelogramda bu paterne neden olabilir mi? Yoksa korelasyonların hesaplanma şeklinin başka bir yapısı mı?


İşte işimden bir örnek. Örnek oldukça büyüktür ve açık gri çizgiler, bir referans dağılımı oluşturmak için orijinal verilerin 19 permütasyon kümesidir (böylece kırmızı çizgideki varyansın oldukça küçük olması beklenir). Bu nedenle, arsa gösterilen ilk kadar dramatik olmasa da, daha sonraki mesafelerde çukur ve daha sonra arsada oldukça kolay görünür. (Madendeki çukurun diğer örnekler gibi negatif olmadığını, eğer bu örnekleri örnek olarak bilmediğim farklı yaparsa)

resim açıklamasını buraya girin

Bahsedilen korelogramı üreten uzamsal dağılımı görmek için verilerin bir çekirdek yoğunluk haritasıdır.

DC'de KDE Suçu


1
Bunun doğru olup olmadığından emin değilim, bu yüzden bir cevap olarak göndermiyorum, ama tahminim daha küçük mesafelerde, çok az gözlemin yakın olduğu ve çok benzer olanların olması olacaktır. Mütevazı mesafelerde, daha fazla gözlem "yakın" hale gelir, ancak daha az benzerdir, bu nedenle etki yıkanır. Büyük ama uzak etkileri sürücü çok büyük mesafelerde, her şey yakındadır yedekleyin. (Memleketim üzerinde çalıştığı için beşlik, btw.)I
Sycorax, Reinstate Monica

Ben asimtotik uzamsal mahalle büyüdükçe arsa 0 eğilimi neden benzer bir argüman bekleyebilirsiniz rağmen, ben @ user777 nereden geliyor görebilirsiniz. Yani, mahalle büyüdükçe, mahalle ortalaması büyük ortalamaya daha yakın olacaktır. Kafamda (sanırım) bu korelasyon sıfıra doğru gidiyor, ama bir değil, ama kolayca yanlış olabilirim. (Aynı argüman zaman serileri için de geçerli olmalı ve zaman serisinde bunun gibi görünen ACF grafikleri gördüğümü hatırlamıyorum.)
Andy W

DC'nin kde'si bana bir satranç tahtasını hatırlatıyor. Bir satranç tahtasındaki mekansal otokorelasyon planı nasıl olurdu? Yakın mesafelerde yüksek (aynı kare), biraz daha düşük (farklı kare) ve sonra tekrar daha yüksek olmayacağını merak ediyorum. Bu sorunun cevabı olup olmadığını bilmek için yeterince bilgim yok.
gung - Monica'yı eski

@gung, bu durumda mesafeyi nasıl formüle ettiğinize bağlıdır. Kraliçe bitişikliği olan bir dama tahtası için, bir zaman serisi için bir ACF grafiğinin pozitif ve negatif korelasyonlar arasında alternatif olmasına neden olacak negatif bir oto-regresif terim ile eşanlamlı olur (ve dalga muhtemelen bu durumda çok hızlı bir şekilde söner) ). Ancak mekansal analizde zaman serilerinden daha karmaşıktır. Yine de bu deseni bir dama tahtası olarak nitelendirmezdim.
Andy W

2
Veri kümenizde, 5 kilometrelik bir mesafede otokovaryans tahmin etmeniz gereken yeterli uzamsal kapsama alanı yok (tüm alan 10 kilometreden fazla değildir ve genellikle, korelasyon uzunluğu.) Bana öyle geliyor ki temelde üç suçlu kabaca üçgen şeklinde üç "lekeler" var, lekeler birbirinden yaklaşık 5K ve aralarındaki boşluklar. Bu nedenle, bu uzunlukta pozitif korelasyon görmek şaşırtıcı değildir.
Brian Borchers

Yanıtlar:


4

açıklama

Bir u-şekilli korelogram, hesaplaması bir fenomenin meydana geldiği bölgenin tümünde gerçekleştirildiğinde yaygın bir durumdur. Özellikle topraktaki veya yeraltı suyunda lokal kirlenme gibi doğada tüy benzeri fenomenlerle veya bu durumda olduğu gibi, fenomenin genellikle çalışma alanının sınırına doğru azalan bir nüfus yoğunluğu ile ilişkili olduğu ortaya çıkar. Yüksek yoğunluklu bir kentsel çekirdeğe sahip ve daha düşük yoğunluklu banliyölerle çevrili Columbia).

Korelogramın tüm verilerin uzamsal ayrılma miktarlarına göre benzerlik derecesini özetlediğini hatırlayın. Yüksek değerler daha benzer, düşük değerler daha az benzerdir. En büyük uzamsal ayrılmanın elde edilebildiği tek nokta çifti, haritanın taban tabana zıt yanlarında yer alan noktalardır. Dolayısıyla korelogram, sınır boyunca değerleri birbiriyle karşılaştırmaktadır. Veri değerleri genel olarak sınıra doğru düşme eğilimi gösterdiğinde, korelogram yalnızca küçük değerleri küçük değerlerle karşılaştırabilir. Muhtemelen onlara çok benzeyecektir.

Bu nedenle, herhangi bir tüy benzeri veya diğer uzamsal olarak unimodal fenomen için, veri toplanmadan önce , bölge çapının yaklaşık yarısına ulaşılana kadar korelogramın muhtemelen azalacağını ve sonra artmaya başlayacağını tahmin edebiliriz.

İkincil bir etki: tahmin değişkenliği

İkincil bir etki, kısa mesafelerde korelogramı tahmin etmek için daha uzun mesafelere kıyasla daha fazla veri noktası çiftinin mevcut olmasıdır. Orta ve uzun mesafelerde, bu nokta çiftlerinin "gecikme popülasyonları" azalır. Bu, ampirik korelogramın değişkenliğini arttırır. Bazen bu değişkenlik tek başına korelogramda alışılmadık desenler yaratır. Açıkça, bu etkiyi azaltan üst ("Moran I") rakamında büyük bir veri kümesi kullanıldı, ancak yine de değişkenlikteki artış, arsadaki 3500 veya daha uzak mesafelerde yerel dalgalanmaların daha büyük genliklerinde belirgindir: tam olarak maksimum mesafe.

Bu nedenle, uzamsal istatistiklerde uzun süredir devam eden bir kural, korelogramın çalışma alanının çapının yarısından daha büyük mesafelerde hesaplanmasını önlemek ve bu gibi büyük mesafeleri tahmin için (enterpolasyon gibi) kullanmaktan kaçınmaktır.

Mekansal periyodiklik neden tam cevap değildir?

Mekânsal istatistiklerle ilgili literatür gerçekten de mekânsal olarak periyodik paternlerin daha uzak mesafelerde korelogramda bir toparlanmaya neden olabileceğini belirtmektedir. Madencilik jeologları buna "delik etkisi" diyor. Sinüzoidal bir terim içeren bir variogram sınıfı onu modellemek için vardır. Bununla birlikte, bu variogramların hepsi de mesafeyle güçlü bir çürüme uygular ve bu nedenle ilk şekilde gösterilen tam korelasyona aşırı dönüşü açıklayamaz. Ayrıca, iki veya daha fazla boyutta, bir fenomenin hem izotropik (hem de yönlü korelogramların hepsi aynı olduğu) ve periyodik olması imkansızdır. Bu nedenle, sadece verilerin periyodikliği gösterilenleri açıklamayacaktır.

Ne yapılabilir

Bu gibi durumlarda ilerlemenin doğru yolu, fenomenin durağan olmadığını kabul etmek ve onu belirli bir belirleyici şekil - "sürüklenme" veya "eğilim" - bu sürüklenme etrafında ek dalgalanmalarla tanımlayan bir model benimsemektir. mekansal (ve zamansal) otokorelasyona sahip olabilir. Suç sayımı gibi verilere başka bir yaklaşım, birim nüfus başına suç gibi farklı bir ilişkili değişkeni incelemektir.


Teşekkürler, sizce kenar efektleri için bazı geçici ağırlıklar gerekli mi? (Bu, model artıklarının keşif analizi için aşırı olabilir.) Benim tezim Doğrusal olmayan mekansal sürüklenme ve eğilim terimleri kullanıyorum - birim nüfus başına suç birden fazla nedenden dolayı can sıkıcı. Konut nüfusu gerçekten ilgi konusu değildir - daha çok nüfusun etrafında yürümek gibidir. Şehir içi alanlar belirli saatlerde çok fazla (20 ~ 30 kez) şişebilir ve konut dışı kurumlarla (iş ve eğlence) daha fazla ilgilidir.
Andy W

Çok fazla seçeneğiniz var, Andy, çünkü benzersiz bir model tanımlamanın bir yolu yok: değerleri mekansal bir sürüklenme açısından modellemeyi durdurmak istediğinize karar vermeniz ve bunları (veya daha doğrusu kalıntılarını) modellemeye başlamanız gerekir. stokastik bir mekansal model. U-şekilli korelogram , kaymanın modellenmesi için bazı mekanizmalara ihtiyaç duyulduğunun güçlü bir göstergesi olarak anlaşılabilir . İlgili bir popülasyon tarafından normalleştirilmesi (yalnızca kaba bir şekilde tahmin edilse bile) kullanabileceğiniz bir yöntemdir. Nüfus ölçümlerini (veya kullanımı vb.) Ortak değişken olarak dahil etmek başka bir şeydir.
whuber

Arazi kullanımı (barlar, benzin istasyonları, hastane, okullar vb.) Artı mekansal terimleri içeren çok çeşitli önlemler kullanarak yaklaştım. İşte bu diğer değişkenleri sabit tutan tahminlerin haritası . Yine de küçük bir miktar artık oto-korelasyon vardır. Nüfusun küçük yerlere ne kadar damymetrik eşlemesinin yardımcı olacağı hatası göz önüne alındığında şüpheliyim, ancak sonunda bu analizi yapacağım.
Andy W

Bu ilkeli bir yaklaşımdır: teorinin modelin sürüklenme bileşeninin gelişimine rehberlik etmesine izin verin ve daha sonra kalıntıları, mekansal otokorelasyonunu modelleme sorununa değip değmeyeceğine karar vermek için değerlendirin. Birçok durumda, görünür mekansal ilişkilerin çoğu sapma terimleriyle yeterince açıklanmıştır ve tam jeoistatistiksel makineye ihtiyaç duyulması nadirdir. Sorununuzun ilgi çekici bir yönü, temeldeki metriğin (uzamsal mesafe) tartışmalı olarak Öklid mesafesi yerine sokak ağı boyunca seyahat süresi veya seyahat mesafesi olması gerektiğidir .
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.