Mekansal otokorelasyonun bir ölçüsü olan Moran I , özellikle sağlam bir istatistik değildir (mekansal veri özelliklerinin çarpık dağılımlarına duyarlı olabilir).
Mekansal otokorelasyonu ölçmek için daha sağlam teknikler nelerdir? Özellikle R gibi bir komut dosyası dilinde kolayca bulunabilen / uygulanabilen çözümlerle ilgileniyorum. Çözümler benzersiz koşullar / veri dağıtımları için geçerliyse, lütfen cevabınızdakileri belirtin.
DÜZENLEME : Soruyu birkaç örnekle genişletiyorum (orijinal soruya yapılan yorumlara / yanıtlara yanıt olarak)
Permütasyon tekniklerinin (bir Monte Carlo prosedürü kullanılarak bir Moran I örnekleme dağılımının üretildiği yerlerde) sağlam bir çözüm sunduğu öne sürülmüştür. Anladığım kadarıyla, böyle bir test , Moran'ın I dağılımı hakkında herhangi bir varsayım yapma ihtiyacını ortadan kaldırıyor (test istatistiğinin veri kümesinin uzamsal yapısından etkilenebileceği göz önüne alındığında), ancak permütasyon tekniğinin normal olmayanlar için nasıl düzeltildiğini göremiyorum dağıtılmış öznitelik verisi . İki örnek öneriyorum: biri çarpık verilerin yerel Moran'ın I istatistiği üzerindeki etkisi, diğeri ise küresel Moran'ın I- - permütasyon testleri altında bile etkisini göstermektedir.
Ben kullanacağız Zhang et al. 'nin (2008) ilk örneği analiz eder. Makalelerinde, permütasyon testleri (9999 simülasyonları) kullanarak nitelik veri dağıtımının yerel Moran I üzerindeki etkisini göstermektedirler . Orijinal verileri (sol panel) ve aynı verilerin log dönüşümünü (sağ panel) GeoDa'da kullanarak (% 5 güven seviyesinde) kurşun (Pb) konsantrasyonları için yazarların sıcak nokta sonuçlarını çoğalttım. Orijinal ve log-dönüştürülmüş Pb konsantrasyonlarının kutu grafikleri de sunulmaktadır. Burada, veriler dönüştürüldüğünde önemli sıcak noktaların sayısı neredeyse iki katına çıkar ; bu örnekte, yerel istatistiğin , Monte Carlo tekniklerini kullanırken bile özellik veri dağıtımına duyarlı olduğu gösterilmiştir!
İkinci örnek (simüle edilmiş veriler) , permütasyon testlerini kullanırken bile çarpık verilerin küresel Moran I üzerindeki etkisini gösterir . R'de bir örnek şöyledir:
library(spdep)
library(maptools)
NC <- readShapePoly(system.file("etc/shapes/sids.shp", package="spdep")[1],ID="FIPSNO", proj4string=CRS("+proj=longlat +ellps=clrk66"))
rn <- sapply(slot(NC, "polygons"), function(x) slot(x, "ID"))
NB <- read.gal(system.file("etc/weights/ncCR85.gal", package="spdep")[1], region.id=rn)
n <- length(NB)
set.seed(4956)
x.norm <- rnorm(n)
rho <- 0.3 # autoregressive parameter
W <- nb2listw(NB) # Generate spatial weights
# Generate autocorrelated datasets (one normally distributed the other skewed)
x.norm.auto <- invIrW(W, rho) %*% x.norm # Generate autocorrelated values
x.skew.auto <- exp(x.norm.auto) # Transform orginal data to create a 'skewed' version
# Run permutation tests
MCI.norm <- moran.mc(x.norm.auto, listw=W, nsim=9999)
MCI.skew <- moran.mc(x.skew.auto, listw=W, nsim=9999)
# Display p-values
MCI.norm$p.value;MCI.skew$p.value
P değerlerindeki farkı not edin. Çarpık veriler,% 5 anlamlılık düzeyinde (p = 0.167) kümeleme olmadığını gösterirken, normal olarak dağıtılan veriler, (p = 0.013) olduğunu gösterir.
Chaosheng Zhang, Lin Luo, Weilin Xu, Valerie Ledwith, Galway, İrlanda'nın kentsel topraklarında Pb'nin kirlilik sıcak noktalarını tanımlamak için yerel Moran I ve CBS kullanımı, Toplam Çevre Bilimi, Cilt 398, Sayılar 1–3, 15 Temmuz 2008 , Sayfalar 212-221