Uzamsal otokorelasyon için neden bir GAM hesabına enlem ve boylam eklemek neden?


60

Ormansızlaşma için genelleştirilmiş katkı modelleri ürettim. Mekansal-otokorelasyonu açıklamak için, enlem ve boylamı düzleştirilmiş, etkileşimli bir terim olarak ekledim (örn. S (x, y)).

Bunu, yazarların 'uzamsal otokorelasyonu hesaba katan, noktaların koordinatlarını düzleştirilmiş terimler olarak dahil ettiklerini' söylediği birçok makaleyi okudum. Bu oldukça sinir bozucu. Bir cevap bulma umuduyla GAM'lerde bulabildiğim tüm kitapları okudum, ancak çoğu (örneğin Genelleştirilmiş Katkı Modelleri, R, SN Wood ile Giriş) sadece konuyu açıklamaksızın dokunuyorum.

Biri neden uzaysal otokorelasyona ilişkin enlem ve boylam hesaplarının dahil edilmesinin neden açıklanabileceğini ve bunun için 'muhasebe'nin' ne anlama geldiğini açıklayabilirse gerçekten takdir ediyorum - bunu modele dahil etmeniz yeterli mi yoksa bir modeli karşılaştırmanız mı gerekiyor? s (x, y) içeride ve modelsiz? Ve bu terim tarafından açıklanan sapma mekansal otokorelasyonun kapsamını gösteriyor mu?


İlgiliyse, 'bam' işlevini R.
gisol

Ayrıca, Moran'ın I.
gisol 01.01.2012


3
Buradaki cevaplar göz önüne alındığında, diğer Q @ Makro bağlantılarını bunun kopyasının bir kopyası olarak işaretleyebiliriz, böylece karşısına çıkan insanlar buradaki Yanıtları görebiliyorlar, özellikle de whuber.
Gavin Simpson

+1 @GavinSimpson - bu arada, yeterince oy kullanma yetkisine sahip olduğunuzu unutmayın, ki bunlar yeterince birleşecek iki soruya yol açacak.
Makro

Yanıtlar:


38

Herhangi bir istatistiksel modelde asıl sorun, herhangi bir çıkarım prosedürünün altında yatan varsayımlardır. Tanımladığınız modelde, artıkların bağımsız olduğu kabul edilir. Uzamsal bir bağımlılığa sahiplerse ve bu, modelin sistematik kısmında modellenmemişse, bu modelden gelen artıklar da uzamsal bağımlılık sergileyecek veya başka bir deyişle uzamsal olarak kendi kendine ilişki kurulacaktır. Böyle bir bağımlılık, örneğin GAM'daki test istatistiklerinden p değerleri üreten teoriyi geçersiz kılacaktır; p değerlerine güvenemezsiniz, çünkü bağımsızlık varsayılarak hesaplandılar.

Bu tür verileri ele almak için iki ana seçeneğiniz vardır; i) modelin sistematik kısmındaki mekansal bağımlılığı modellemek veya ii) bağımsızlık varsayımını gevşetmek ve artıklar arasındaki ilişkiyi tahmin etmek.

i) modelde mekansal konumların düzgün bir şekilde dahil edilmesiyle denenmek istenen şeydir. ii) Genelleştirilmiş en küçük kareler gibi bir prosedür kullanılarak model uydurma sırasında artıkların korelasyon matrisinin tahmin edilmesini gerektirir. Bu yaklaşımlardan herhangi birinin mekansal bağımlılıkla ne kadar iyi ilgilendiği, mekansal bağımlılığın doğasına ve karmaşıklığına ve ne kadar kolay modellenebileceğine bağlı olacaktır.

Özet olarak, gözlemler arasındaki mekansal bağımlılığı modelleyebiliyorsanız, artıkların bağımsız rastgele değişkenler olma olasılıkları daha yüksektir ve bu nedenle herhangi bir çıkarımsal işlemin varsayımlarını ihlal etmemektedir.


Net cevabınız için teşekkürler Gavin. Mekansal otokorelasyonu, temelde modele dahil olmayan herhangi bir degradeden farklı kılan nedir? Çalışma alanınızın eğimli bir tepede olduğunu ve ilgilenilen türlerin daha yüksek yaşam alanlarına göre daha düşük yaşam alanlarını tercih ettiğini söyleyin. Modele yükselişi dahil edememek artıklarda bir yapı bırakacaktır, değil mi? Basitçe uzamsal otokorelasyonun unutulmuş olması veya unutulmaması mı? (PS belki de bu, lat'in dahil edilmesi için kötü bir örnektir, uzun da bu etkiyi hesaba katardı).
gisol

4
Evet. Mekansal bileşene baktığınız örneklerde ilgi çekici olduğunu, bu yüzden açıkça bir lat / londan düz bir şekilde modellendiğini veya mekansal bileşenin rahatsız edici bir terim olduğunu, ancak “mekansal” durumunda kalanları bırakmak için modellenmesi gerektiğinden şüpheleniyorum. "bileşen farklı bir değişkenle daha iyi modellenir (örneğin, yorumunuzdaki yükseklik), o zaman mekansal konumlar yerine bu değişkenin yumuşaklığı kullanılır.
Gavin Simpson

1
Neden düzeltti? Tam olarak "düzeltilmiş" ile kastedilen nedir?
Julian

1
@Julian Yanıtın değerleri 2 uzamsal koordinatlara göre düzeltilmiştir. Veya başka bir deyişle, mekansal etkinin yumuşak bir 2-d işlevi olarak tahmin edilir. Düzgün derken, spline'ın bütünleşik kare ikinci türevi ile ölçülen bir miktar titizlik vardır. Tutarlılık, modelin uyumunu ve karmaşıklığını dengelemek için seçilir. Düzgün fonksiyonların (spline'ların) nasıl oluştuğunu bilmek istiyorsanız, belirli bir soruyu sormaya değer olabilir.
Gavin Simpson

55

"Mekansal otokorelasyon", çeşitli insanlar için çeşitli şeyler anlamına gelir. Bununla birlikte, genel bir kavram, konumlarında gözlenen bir olgunun (a) eş değişkenler, (b) konum ve (c) yakın konumlardaki değerlerine belirli bir şekilde bağlı olabileceğidir . (Teknik tanımların değiştiği yerlerde, dikkate alınan verinin türüne, hangi "kesin yolun" önerildiğine ve "yakın" ın ne anlama geldiğine göre değişir: tüm bunların ilerleyebilmesi için kantitatif hale getirilmesi gerekir.)z

Neler olup bittiğini görmek için, bir bölgenin topografyasını tanımlamak için böyle bir mekansal modelin basit bir örneğini ele alalım. Bir noktasında ölçülen yükseklik olsun olmak . Bir olası bir model olduğunu koordinatları ile ilgili bazı kesin matematiksel bir şekilde bağlıdır ben yazacak, bu iki boyutlu bir durumda. Letting (varsayımsal bağımsız) gözlem ve (her zamanki gibi sıfır beklenti var varsayılır) model arasındaki sapmalar temsil biz yazabilirsiniz y ( Z ) y z ( z 1 , z 2 ) εzy(z)yz(z1,z2)ε

y(z)=β0+β1z1+β2z2+ε(z)

Bir için doğrusal eğilim modeli . Doğrusal eğilim ( ve katsayıları ile gösterilir), close için yakındaki ve değerlerinin yakın olduğu fikrini yakalamanın bir yoludur. için , birbirine yakın olmak eğiliminde olmalıdır. Bunu, ve , arasındaki farkın boyutunun beklenen değerini dikkate alarak hesaplayabiliriz. . Matematiğin çok olduğu ortaya çıktıβ 2 y ( z )β1β2y(z)y(z)zzy(z)y(z)E[|y(z)y(z)|]biraz farklı bir fark ölçüsü kullanırsak daha basit: bunun yerine beklenen kareli farkı hesaplıyoruz :

E[(y(z)y(z))2]=E[(β0+β1z1+β2z2+ε(z)(β0+β1z1+β2z2+ε(z)))2]=E[(β1(z1z1)+β2(z2z2)+ε(z)ε(z))2]=E[(β1(z1z1)+β2(z2z2))2+2(β1(z1z1)+β2(z2z2))(ε(z)ε(z))+(ε(z)ε(z))2]=(β1(z1z1)+β2(z2z2))2+E[(ε(z)ε(z))2]

Bu model hiçbir açık uzamsal oto-korelasyon içermez, çünkü içinde ile yakındaki değerlerini doğrudan ilişkilendiren bir terim yoktur .y(z)y(z)

Alternatif, farklı bir model, lineer eğilimi görmezden gelir ve yalnızca otokorelasyon olduğunu varsayar. Bunu yapmanın bir yolu sapmalarının yapısıdır . Bunu pozlandırabiliriz.ε(z)

y(z)=β0+ε(z)

ve korelasyon beklentimizi açıklamak için, için bir çeşit "kovaryans yapısı" üstleneceğiz . Bu uzaysal anlamlı olması için sağlamak için, kovaryans üstlenecek ve , eşit , sıfır aracı olması nedeniyle, ve gittikçe azalma eğilimindedir . Detaylar önemli olmadığı için, bu kovaryansı . Bu mekansal otokorelasyondur.εε(z)ε(z)E[ε(z)ε(z)]εzzC(z,z) Aslında, ve arasındaki (olağan Pearson) korelasyon ,y(z)y(z)

ρ(y(z),y(z))=C(z,z)C(z,z)C(z,z).

Bu gösterimde, ilk model için önceki beklenen kare farkı:y

E[(y(z)y(z))2]=(β1(z1z1)+β2(z2z2))2+E[(ε(z)ε(z))2]=(β1(z1z1)+β2(z2z2))2+C1(z,z)+C1(z,z)

( varsayımıyla ), çünkü farklı konumlardaki bağımsız olduğu varsayılmıştır. Bunun ilk model için kovaryans işlevi olduğunu belirtmek için yerine yazdım .zzεC1C

kovaryansları bir konumdan diğerine dramatik bir şekilde değişmediğinde (aslında, genellikle sabit olduğu varsayılır), bu denklem, ' de beklenen kare farkının, arasındaki ayrımla çıktığını gösterir. ve . Gerçek artış miktarı, trend katsayıları ve .εyzzβ0β1

En beklenen karesi farklar bakalım 'nin yeni modeli için ise, model 2:y

E[(y(z)y(z))2]=E[(β0+ε(z)(β0+ε(z)))2]=E[(ε(z)ε(z))2]=E[ε(z)22ε(z)ε(z)+ε(z)2]=C2(z,z)2C2(z,z)+C2(z,z).

Yine bu doğru bir şekilde hareket eder: biz biçim için olmalıdır azaltmak olarak ve haline daha ayrılmış, beklenen kare fark olarak 'nin gerçekten gider kadar yerle ayrılmasını artan.C2(z,z)zzy

İki modeldeki iki ifadenin için karşılaştırılması bize ilk modelde matematiksel olarak ikinci modelde ile özdeş bir rol oynuyor . (Farklı anlamları gömülü orada gizlenen bir katkı sabit var, , ancak bu analizde önemli değildir.) Ergo , modele bağlı olarak, uzaysal ilişki tipik olarak rasgele hatalar üzerine bir eğilim ve öngörülen bir korelasyon yapısının bir kombinasyonu olarak temsil edilir.E[(y(z)y(z))2](β1(z1z1)+β2(z2z2))22C2(z,z)Ci(z,z)

Şimdi, umarım şu soruya açık bir cevap verdik: Tobler'ın Coğrafya Yasası'nın ("her şey her şeyle ilgilidir, ancak daha yakın şeyler daha fazla ilişkilidir") fikrini farklı şekillerde temsil edebilir. Bazı modellerde, Tobler Kanunu, boylam ve enlem gibi uzamsal koordinatların işlevleri olan trendler (veya "sapma" terimleri) dahil edilerek yeterince temsil edilir. Diğerlerinde, Tobler Yasası, ilave rasgele terimler arasında önemsiz bir kovaryans yapısıyla yakalanır (ε). Uygulamada, modeller her iki yöntemi de içermektedir. Hangisini seçeceğiniz, modelle neyi başarmak istediğinize ve mekansal otokorelasyonun nasıl ortaya çıktığına ilişkin görüşünüze bağlıdır - bunun temel eğilimler tarafından ima edilip edilmediği veya rastgele olarak değerlendirmek istediğiniz varyasyonları yansıttığı. İkisi de her zaman doğru değildir ve herhangi bir problemde, verileri analiz etmek, fenomeni anlamak ve diğer konumlardaki değerlerini tahmin etmek için her iki model türünü kullanmak genellikle mümkündür (enterpolasyon).


2
+1 - mekansal bağımlılığı ele almak için iki yaklaşım arasındaki bağlantıyı görmek güzel. Harika cevap, whuber!
Makro

Çok kapsamlı, teşekkür ederim. Tüm bunları düşünmek birkaç dakika sürecek.
gisol

6
Bütün istatistiksel yazılar bu ilk olsalardı, dünyada çok daha net düşünülmüş bir uygulamalı istatistik çalışması olurdu. Çok güzel yapılmış.
Ari B. Friedman

Herhangi bir (?!) modele bağımsız değişkenler olarak X / Y koordinatlarının eklenmesinin bir dereceye kadar mekansal oto-korelasyonu hesaba katacağı sonucunu çıkardığımda bu cevabı doğru anlıyor muyum?
Julian

1
@Julian: Aynı veriler için farklı modeller oluşturmaktan bahsediyoruz. Açıklayıcı değişkenler olarak X ve Y koordinatlarını eklerseniz, ancak aksi takdirde mekansal korelasyonu hesaba katmazsanız, "mekansal korelasyon" bu model için bir anlam ifade etmez, bu yüzden "mekansal korelasyonu hesaba katmakla" ile ne kastettiğimize dikkat etmeliyiz. Ancak, koordinatların açıklayıcı değişkenler olarak dahil edilmesinin, mekansal korelasyonun açıkça temsil edildiği bir model oluşturmak kadar etkili olup olmadığını sormak konusundaki sorunuzu anlarsanız, cevabım "evet, çoğu durumda böyledir".
whuber

0

Diğer cevaplar iyi, sadece uzamsal otokorelasyon için 'muhasebe' ile ilgili bir şeyler eklemek istedim. Bazen bu iddia, "ortak değişkenler tarafından açıklanmayan mekansal otokorelasyonu hesaba katma" hatları boyunca daha güçlü bir şekilde öne sürülmektedir.

Bu, uzaysal pürüzsüzün ne yaptığının yanıltıcı bir resmini sunabilir. Düzgünce, değişkenlerin önce başlamasını bekler ve sonra düzgün olmayan 'açıklanamayan' parçaları paspaslar. Gerçekte hepsinin verileri açıklama şansı var.

Uygun olarak adlandırılmış bir başlığı olan bu makale konuyu gerçekten net bir şekilde ortaya koymaktadır, bununla birlikte, bir CAR modeli açısından GAM pürüzsüzlükleri için geçerli olan ilkeler geçerlidir.

Mekansal Olarak İlişkili Hatalar Eklemek, Sevdiğiniz Sabit Etkiyi Ortaya Koyabilir

Kağıttaki 'çözüm', boşlukları yumuşatmak yerine artıkları yumuşatmaktır. Bu, değişkenlerinizin neler yapabildiklerini açıklamalarına izin verme etkisine sahiptir. Elbette, bunun istenen bir çözüm olmayacağı birçok uygulama var.


-2

Mekansal korelasyon basitçe x ve y koordinatlarının uzaydaki sonuç yüzeyinin büyüklüğü ile olan ilişkisidir. Böylece koordinatlar arasındaki otokorelasyon, komşu noktalar arasındaki fonksiyonel ilişki açısından ifade edilebilir.


1
Merhaba Michael, cevap için teşekkürler. Ne söylediğini anladığımı düşünüyorum, ancak koordinasyonun bunun için nasıl hesaplandığından ziyade mekansal otokorelasyonun bir açıklaması gibi görünüyor - ama yine de noktanızı özlüyorum. Örneğin, 2 modelim var; birincisi (A) tek terimli - bir başkent şehre olan mesafenin bir fonksiyonu olarak ormansızlaşma ve ikincisi (B) başkent kenti ile aynı zamanda uzun ve uzun terim. Bu bağlamda cevabınızı tekrar eder misiniz? Belki daha iyi anlayabilirim.
gisol

1
Modelde hiçbir etkileşim terimi yoksa, komşu noktalar arasındaki mekansal oto korelasyonun 0 olduğunu düşünüyorum. Bir yineleme teriminiz olduğunda, bu terim mekansal oto korelasyonların değerini belirler.
Michael Chernick

4
@Michael, mekansal otokorelasyon, noktalar arasındaki korelasyonun mekansal konumlarına bağlı olduğu anlamına gelir. Bunun yerine, konumsal konumlarla girdiler olarak düzgün işlev tahminini kullanmanın nedenini açıklayabilirseniz, bu cevabın daha faydalı olacağını düşünüyorum. Yüzeyde düzgün fonksiyon yaklaşımı ortalamayı modellerken uzaysal otokorelasyon kovaryans yapısını ifade eder . Pürüzsüz bir işlemin kovaryans işlevi ile pürüzsüz işlev kestirimi arasında bir ilişki olduğunu biliyorum, ancak bu bağlantıyı kurmadan bu cevap eksik görünüyor.
Makro

1
@Michael, kesinlikle uzun / uzun koordinatların ortalamayı etkilemesinin kesinlikle uzayda iki nokta arasındaki korelasyonları modellemekten farklı olduğunu görebiliyorsunuz ... OP uzamsal otokorelasyonu nasıl modelleyeceğini sordu ve bence argümanın bir parçası - o kısım Uzamsal bir uzamsal yüzeyin (koordinatlardaki genelleştirilmiş bir katkı modelinin ne yapacağını) tam olarak uzamsal otokorelasyonu nasıl modellediğini açıklar. Gamlar ve kovaryans işlevleri arasında bir ilişki var (daha kesin olmak için yeterince bilgim yok) ancak bu ilişkiye hitap etmek, burada gerekli olan gibi görünüyor.
Makro

1
@Marco Simon Wood'un kitabına göz atacağım eğer detayları varsa ve pürüzsüzlükle ilgili literatürü rastgele etkiler biti olarak gösterir.
Gavin Simpson
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.