Regresyon Modeli ve Mekansal Otokorelasyon


15

İki farklı veritabanı arasındaki bağımlılıkları doğrulamak için OLS ve GWR kullandım. GWR için Artık Kare 0.82'dir ve böylece iki veri kümesi arasındaki ilişkiyi belirlemek için kullanılacak doğru regresyon modeli haline gelir.

Bilmek istediğim şey, GWR'nin Yerel regresyon ve OLS'nin küresel regresyon olması, nerede ve ne zaman kullanılması gerekir?

Ayrıca, GWR modeli için Moran I'in Rastgele olması gerçekten ne anlama geliyor?

Yanıtlar:


13

Bu prosedürler nelerdir

Her ne kadar EKK ve GWR onların istatistiki formülasyonun birçok yönünü paylaşan, farklı amaçlar için kullanılır:

  • OLS resmi olarak belirli bir türden küresel bir ilişkiyi modeller . En basit haliyle, veri kümesindeki her kayıt (veya vaka) , deneyci (genellikle "bağımsız değişken" olarak adlandırılır) tarafından ayarlanan bir x değerinden ve gözlemlenen başka bir y değerinden ("bağımlı değişken") oluşur. ). OLS, y'nin yaklaşık olarakx ile özellikle basit bir şekilde ilgilidir: yani, a + b * x'in, deneycinin ilgilenebileceği tüm x değerleri için y'nin iyi bir tahmini olacağı 'a' ve 'b' sayıları (bilinmeyen) vardır. . "İyi tahmin" y değerlerinin herhangi bir matematiksel tahminden farklı olabileceğini ve olacağını tahmin eder, çünkü (1) gerçekten yaparlar - doğa nadiren matematiksel bir denklem kadar basittir - ve (2) y bazılarıyla ölçülür hata. A ve b değerlerini tahmin etmenin yanı sıra OLS, y cinsinden varyasyon miktarını da ölçmektedir. Bu, OLS'ye a ve b parametrelerinin istatistiksel önemini belirleme yeteneği verir .

İşte bir OLS uyumu:

resim açıklamasını buraya girin

  • GWR yerel ilişkileri araştırmak için kullanılır . Bu ortamda hala (x, y) çiftleri vardır, ancak şimdi (1) tipik olarak, hem x hem de y gözlemlenmektedir - ikisi de önceden bir deneyci tarafından belirlenemez - ve (2) her kaydın uzamsal bir yeri vardır, z . Herhangi bir konum için, z (verilerin mevcut olduğu yerde bile olması gerekmez), GWR, y = x arasındaki y = x (y) + b (z) biçiminde konuma özgü bir ilişkiyi tahmin etmek için OLS algoritmasını komşu veri değerlerine uygular. * x. "(Z)" notasyonu, a ve b katsayılarının konumlar arasında değiştiğini vurgulamaktadır . Bu nedenle, GWR yerel ağırlıklı düzleştiricilerin özel bir versiyonudurmahalleleri belirlemek için sadece mekansal koordinatlar kullanılır. Çıktısı, x ve y değerlerinin bir uzamsal bölge boyunca nasıl birleştiğini göstermek için kullanılır . Denklemde hangi 'x' ve 'y' nin bağımsız değişken ve bağımlı değişken rolünü oynaması gerektiğini seçmek için hiçbir neden olmadığı dikkat çekicidir, ancak bu rolleri değiştirdiğinizde sonuçlar değişecektir ! Bu, GWR'nin resmi bir yöntemden ziyade keşifçi - verileri anlamak için görsel ve kavramsal bir yardım olarak görülmesi gereken birçok nedenden biridir.

İşte yerel ağırlıklı bir pürüzsüz. Verilerde görünen "kıpırdatmaları" nasıl takip edebileceğine dikkat edin, ancak her noktadan tam olarak geçmez. (Noktalardan geçmek veya daha küçük kıpırtıları takip etmek, prosedürdeki bir ayarı değiştirerek yapılabilir, tam olarak GWR, uzamsal verileri prosedüründeki ayarları değiştirerek az çok tam olarak takip etmek için yapılabilir.)

Lowess

Sezgisel olarak, OLS'yi (x, y) çiftlerinin dağılım grafiğine katı bir şekil (çizgi gibi) sığdırmak ve bu şeklin keyfi olarak kıpırdatmaya izin vermek olarak düşünün.

Aralarında seçim yapma

Mevcut durumda, "iki farklı veritabanının" ne anlama gelebileceği açık olmasa da, aralarındaki bir ilişkiyi "doğrulamak" için OLS veya GWR kullanmanın uygunsuz olabileceği görülmektedir. Örneğin, veritabanları aynı konum kümesinde aynı miktarda bağımsız gözlemleri temsil ediyorsa, (1) OLS muhtemelen uygun değildir, çünkü hem x (bir veritabanındaki değerler) hem de y (diğer veritabanındaki değerler) değişken olarak (x'i sabit ve doğru bir şekilde temsil edilmiş olarak düşünmek yerine) ve (2) GWR, x ve y arasındaki ilişkiyi keşfetmek için iyidir , ancak doğrulamak için kullanılamazherhangi bir şey: Ne olursa olsun, ilişki bulması garanti edilir. Ayrıca, daha önce belirtildiği gibi, "iki veritabanının" simetrik rolleri ya 'x' ve diğerinin 'y' olarak seçilebildiğini gösterir, bu da farklılık göstermesi muhtemel iki olası GWR sonucuna yol açar.

Burada, x ve y rollerini tersine çevirerek aynı verilerin yerel olarak ağırlıklı bir pürüzsüzlüğü vardır. Bunu bir önceki grafikle karşılaştırın: genel uyumun ne kadar dik olduğunu ve ayrıntılarda nasıl farklı olduğunu görün.

Lowess 2

İki veritabanının aynı bilgileri sağladığını belirlemek veya göreceli sapmalarını veya göreceli hassasiyetlerini değerlendirmek için farklı teknikler gereklidir. Teknik seçimi, verilerin istatistiksel özelliklerine ve validasyonun amacına bağlıdır. Bir örnek olarak, kimyasal ölçüm veritabanları tipik olarak kalibrasyon teknikleri kullanılarak karşılaştırılacaktır .

Moran'ın yorumlanması I

Bir "Moran'ın GWR modeli için I" nin ne anlama geldiğini söylemek zor. Sanırım bir Moran'ın I istatistiği bir GWR hesaplamasının kalıntıları için hesaplanmış olabilir. (Kalanlar gerçek ve uygun değerler arasındaki farklardır.) Moran I , mekansal korelasyonun küresel bir ölçüsüdür. Küçükse, x-değerlerinden y-değerleri ve GWR uyumu arasındaki varyasyonların çok az uzamsal korelasyona sahip olduğunu veya hiç bir uzamsal korelasyon olmadığını düşündürmektedir. GWR verilere "ayarlandığında" (bu, herhangi bir noktanın gerçekten bir "komşusunu" neyin oluşturduğuna karar vermeyi içerir), GWR (dolaylı olarak) x ve y arasındaki herhangi bir uzamsal korelasyondan yararlandığı için artıklarda düşük uzamsal korelasyon beklenmelidir. algoritmasındaki değerler.


Yani GWR'de değişkenleri tersine çevirmenin farklı sonuçlar verdiğini söylediniz, ancak daha yüksek kalıntı karesi veren, bu ikisi arasında daha güçlü bir ilişki gösterdiği anlamına gelmiyor mu?
Sam007

Kendi içinde düşük bir kalıntı kare olan Sam, daha güçlü bir ilişki olduğunu göstermez. Özellikle, x ve y rollerini ters çevirdiğinizde, kalan kareleri bile karşılaştıramazsınız - bunlar genellikle farklı birimlerdedir. (Örneğin, biri kare sıcaklık, diğeri kare miktarda yağmur olabilir: hangisinin daha düşük olduğunu nasıl anlarsınız?) Modelde, anlamsız olsalar bile, daha fazla parametre ekleyerek kalan kareyi her zaman azaltabilirsiniz. : bu yönde çok ileri gitmeye "aşırı takma" denir. Bir anlamda, kısa bir mekansal aralığa sahip GWR, bir tür aşırı uydurma şeklidir.
whuber

2
R kare düşünüyor olabilirsiniz Sam: bu bir oran. ("Artık kare" nin tam olarak söylediği şey olduğunu anladım: artıkların karelerinin toplamı. Çoğu istatistik yazılımı bu istatistiği R-kare değerleriyle birlikte rapor eder.) Ancak farklı modelleri karşılaştırmak hala tehlikeli ve genellikle yanlıştır (böyle) x olarak y yerine x ve y olarak y) olarak R kare şeklinde: bkz. stats.stackexchange.com/questions/13314 . GWR keşifçi olduğundan, örüntüler bulmak ve ilişkileri varsaymak için harikadır , ancak (genellikle uygulandığı gibi) iddiaları kanıtlamak için uygun değildir .
whuber

1
WOW gerçekten tüm istatistiklerdi. Aslında ben zor buluyorum nedeni becoz i istatistiklerde çok kötü bir arka plan var, bu yüzden tam olarak ne anlama geldiğini anlamadan, sadece model sonuçlarına güveniyorum. R2'deki şeylerin çoğu başımın üzerinden geçti. Başlamak ve istatistik temelini oluşturmak için bazı iyi başlayanlar kitabı önerebilir misiniz?
Sam007


3

Rsquared modelleri karşılaştırmak için kullanılmamalıdır. Günlük likihood'u veya AIC değerlerini kullanın.

GWR'deki artıklarınız rasgele ise veya sanırım belirtilen bir modele sahip olabileceğinizden rastgele (istatistiksel olarak sig. Değil) görünüyor. En azından, ilişkili kalıntılara sahip olmadığınızı ve atlanan değişkenlerinizin bulunmadığını önermelidir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.