Bir uzamsal süreç için parametreleri tahmin etme


12

Pozitif tamsayı değerlerin bir ızgarası verildi . Bu sayılar, o ızgara konumunu işgal eden bir kişinin inancının gücüne karşılık gelmesi gereken bir yoğunluğu temsil eder (daha yüksek bir inancı gösteren daha yüksek bir değer). Bir kişi genel olarak çoklu ızgara hücreleri üzerinde bir etkiye sahip olacaktır.n×n

Yoğunluğun örüntüsünün, yüksek yoğunlukta merkezi bir yer olacağı için "Gausscu" görünmesi gerektiğine inanıyorum ve daha sonra, şiddetler her yönden radyal olarak azalıyor. Özellikle, değerleri bir "ölçeklendirilmiş Gauss" dan varyans için bir parametre ve ölçek faktörü için başka bir parametre ile gelen olarak modellemek istiyorum.

İki karmaşık faktör vardır:

  • bir kişinin yokluğu, arka plan gürültüsü ve diğer etkiler nedeniyle sıfır değere karşılık gelmez, ancak değerler daha küçük olmalıdır. Yine de düzensiz olabilirler ve ilk yaklaşımda basit Gauss gürültüsü olarak modellemek zor olabilir.
  • Yoğunluk aralığı değişebilir. Bir örnekte, değerler 1 ile 10 arasında, bir başka değerde 1 ile 100 arasında olabilir.

Uygun bir parametre tahmin stratejisi veya ilgili literatüre işaret ediyorum. Bu soruna neden tamamen yanlış yaklaştığımın göstergeleri de takdir edilecektir :). Kriging ve Gauss süreçlerini okuyordum, ama bu benim sorunum için çok ağır bir makine gibi görünüyor.


1
Varyans ve ölçek parametresine sahip bir Gaussian ile ne demek istiyorsun ? Varyans parametresi olan bir Gauss ölçek parametresi! Ayrıca şimdiye kadar kurduğunuz modelden biraz emin değilim. Aslında çözmeye çalıştığınız sorunu daha ayrıntılı olarak açıklayabilir misiniz? Düşük tanecikli tamsayı değerli gözlemleri modellemek için bir Gauss kullanmak, balık gibi görünüyor.
kardinal

(+1) İlginç bir soru için. Biraz daha iyi neyi çözmeye çalıştığınızı anlamak için sabırsızlanıyorum.
kardinal

İşte birkaç gözlem: 1. Değerleriniz tamsayı ise, Gauss kullanımı uygun görünmüyor. 2. Modelinizin amacının ne olduğu belli değil, örneğin güçlü inanç kümelerini tanımlamak ister misiniz? Parametreleriniz varsa yorumlanması ne olacak? 3. Bir şebekeniz olduğundan, neden iki değişkenli dağılımların karışımını takmaya çalışmıyorsunuz? Daha sonra ızgara, dağıtımın (birim kare) desteği olacak ve yoğunluklar yüksek olasılık bölgelerine karşılık gelecektir.
mpiktas

İlginç noktalar için teşekkürler. Açıklığa kavuşturmaya çalışayım. "Gauss" un seçimi, yorumlar ışığında, yardım ettiğinden daha fazla karışıklığa neden olan kırmızı bir ringa balığı olabilir. Verilerin temel özelliği, kişinin bulunduğu yere en yüksek inanç noktasında yüksek yoğunluklu değerlerdir ve etrafındaki "radyal olarak" daralmadır (ampirik olarak gözlemledim). Yoğunluk değerleri çözümden (doğrusal) ters bir soruna gelir ve bu yüzden aslında ayrılmaz olmak zorunda değildir - bu sadece sahip olduğumuz verilerdir.
Suresh Venkatasubramanian

btw Soruyu daha iyi tanımlanmış ve daha iyi modellenmiş olma çabalarını takdir ediyorum. Doğru modelleme varsayımlarını birleştirmek için gerçek veri ayarını açıklamak için elimden geleni yapacağım.
Suresh Venkatasubramanian

Yanıtlar:


5

Aşağıda tartıştığım uzamsal veri analizi yöntemleri için pysal python kütüphanesinin bu modülünü kullanabilirsiniz .

Her bireyin tutumunun onu çevreleyen insanların tutumlarından nasıl etkilendiğine dair açıklamanız, bir uzamsal otoregresif model (SAR) ile temsil edilebilir (ayrıca bu SE cevabındaki 2 basit SAR açıklamamı da görün ). En basit yaklaşım, diğer faktörleri görmezden gelmek ve Moran'ın I istatistiğini kullanarak çevreleyen insanların birbirlerinin tutumlarını nasıl etkilediğinin etkisinin gücünü tahmin etmektir .

Etraftaki insanların etkisinin gücünü, daha karmaşık bir görevi tahmin ederken diğer faktörlerin önemini değerlendirmek istiyorsanız, bir regresyon parametrelerini tahmin edebilirsiniz: . Buradaki belgelere bakın . (Bu tür gerilemeyi tahmin etme yöntemleri, mekansal ekonometri alanından gelir ve verdiğim referanstan çok daha sofistike olabilir.)y=bx+rhoWy+e

Zorluğunuz mekansal ağırlık matrisi ( ) oluşturmak olacaktır . Sanırım matrisin her bir elemanı 1 veya 0 olmalı, bir mesafede olup olmadığına bağlı olarak diğer kişiyi etkilemenizin gerekli olduğunu düşünüyorsunuz .w i j i jWwijij

Sorunun sezgisel bir fikrini elde etmek için, aşağıda bir uzamsal otoregresif veri oluşturma sürecinin (DGP) nasıl bir değer modeli oluşturacağını göstereceğim. Simüle edilmiş değerlerin 2 kafesi için beyaz bloklar yüksek değerleri ve koyu bloklar düşük değerleri temsil eder.

Aşağıdaki ilk kafeste ızgara değerleri, sıfır olduğu normal olarak dağıtılmış rastgele bir işlem (veya Gaussian) tarafından üretilmiştir .rho

Rastgele (Gaussça)

Aşağıdaki ızgarada, ızgara değerleri, yüksek bir şeye ayarlandığı bir uzaysal otoregresif süreç tarafından üretilmiştir . rhoresim açıklamasını buraya girin


Bu çok ilginç (ve ilgili Geary C de öyle). Bu ihtiyacım olana yakın olabilir.
Suresh Venkatasubramanian

Geary C, dağılımın ortasındaki değerler de dahil olmak üzere değerlerin birbirine nasıl yakın olduğunu görmenize yardımcı olur. Moran'ın I değeri, çok yüksek değerlerin çok yüksek değerlerle ve çok düşük değerlerin çok düşük değerlerin etrafında nasıl kümelentiğini görmenize yardımcı olur. Belki de haklısınız ve en basit ve en iyi yöntem Geary C'dir. Geary'nin C yaklaşımının keşifçi olduğunu ve sonuçlarınızı diğer faktörler üzerinde koşullandırmanıza izin vermeyeceğini unutmayın. Geary's C'yi çalıştırmak için kod için bu python modülüne bakın: pysal.org/1.1/library/esda/geary.html .
b_dev

Bunlarla biraz daha oynayalım. İhtiyacım olanı yapıyor gibi görünüyorsa (ve olacağını düşünüyorum), bu en iyi cevap gibi geliyor.
Suresh Venkatasubramanian

3

İşte işe yarayabilecek basit bir fikir. Yorumlarda söylediğim gibi, yoğunluğu olan bir şebekeniz varsa neden iki değişkenli dağılım yoğunluğuna uymuyorsunuz?

İşte benim açımdan örnek grafik: resim açıklamasını buraya girin

İle her ızgara noktası, yoğunluğa göre renkli bir kare olarak görüntülenir. Grafik üzerinde, iki değişkenli normal yoğunluk grafiğinin kontur grafiğidir. Gördüğünüz gibi, kontur çizgileri azalan yoğunluk yönünde genişler. Merkez, iki değişkenli normalin ortalaması ve yoğunluğun kovaryans matrisine göre yayılması ile kontrol edilecektir.

Ortalama ve kovaryans matrisi tahminlerini elde etmek için basit sayısal optimizasyon kullanılabilir, yoğunlukları ortalama ve kovaryans matrisini parametre olarak kullanarak yoğunluk fonksiyon değerleri ile karşılaştırın. Tahminleri almak için simge durumuna küçültün.

Tabii ki bu kesinlikle istatistiksel bir tahmin değil, ama en azından size nasıl ilerleyeceğiniz konusunda bir fikir verecektir.

Grafiği yeniden üretmek için kod:

require(mvtnorm)
sigma=cbind(c(0.1,0.7*0.1),c(0.7*0.1,0.1))

x<-seq(0,1,by=0.01)
y<-seq(0,1,by=0.01)
z<-outer(x,y,function(x,y)dmvnorm(cbind(x,y),mean=mean,sigma=sigma))

mz<-melt(z)

mz$X1<-(mz$X1-1)/100
mz$X2<-(mz$X2-1)/100

colnames(mz)<-c("x","y","z")

mz$intensity<-round(mz$z*1000)

ggplot(mz, aes(x,y)) + geom_tile(aes(fill = intensity), colour = "white") + scale_fill_gradient(low = "white",     high = "steelblue")+geom_contour(aes(z=z),colour="black")

2

X[i,j]X[i,j](X[i1,j1],...,X[im,jm])(X[i1+k,j1+l]...,X[im+k,jm+l])corr(X[i1,j1],X[i2,j2])d([i1,j1],[i2,j2])ρ(d)ρ(d)=kd1k

d([i1,j1],[i2,j2])=|i1i2|+|j1j2|ρ(d)örneğin maksimum olasılıkla. Daha fazla fikir için "rastgele alan" ı arayın.


1
"Mekansal durağanlığı varsaymak istiyorum" doğrudan OP'nin "yoğunlukların radyal olarak her yöne doğru azaldığı" varsayımıyla çelişiyor gibi görünüyor.
whuber

Nasıl yani? Böyle bir model önerdiğim otokorelasyon yapısı ile meydana gelecektir.
charles.y.zheng

1
@charles Bu önemli bir nokta: eğer gerçekten bu belirgin eğilim otokorelasyona atfedilecekse, prensipte sürecin başka bir bağımsız gerçekleşmesinin, merkezi bir noktadan uzak bir değer artışı gibi, dramatik olarak farklı bir eğilimi olduğu görülüyor. OP açıkça bazı belirleyici unsurları eğilime ("radyal daralma") ve korelasyonel unsurlara ("birden fazla ızgara hücresi üzerinde etkiye sahiptir") ayırdığı ve buna saygı duyan bir cevap, muhtemelen OP fikrini değiştirmek isteyecektir.
whuber

Mekansal durağanlık koşulunu anladığımdan emin değilim. Yüzeyde, belirli bir yerde "incelen bir zirveye" sahip olma fikri ile çelişiyor gibi görünüyor, ama açıkça bir şey anlamıyorum.
Suresh Venkatasubramanian

1
@charles, tanımladığınız desen uzamsal durağanlık varsayımı nedeniyle ızgara noktalarının her biri için mevcut olacaktır . Durağanlık temel olarak tüm noktalarımın benzer şekilde davrandığını söylüyor. Bu OP tarafından tarif edilen durum değildir. Cevap hala çok iyi, ancak bu durumda uygun değil.
mpiktas
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.