Nüfus yoğunluğu tahmini modeli


14

Her bir şekle (bir Sayım bloğu, yol, ilçe, eyalet, ne olursa olsun) çokgen / alan sabit bir değer atayarak nüfus yoğunluğunu eşlemek için (nüfus, alan, şekil) bir veritabanı kullanılabilir. Bununla birlikte, popülasyonlar genellikle çokgenlerinde eşit olarak dağılmaz. Dasimetrik haritalama , bu yoğunluk tahminlerini yardımcı verilerle hassaslaştırma işlemidir. Bu son derlemede belirtildiği gibi sosyal bilimlerde önemli bir sorundur .

Öyleyse, arazi örtüsünün (veya başka bir ayrık faktörün) yardımcı bir haritasına sahip olduğumuzu varsayalım. En basit durumda, nüfusun olmadığı yerleri tanımlamak ve buna bağlı olarak tüm popülasyonu kalan bölgelere atamak için su kemiği gibi bariz şekilde yaşanmaz alanları kullanabiliriz. Daha genel olarak, her Sayım birimi , , yüzey alanlarına sahip kısımlarına oyulmuştur . Böylece veri setimiz tuples listesine eklenir.k x j i i = 1 , 2 , , kjkxjii=1,2,,k

(yj,xj1,xj2,,xjk)

nerede nüfusu birimi (hatasız ölçülen varsayılır) ve - bu kesinlikle böyle değil rağmen - biz her varsayabiliriz da aynen ölçülür. Bu terimlerle amaç, her bir yi bir j x j i y jyjjxjiyj

yj=zj1+zj2++zjk

burada her ve , arazi örtüsü sınıf ikamet eden birimi içindeki nüfusu tahmin eder . Tahminlerin tarafsız olması gerekir. Bu bölüm , Sayım poligonu ve arazi örtüsü sınıfının kesişimine yoğunluğunu atayarak nüfus yoğunluk haritasını . zji0zjijizji/xjijthith

Bu sorun, standart regresyon ayarlarından belirgin şekilde farklıdır:

  1. Her bölümlemesi tam olmalıdır. yj
  2. Her bölümün bileşenleri negatif olmamalıdır.
  3. Verilerin hiçbirinde (varsayım yoluyla) bir hata yoktur: tüm popülasyon sayıları ve tüm alanlar doğrudur. yjxji

" Akıllı simetrik haritalama " yöntemi gibi bir çözüme birçok yaklaşım vardır , ancak hakkında okuduğum herkesin geçici öğeleri ve açık bir önyargı potansiyeli vardır. Yaratıcı, hesaplanabilir şekilde izlenebilir istatistiksel yöntemler öneren cevaplar arıyorum. Derhal başvuru c. - Ortalama 40 kişi sayım birimleri (büyük bir kesimin 0 kişi olmasına rağmen) ve yaklaşık bir düzine arazi örtüsü sınıfı. 10 6105106


Biçimlendirme sorunu düzeltildi. Bu bir hataydı.
Rob Hyndman

@Rob Teşekkür ederim ve buna bakan herkese teşekkürler: Yorumlarınızı silinmeden önce gördüm ve çabalarınız için minnettarım.
whuber

1
Ayrıca bu: P. A Zandbergen ve D. A Ignizio, “Küçük Alan Nüfus Tahminleri İçin Dasimetrik Haritalama Tekniklerinin Karşılaştırılması”, Haritacılık ve Coğrafi Bilgi Bilimi 37, no. 3 (2010): 199-214. ingentaconnect.com/content/acsm/cagis/2010/00000037/00000003/… Bu, karıştırma için çağrıda bulunuyor gibi görünüyor.
fgregg

1
Bu makale faydalı olabilir: Hwahwan Kim ve Xiaobai Yao, “Psikofilaktik enterpolasyon yeniden ziyaret edildi: simetrik haritalama yöntemiyle entegrasyon,” Uluslararası Uzaktan Algılama 31, no. 21 (2010): 5657. informaworld.com/10.1080/01431161.2010.496805
fgregg

1
Nihayetinde ekolojik bir çıkarım problemi olarak simetrik haritalama. K.Imai'nin
fgregg

Yanıtlar:


4

Mitchel Langford'un simetrik haritalama üzerindeki çalışmalarını kontrol etmek isteyebilirsiniz .

Galler'deki nüfus dağılımını temsil eden rasterler kurdu ve metodolojik yaklaşımlarından bazıları burada yararlı olabilir.

Güncelleme: Jeremy Mennis'in çalışmalarına da bakabilirsiniz (özellikle bu iki makale).


2
Teşekkür ederim. Bu çalışma, yakın zamanda simetrik haritalama üzerine bir araştırma ağına işaret ediyor.
whuber

2

İlginç soru. İşte buna istatistiksel açıdan yaklaşmakta geçici bir bıçak. Her alana bir nüfus sayısı atamanın bir yolunu bulduğumuzu varsayalım . Bu ilişkiyi aşağıdaki gibi belirtin:xji

zji=f(xji,β)

Açıkça, Ye dayadığımız her hangi işlevsel form en iyi şekilde gerçek ilişkiye bir yaklaşım ve dolayısıyla hatayı yukarıdaki denkleme dahil etme ihtiyacı olacaktır. Böylece, yukarıdakiler olur:f(.)

zji=f(xji,β)+ϵji

nerede,

ϵjiN(0,σ2)

Hata terimindeki dağılımsal hata varsayımı açıklama amaçlıdır. Gerekirse uygun şekilde değiştirebiliriz.

Ancak, kesin bir ayrışmasına ihtiyacımız var . Bu nedenle, hata terimlerine ve İşlevine aşağıdaki gibi bir kısıtlama getirmeliyiz :yjif(.)

iϵji=0

if(xji,β)=yj

İstiflenmiş vektörü göstermek tarafından ve istiflenmiş deterministik koşullar ile . Böylece, var:zjizjf(xji,β)fj

zjN(fj,σ2I)I(fje=yj)I((zjfj)e=0)

nerede,

e , uygun boyutta olanların bir vektörüdür.

İlk gösterge kısıtı, deterministik terimlerin toplamının , ikincisi de hata kalıntılarının 0'a eşit olması gerektiği fikrini yakalar.yj

Gözlenen tam olarak ayrıştırdığımız için model seçimi daha . Belki de model seçimine yaklaşmanın bir yolu, en düşük hata varyansını, yani en düşük tahminini veren modeli seçmektir .yjσ2

Düzenle 1

Yukarıdaki formülasyondan biraz daha fazla düşünmek gerekenden daha fazla kısıtlamaya sahip olduğundan basitleştirilebilir.

zji=f(xji,β)+ϵji

nerede,

ϵjiN(0,σ2)

İstiflenmiş vektörü göstermek tarafından ve istiflenmiş deterministik koşullar ile . Böylece, var: z j f ( x j i , β ) f jzjizjf(xji,β)fj

zjN(fj,σ2I)I(zje=yj)

nerede,

e , uygun boyutta olanların bir vektörüdür.

üzerindeki kısıtlama kesin bir ayrışma sağlar.zj


2
@Srikant Teşekkür ederim. Soruyu sorduğumda ve o zamandan beri bir GLM'yi ( doğrusal bağlantı ile Poisson dağılımı ) ve diğer bazı modelleri test ettiğimde benzer çizgiler üzerinde düşünüyordum . Ne yazık ki, artık sadece arazi örtüsü tipine dayanan herhangi bir modele benziyor ve oran iyi sonuç vermiyor: bu verilerin bir örneği, nüfus modellerinin daha geniş bir mekânsal bağlama bağlı olduğunu gösteriyor. O halde, en azından, uzamsal olarak gecikmeli eş değişkenleri doğrusal bir modele dahil etmemiz gerekir.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.