Basılı bir haritada demografik verileri etkin bir şekilde görüntüleme


29

Yazdırılabilir / etkileşimli olmayan bir haritada aşağıdaki bölge başına (toplam 30 bölge) verinin grafiğini çizmek istiyorum:

  • Ortalama yaş
  • Hane halkı ortalama geliri
  • Hane sayısı
  • Nüfus yoğunluğu
  • İnsanların sayısı
  • Çalışan sayısı

Yukarıdaki 6 katmanı tek bir haritada nasıl etkili bir şekilde sergilersiniz?


1
Alanlar sayfa boyutuna göre ne kadar büyük? Her bölgeye küçük bir arsa sığdırabilir misin? (örneğin bir radar grafiği)
djq

@celenius -Bu şehir merkezindeki bölgelerin banliyö / kırsal bölgelere göre önemli ölçüde daha küçük olan yerleşim bölgelerinden çok daha küçük olduğu tipik bir nüfus sayımı anketi türü
dassouki

1
Statik bir haritada bu 6 katman zorlu bir tasarım işidir. Etkileşimli bir haritanın kullanılmasını önleyen sorun nedir?
Trevesy

@Trevesy - çoğu zaman, gereksinim görsel analizi teşvik etmek için 6 değişkeni vurgulayan yazdırılabilir bir harita tasarlamaktır
dassouki

1
Görselleştirme etiketini ekleme özgürlüğünü kullandım, uygun olmadığını düşünüyorsanız, kaldırmaktan çekinmeyin.
Andy,

Yanıtlar:


20

Tüm bu verileri tek bir haritaya dahil edemeyeceğinizi ve bir anlam ifade edebileceğinizi söyleyeceğim. Her biri farklı bir değişken kullanarak aynı alanın çok daha küçük haritalarına sahip Tufte'nin küçük katları prensibinin çizgileri boyunca düşünmenizi öneririm. Örnek: http://www.juiceanalytics.com/writing/better-know-visualization-small-multiples/

O zaman bile, bir sürü farklı ünite kullanma probleminiz var, bu yüzden bir sürü anahtara ihtiyacınız var. Verileri görüntülemenin bir başka yolu (ancak haritada değil), tüm değerleri renkli olan bir tablo kullanmaktır (yani, ortalamanın altında, ortalamanın üstünde farklı renkler)

Daha fazla harita fikri için nüfus sayımı atlasına da bakmanızı tavsiye ederim: http://www.census.gov/population/www/cen2000/censusatlas/

Tam olarak hangi iletiyle iletişim kurmaya çalıştığınıza (yalnızca sahip olduğunuz verilere değil) daha fazla yansıtmaya yardımcı olabilir.


5
+1 Bu, altı değişkeni bir kerede sembolize etmeye çalışarak bir karmaşa yapmaktan çok daha iyidir. Ayrıca, neden bir veri tablosu yazdırmıyorsunuz? Altı sütun + id, 30 satır: yeterince küçük ve birinin ihtiyaç duyacağı her şeyi veriyor.
whuber

13

Tek bir haritada verimli bir şekilde çok fazla veri gösterilmesi mümkün değildir. İki olasılık:

  • 6 harita üretin

  • Bölgelerinizi sınıflandırmak için verilerinizi analiz edin ve sınıflandırmanın sonucunu görüntüleyin. Bir temel bileşen analizi Değişkeniniz içinde çok önemli ilişkiler belirlemek için yardımcı olabilir. Bu yöntem bu sentetik haritayı üretmek için kullanılmıştır:

alt metin

bunlardan:

alt metin alt metin


6 haritaya sahip olmanın sorunu herhangi bir eğilimi görsel olarak tespit etmenin zor olmasıdır. Bazen, çok değişkenli bir haritaya bakmak ve işlerin nasıl sıraya
girdiğini

2
@dassouki, işlerin nasıl sıraya girdiğini görmek için mutlaka haritalandırmanız gerekmez. İki değişkenli dağılım grafikleri bu kriterleri karşılayacak ve yorumlaması çok daha kolay olacaktır.
Andy

3
Avantajı 6 haritalar sahip görsel eğilimlerini tespit etmek kolay olması! Altı (veya daha fazla) değişkeni tek bir haritaya sıkıştırmaya çalıştığınızda, kalıp bulmak zor olabilir. Gibi haritalama belirli türlerdeki: gerçi (bu harita özellikleri binlerce dahil olursa Ben, bu sözler değiştirecek glif görselleştirme , zengin değişkenli veri setleri modelleri bulma derece etkili olabilir: lmi.bwh.harvard.edu/papers/papers/ KindlmannTVCG2006.html )
whuber

@julien, Harika şeyler, daha önce karşılaştığım bu makalede ilginizi çekebilir, e-publications.org/ims/submission/index.php/AOAS/user/… , benzer çok değişkenli PCA analizi ile ilgili haritaları var. Verileri yanı sıra arazileri yapmak için R kodu.
Andy W,

Gerçekten ilginç, bunu okumak zorunda kalacağım.
neuhausr

9

Küçük katların muhtemelen bu soruna yaklaşmanın iyi bir yolu olduğuna katılıyorum. Haritayı tamamlamak için iki değişkenli korelasyonları tanımlayan değişkenlerinizin bir dağılım grafiği matrisini de öneririm. Verilerinizin coğrafi yönünü kaybederken, bir dağılım grafiğindeki değişkenler arasındaki ilişkileri görselleştirmek iki haritayı (yan yana bile) karşılaştırmaktan çok daha kolaydır.

Hala bir çeşit uzamsal eğilimin yakalanmasını istiyorsanız, dağılımlar ve / veya orijinal değişkenler arasında uzamsal istatistikler (örneğin yerel Moran I gibi) ekleyebilirsiniz.

Düzenleme: Geçenlerde, Andre-Michel Guerry tarafından yayınlanan ve aslen 1883'te yayınlanan, uzayda çok değişkenli ilişkileri görselleştirme amacına sahip olan Ahlaki istatistikleri gözden geçiren bazı çalışmalarla karşılaştım. Bu yazarların uygulamaları bu konuda önerilenlere çok benzer, küçük katlar, temel bileşenler analizi, dağılım grafiği matrisleri ve çokgen diyagramları içindedir. Ekte, A.-M.'den bazı resimler var. Guerry'nin Fransa Ahlaki İstatistikleri: Çok Değişkenli Mekansal Analizin Zorlukları : Michael Friendly Statistics Science, Cilt. 22, No. 3. (Ağustos 2007), s. 368-399 ( PDF ücretsizdir). Ayrıca başka bir makale de ( Dray ve Jombart, 2010 ) aynı verileri analiz ediyor ve söz konusu parselleri yapmak için R'de bazı kaynak kodları var.

Bir resim bir dağılım grafiği matrisi, diğeri ise yıldız diyagramı olarak adlandırılan şudur (bu, Pablo'nun önerdiği gibi çubuk grafikleri göstermenin farklı bir yoludur). alt metin alt metin


8

İşte olan küçük katları harika bir örnektir Andrew Gelman (ve şirket blog'unda) yayınlanan İstatistiksel Modelleme, Nedensel Çıkarım ve Sosyal Bilimler . Harita, okul kuponlarına devlet tarafından, gelir koşullarına ve çeşitli ırk ve din kategorilerine bağlı olarak seçmen desteği sağlıyor. Beyaz-olmayan-olmayan-onlar gerçekten okul kuponları sevmiyorum! (2004 anket verilerinde görünmesine rağmen asıl bloga giderseniz, bu gruptaki okul kuponları için daha fazla destek sağlarlar). görüntü tanımını buraya girin


Grafik harika, ancak renk skalası korkunç. % 50'si gri yapılarak neden bu kadar öncelikli? Elbette, sadece ısı haritası renkleri mi kullanmalı? Ayrıca, neden sadece beyaz insanlar dine ayrılıyor? elbette ırk ve sonra dine bölünmek daha mantıklı olur mu?
naught101

@ naught101, biraz olumsuzluğunuzla kafam karıştı. Kesinlikle gri, spektrumun her iki ucundaki daha parlak veya daha koyu renklerle karşılaştırıldığında vurgulanmaktadır . Keyfi olarak% 45 oranında sapma konusunda aşikar olmakla birlikte, IMO bu gibi küçük çoklu haritalar yaparken, karşıt değerleri çok iyi buluyor. Din / ırk bölünmeleri hakkındaki yorum, IMO için de bir anlam ifade etmiyor. Bunlar açıkça , ister istemez bir kuponu destekleyip desteklemediğiyle ilgili olan kategorilerdir ve sizin önerdiğiniz alt gruplardan bazıları mevcut görünmüyor. devam ...
Andy W

IE Ankette, böyle bir grup hakkında önemli herhangi bir şey söyleyebilecek yeterince "Kara Katolik" olduğundan şüpheliyim (ya da "Hispanik Evanjelik Olmayan Protestanlar"). Gelman'ın gönderisini okumanızı tavsiye ederim ve umarım bunun için motivasyonu ortadan kaldıracaktır. alt gruplar
Andy W

belki de ekranımdaki gri renkte bir çubuk oluşuyor. Ben onu ayırt etmek için beyaz ve belki de gri bir arka plan ile daha iyi olacağını düşünüyorum. Ayrıca Gelman'ın blogundaki iki görüntünün farklı ölçeklere sahip olduğuna dikkat çekmeye değer… Siyah nüfusun çok daha yüksek olduğu izlenimindeydim, ancak nüfus sayımı verilerine baktım ve düzeltilmiş olarak durdum. Yine de garip bir şey, nüfus sayımının İspanyol asıllı orijini yarış için dik olarak tanımlamasıdır (ayrı bir soru). Galiba
Gelman'in

@ naught101, bu nüfus sayımıyla ilgili bir bilgi değil, başka bir anketten (nüfus sayımı hakkında kamuoyu görüşüne sahip değil)
Andy W

5

Burada sunulan çözümler arasında seçim yapmak için iki önemli bilgi sağlayabilirsiniz:

  • Haritanın amacı nedir? (Keşfet, Açıl?)
  • Haritanın hedef halkı nedir? (Siz, diğer analistler, şehir plancısı, halk?)

Burada belirtilen çözümler, amaca ve halka göre farklı verimliliklere sahip olabilir.

J. Bertin tarafından açıklanan matris köşegenleştirme tekniğine değinerek Julien'in (bir PCA aracılığıyla sentetik bir harita) cevabını genelleştirmek istiyorum. Biri, eksiksiz bir veri sunumu yerine, tüm bilgilerin sentezinden sonra aranması yararlıdır.

Kısacası, her değişkeni bir histogramla temsil etmekten ibarettir, bir histogramı bir yığın sıralayarak, bir tipoloji elde etmek için değerler (harita bölgeleri) köşegen şeklinde hizalanacak şekilde sıralanır:

alt metin

(Kaynak: http://books.google.com/books?id=2tlQAAAAMAAJ&dq=bertin%20graphique%20information&hl=fr&source=gbs_similarbooks )


4

Çok fazla bilgi var ve bunların hepsini tematik bir şekilde birleştiren tek bir haritanın görsel kirlilik nedeniyle işe yaramaz bir sunumla sonuçlanacağı bir gerçektir. Öte yandan 30 bölge vardır, bu nedenle her bölge için birçok harita da kirlilikle sonuçlanacaktır.

Benim çözümüm: Hangisinin en önemli bilgi olduğunu seçin, hadi 'hane halkı geliri' diyelim, sonra haritayı bazı gelir kategorilerinde belirtin. Ve son olarak, her bir gelir noktası için, diğer 5 özellik ile bir bar sohbeti planlayın.

Bu harita ile, örneğin: “Yüksek gelirli alanlar her zaman çok sayıda çalışanı ve 21 yaşından fazla bir ortalama yaşı gösterir” gibi bazı karşılaştırmalar yapabilir.

Örneğe bakınız...

alt metin


4

Belki bu fikirlerden bazıları yardımcı olabilir?

Altı boyutun olduğunu varsayarak:

1: Choropleth : Hanehalkı geliri örneği 0

2, 3 ve 4: Semboller : İnsan sayısını nokta olarak temsil eder, bu da arka planı görmenizi sağlar: örnek 1, örnek 2 işçiler / işçiler olmayanlar için gri tonlama ve yaş göstermek için farklı bir renk şeması kullanma

5: 3D : Arazi örneği olarak popülasyon yoğunluğunu kullanma 3

6: (6. yolu düşünemiyorum!)

“Hane halkı sayısı”, “Nüfus yoğunluğu” ve “İnsan sayısı” nı göstermek gereksiz midir?

Bu karmaşıklığa sahip bir haritanın sizden bir başkası için net olması durumunda şüpheci olurdum. Eğer onu sunacak olsaydım, önce her bir öğeyi ayrı ayrı gösterirdim, sonra izleyicinin adımları anlayabilmesi için onu eklerdim.


Alternatif bir yol (eğer her bölge için bir radar grafiği için yeriniz yoksa, bu bilgiyi temsil eden bir 'glif' oluşturmak olabilir , şekil 10.28 . Bunların anlaşılması zor ve tasarımı kolay değil. açıkça, ancak bağlantılı örnek bu durumda kullanılabilir.


Sahip olduğum bir diğer düşünce, çokgenleri her çokgen için aynı yüksekliğe çıkarmak ve ardından bu parametreleri temsil etmek için yüksekliğin bir bölümünü kullanmak olacaktır. Her alan için bir çubuk grafik oluşturmaya benzer, ancak her bölümün benzer aralıklarla en üste katlandığı yer. Bunun bir kısmının gizlenmiş olacağı anlamına gelen 3D'den bakılması gerekir.


Ben seviyorum ve tüm önerilerini kastediyorum. 1-> 4'ü uygulamayı düşünüyorum. Ancak, 3d şeyler için: 3d haritalar yaptığınız zaman, genellikle merkezi bir konumda bulunan şehir merkezindeki bölgelerin çoğunu
yükselttiğini,

@dassouki - Genelde böyle olduğuna katılıyorum. Belki de bunun için çok geniş bir aralığa sahip olmayan bir değişkeni kullanabilirsiniz (ortalama yaş?) Veya varsa, logaritmik olarak dönüştürebilirsiniz.
djq

3
@celenius Olası fazlalık hakkında ilginç bir soru: nüfus yoğunluğu bölgeye göre kişi sayısıdır ; insan sayısı mutlak bir sayıdır ; ve hane sayısı, insanların nasıl birlikte yaşadıkları hakkında bilgi verir. Her ne kadar açıkça bu üç değişken birbiriyle ilişkili olsa da (ve gerilemelerde eşdüze yakınlık sorunları yaratabiliyorsa), gerçekte üç farklı bilgi parçasıdır. Btw, bu "choropleth". (Neyse ki Google bu yazım
hatasını

1
@ whuber - Bence muhtemelen flaş kullanılarak yapıldı (ne yazık ki!).
djq 19

2
3D'nin önerisi konusunda çok şüpheliyim. AFAIK kimse 3D'nin çok kullanışlı olmadığını göstermedi. San Fran suçu bağlantısı işe yarıyor, ancak yalnızca çok basit olduğu için - daha karmaşık bir paternin deşifre edilmesi zor olacak. 3B'nin bu durumda hiçbir şekilde gideceğini düşünmüyorum.
Trevesy

2

Bu zor bir görevdir. Cevabım çok değişkenli bir harita ile gitmektir. Bu haritayı kontrol et . Tüm değişkenleri bir haritada gösterirseniz harita meşgul görünecektir. Çok değişkenli bir haritaya gitmeyi seçerseniz uygun renk düzenini seçtiğinizden emin olun.


Google Dokümanlar çalıştığım yerde engellendi :(
dassouki


ya da işe yaramadı ve sonunda bir dosya uzantısı yoksa, onu
kazıyamıyorum

Hala gitmek yok ....
dassouki

Bu benim tarafımdan blok. :( Size haritayı e-posta ile göndermeyi umursamıyorum.
Raj

0

Bir basitleştirme derecesi, popülasyon yoğunluğu gibi bir maddeyi bir kartogram vasıtasıyla ifade etmek, yani her birimin alanını popülasyonla orantılı olacak şekilde bozmak olacaktır:

2008 ABD Başkanlık Seçimi
(kaynak: amherst.edu )

En büyük dezavantajı, izleyicinin bölgelerin bozulmasını "normal" şekillerinden tanıyabilmesi gerektiğidir.

Daha fazla bilgi burada: http://gis.amherstma.gov/data/SpringNearc2009/Session4Cartograms.pdf


1
Bunun potansiyeli olduğunu düşünüyorum, ancak bu belirli duruma kargonun ne kadar iyi uygulanabileceği belirsizdir (aynı alan üzerinde aynı anda birden fazla özellik görüntüleniyor). Teorik olarak birçok küçük çoklu çizgi grafiği yapabilirsiniz, ancak yorumlanması zor olabilir (haritalar arasındaki tutarlılığı kaybedersiniz ki bu, küçük katlar için bir tür esastır). Belki de kartogram, çok sayıda özellik göstermek için daha ilginç şekillerde renkle birleştirilebilir.
Andy W,

1
Küçük çoklu çizgi grafiklere
Andy W
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.