Netliği kaybetmeden önce grafik olarak kaç değişkeni temsil edebilirim?


14

Bakalım bu grafik ekonomi sorusunu doğru bir şekilde açıklayabilir miyim. Alanda yeniyim ve bunun saf bir merak olduğunu belirtmeye değer ve örneklerim - yakında anlayabileceğiniz gibi - tamamen uyduruldu.

Grafiğim iletişim kalitesini kaybetmeden önce grafik olarak kaç değişken temsil edebilirim? Diyelim ki izleyicim, örneğin Pazar gazetesi okuyucuları.

Diyelim ki bu setim var: Ağırlık (x) / Yaş (y) ve iki kişi: Jane, 10yo, 30kg; ve Joe, 20 yaşında, 60 kg. Grafiksel gösterim şöyle olabilir:

resim açıklamasını buraya girin resim açıklamasını buraya girin

Şimdi, çevrelerin boyutunu kullanarak başka bir değişken ekleyebileceğimi biliyorum, bu yüzden Jane ve Joe'nun haftada kaç hamburger yediği için bir temsil eklemek istersem (sırasıyla 10 ve 20), şöyle bir şey olabilir:

resim açıklamasını buraya girin resim açıklamasını buraya girin

Ve hatta dördüncü bir değişken eklemek için şekil veya renk + boyutu bile kullanabilirim, örneğin sığır eti burgerlerinden daha fazla çizburger yerse (burada sınırlama, sadece iki olası değere sahip bir boole'dir), ancak yine de:

resim açıklamasını buraya girin resim açıklamasını buraya girin

Ve bu dağınık olmaya başladığını düşünüyorum. Beşinci bir değişkeni temsil etmek için komboya şekiller eklemek grafiğin 'anlaşılma kolaylığı' riskini doğuracaktır. Grafiğe baktığımda, (özellikle) beynim sadece 2 veya 3 değişkeni işler, daha fazla değil. Örneğin kombo mu yoksa sadece hamburger mi yiyorlar ?:

resim açıklamasını buraya girin resim açıklamasını buraya girin

Belki bir 3. boyut düşündüm, ama bu sadece korkunç görünecekti. Bunu tam olarak yanlış bir şekilde düşünüyor olabilirim ve burada anlayamadığım oldukça açık bir şey eksik olabilirim (örneğin, 3 veya 4'den fazla değişkeni temsil etmeye çalışmak bir uygulama olarak yanlışsa), ancak geri sorularıma:

  • 4 (grafik benimki gibi çok basitse 5 olabilir ) iki eksen grafiğinde aynı anda temsil edilen maksimum değişkenler için makul bir sayı mıdır?

  • Netliği kaybetmeden daha fazla değişkene izin veren başka grafik türleri var mı?

  • Başarılı olan çok sayıda değişkeni temsil eden bir grafiğin iyi bir örneği var mı?

Yanıtlar:


14

Edit III: Çok değişkenli kantitatif veri görselleştirmesinin çok güzel bir örneğini buldum ve eklemek zorunda kaldım. "Edit III (Nobel ödüllü)" başlığı altında bulabilirsiniz.

Edit II: biraz yanlış anlaşılma oldu ve verilerin amaçlanan kullanımını nasıl yorumladığımı açıklığa kavuşturmak için düzenledim. İki görüntüyü değiştirdim ve "Bununla patates kızartması ister misiniz?"


Grafikler verileri ortaya çıkarır .

Edward Tufte:

Dağınıklık ve karışıklık, bilginin nitelikleri değil tasarım başarısızlıklarıdır. Dağınıklık, içerik azaltmayı değil tasarım çözümünü gerektirir. Çoğu zaman, ayrıntı ne kadar yoğun olursa, netlik ve anlayış da o kadar fazla olur, çünkü anlam ve akıl yürütme durmaksızın BAĞLAMDIR. Az bir deliktir.

Verileri neden görselleştiriyoruz?

  • Düşünme araçları
  • Yoğun görmenin sonucunu göstermek
  • Bir problemi anlamak, karar vermek
  • Karşılaştırmaları göster, nedensellik göster
  • İnanmak için nedenler sunun

Nasıl?

  • verileri göster
  • izleyiciyi metodoloji, grafik tasarım, grafik üretim teknolojisi veya başka bir şeyden ziyade madde hakkında düşünmeye teşvik edin
  • verilerin söylediklerini bozmamak
  • küçük bir alanda çok sayıda sayı sunabilir
  • büyük veri kümelerini tutarlı hale getirme
  • farklı veri parçalarını karşılaştırmaya teşvik edin
  • verileri geniş bir genel bakıştan ince yapıya kadar çeşitli ayrıntı düzeylerinde ortaya koyar.
  • oldukça açık bir amaca hizmet eder: açıklama, keşif, tablolama veya dekorasyon.
  • bir veri kümesinin istatistiksel ve sözel tanımlarıyla yakından bütünleştirilmelidir.

Birkaç tanım:

Veri:

genellikle "veritabanlarında sıralanan şeyler" olarak düşünülür. Bu elbette sayılar, görüntüler, ses, video vb. Olabilir. Veriler toplanabilir, genellikle niceldir. En sade haliyle sindirimi zordur; sadece basamak duvarları. Bilirsin; Matris . Genel olarak konuşursak, bazen sahip olmadığımız şeyler en bilgilendirici olsa bile, sahip olmadığımız tüm şeyler için sıfırlardan oluşan büyük veritabanlarımız yoktur . Bu yüzden biz neyi görselleştirmek gerekir, biz yok ne olduğunu görmek için do var.

Bilgi:

verilerden çıkarabileceğiniz şeydir . Verileri bir şekilde görüntüleyerek bilgiyi toplayabiliriz . Sık kullandığım örneklerden biri, size dünya ülkelerinin bir listesini verir ve size iki kişinin eksik olduğunu söylersem, onları bu listeye göre bulmanız pek olası değildir. Ancak, bunu bir haritadaki tüm ülkeleri renklendirerek gösterirsem, Orta Afrika Cumhuriyeti ve Yeni Kaledonya'yı atladığımı hemen görürsünüz. Bu "gürültüyü azaltmak" ve bir hikayeyi mümkün olan en etkili şekilde anlatmaktır.

İnfografikler ve veri görselleştirmeleri:

Örnek infographicslarınızı aramaktan çekinmeyin. Bunun genellikle veri görselleştirme, bilgi tasarımı veya bilgi mimarisiyle eşanlamlı olarak görüldüğünü biliyorum, ama katılmıyorum. İnfografikler - bana göre , verilerin nasıl okunacağına dair bir grup önyargılı ifade içerebilen bir dizi grafik, diyagram ve çizimdir . Daha az nesnel, içerik oluşturucunun "ilgisini" çekmeyen verileri atlamak daha eğilimlidir: birisinin önceden tanımladığı bir sonuca yönlendirilirsiniz. Eğlence değerine sahiptirler ve verilerden biraz odaklanan illüstrasyonları ezici bir şekilde kullanırlar. Bu iyi ama sanırım biraz farklılaşmalıyız.

Örnekler

Büyük veri:

Büyük verilerin karmaşık verilerle aynı olmadığını unutmayın. Bu LinkedIn haritası gibi birçok veri aynı olabilir: Temel veriler aynıdır, ancak filtreler vardır (etiketleyerek). İki değişken vardır: coğrafya ve insanları meslekler / ilgi alanları / ilişkiler olarak tanımlayan bir tür etiket. Deli veri miktarı; ama sadece iki değişken.

resim açıklamasını buraya girin

Çok değişkenli:

Verilerin çok değişkenli görselleştirilmesine bir örnek. Bu, Charles Minard'ın Napolyon'un 1812 Rus kampanya ordusundaki erkek sayısını, hareketlerini ve dönüş yolunda karşılaştıkları sıcaklığı gösteren 1869 grafiği. Burada büyük versiyon. resim açıklamasını buraya girin

Kodu kırmak biraz zaman alır, ancak bunu yaptığınızda muhteşemdir. Ele alınan değişkenler:

  • ordu büyüklüğü (canlı / ölü)
  • Coğrafi konum
  • yön (doğu - batı)
  • sıcaklık
  • zaman (tarihler)
  • nedensellik (savaşlarda ve soğukta öldü)

Bu, basit, iki renkli bir haritada inanılmaz miktarda bilgi. Coğrafi kısım diğer değişkenlere yer vermek için stilize edilmiştir, ancak bunu elde etmekte sorun yaşamıyoruz.

İşte daha zor olanı. Temel evrimsel görselleştirmelere, klodogramlara, filogeniklere ve biyocoğrafya ilkelerine aşina iseniz bunu okumak çok daha kolay olacaktır. Bunu bilen insanlar için yapıldığını unutmayın, bu yüzden uzman, bilimsel bir grafiktir. İşte gösterdiği şey: Zehir kurbağalarının Güney Amerika'dan soylarının filogeografik görüntüsü. Soldaki haritalar zamanla değiştikçe ana biyocoğrafik bölgeleri gösterirken, sağdaki görüntü kurbağa soylarını biyocoğrafik kökenleri bağlamında gösterir. (Santos JC, Coloma LA, Summers K, Caldwell JP, Ree R ve diğerleri tarafından [CC-BY-SA-2.5 (www.creativecommons.org/licenses/by-sa/2.5)], Wikimedia Commons aracılığıyla). "Kodu kırmak" çılgınca, şaşırtıcı derecede bilgilendirici.

resim açıklamasını buraya girin

Küçük katlar, mini grafikler:

Bunu yeterince vurgulayamıyorum: bilgileri tekrarlamanın veya ayrı ayrı görselleştirmelere bölmenin değerini asla küçümsemeyin. Bir grafiği başka bir grafikle karşılaştırmak oldukça kolay olduğu sürece, bu gayet iyi. Biz kalıp bulma makineleriyiz. Bu genellikle küçük katlar olarak adlandırılır. Bu görüntüleri oldukça hızlı bir şekilde analiz etmek için çok az sorunumuz var ve her şeyi büyük bir grafiğe sıkıştırmak, on küçük olanın daha iyi çalışacağı zaman genellikle anlamsızdır:

resim açıklamasını buraya girin

Bir diğeri:

resim açıklamasını buraya girin

Ve farklı ama tekrar eden grafikler kullanan biri:

resim açıklamasını buraya girin

Mini grafikler Edward Tufte tarafından üretilen ve tamamen işleyen, tamamen özelleştirilebilir bir javascript kütüphanesi olarak geliştirilen bir terimdir . Temel olarak, metne eklenebilir, "harici" bir nesne olarak değil, metnin bir parçası olarak eklenebilen küçük grafiklerdir. Varsayılan görünüm şöyle: resim açıklamasını buraya girin

Edit III (Nobel ödüllü)

Bulduğum bu veri görselleştirmesini eklemek zorunda kaldım, çok iyi: Nobel ödüllüleri gösteriyor. Hangi üniversite, hangi fakülte, konu, yıl, yaş, memleket, paylaşılıp paylaşılmadığı, derece düzeyi. Gerçekten güzel kanıtlar. Bunların tümü ölçülebilir verilerdir. Daha fazla burada.

resim açıklamasını buraya girin

resim açıklamasını buraya girin

Verileriniz

@Javi ile ilgili tüm sorular son derece önemlidir.

Yapmaya çalıştığınız şey, düşünmek için görsel bir araç yaratmak. Bunu yapmak için, en iyi kalite sinyal / gürültü oranını çıkarmalısınız. Mücadele ettiğiniz şey, farklı değişkenlere sahip verilerin bilgiyle nasıl ilişkilendirileceği . İşte bir soru: Neyin doğru olması ve neyin tam olarak doğru olması gerekir? Amaç nedir?

Çok fazla önyargısız verileri görüntülemek istediğinizi varsayacağım: Eğer herhangi bir korelasyon varsa, okuyucunun korelasyonları kendileri bulmasını istiyorsunuz. Amacınız insanlara hamburgerlerin kendileri için kötü olduğunu ya da kadınların erkeklerden daha az hamburger yediğini söylemek değil, verilerin "içerdiği" ise "görmelerine" izin vermektir (bu üç kişinin bir aile olup olmadığını hayal edin. Bütün burger yiyen grafiğe biraz bakalım).

Veri kümeniz çok küçük, hepsini bir tabloya koyabilirsiniz ve iyi olur. Ama elbette bu genel fikirle ilgilidir:

Biraz detay: zaman (yaş) soldan sağa yatay olarak gördüğümüz bir şey olma eğilimindedir (zaman çizgileri). Yukarı-aşağı olan bir şeyi ağırlıklandırın, bu nedenle x-y'nizi değiştirmek iyi bir fikir olacaktır.

1. Eşsiz, sabit varlıklar nelerdir?

  • İsimler

2. (eh ..) değişken değişkenleri nelerdir?

  • Ağırlık (kg)
  • Yaş (yıl)
  • Hamburger sayısı (tamsayı)
  • Burger tipi (tamsayı)

Not: verileriniz tamamen birimlerden oluşur. Sayılabilir, her biri ayrı bir zihinsel ölçekte ölçülebilir. Kilo, yaş, ağırlık ve sayılar. Ve veritabanı-konuşmada, isimleri anahtardır. Uzay-zamanlı görselleştirmeler yapmaya başladığınızda, bu gerçek bir baş ağrısı haline gelir. Doğum yeri, mevcut ev vb. Eklemelisiniz.

Burada korelasyonu olan sadece ikisi hamburger sayısıdır ve bir combo olup olmadığıdır. Diğer tüm değişkenler bağımsızdır ve sadece bir tanesi sabittir (isim). Bir noktada, büyük veri kümeleriyle, isimler bile ilgisiz hale gelir ve yerini demografik, yaş, cinsiyet veya benzeri alır.

Bu küçük veri kümesiyle hepsini tek bir grafikte alabilirsiniz, örneğin şöyle: resim açıklamasını buraya girin

Veya eksen ve ad-kabarcık içeriğini değiştirebilirsiniz:

Kişisel not: Bu ikisinden daha iyi olduğunu düşünüyorum, çünkü x ve y bir insanın "fiziksel" özelliklerini içerir. Buradaki baloncuklardaki değişken burger sayısıdır.

resim açıklamasını buraya girin

Grafiğe ek olarak pasta grafikler de ekleyebilir veya hatta yalnızca pasta grafikleriniz olabilir. Şahsen ben küçük katları hakkında belirtildiği gibi, her ikisi de olurdu: resim açıklamasını buraya girin

Şununla birlikle cips ister misin?

Benim varsayım da burger-yemek oranı bilmek istedim oldu. Her öğünde hamburger bulunur. Tüm yemekler tarak değildir.

  1. sadece bir kişinin bazen tarak yiyip yemediğini bilmek ister miyiz?
  2. ya da kaç tane hamburger yemeğinin de birer kombinasyon olduğunu bilmek istiyor muyuz?

1. olursa, name / key / id öğesine uygulanan bir boolean bunu yapar.

Jane bazen karmakarışık yer mi? Doğru yanlış.

2. ise, her öğüne bir boole uygulayabiliriz :

1 adet çizburger, combomeal = true

1 adet çizburger, combomeal = true

1 çizburger, combomeal = yanlış

1 çizburger, combomeal = yanlış

1 çizburger, combomeal = yanlış

1 çizburger, combomeal = yanlış

1 çizburger, combomeal = yanlış

1 beefburger, karmakarışık = doğru

1 beefburger, karmakarışık = doğru

1 beefburger, karmakarışık = yanlış

Bu çok sıkıcı, bu yüzden aşağıdakilere ayırabiliriz:

Jane 10 hamburger yer. Bunlardan üçü kombinasyonlardır (“bununla patates kızartması ister misiniz?”).

Kombilerden biri bir beefburger menüsü.

İki kombi çizburger menüsüdür.

Gerisi tek burger. 5 peynir, iki sığır eti.

Bu grafik, bunu görselleştirmek için bir girişimdi. Bu sürümde daha net hale getirmek için pasta dilimleri tuttuk. Bununla ilgili olan şey, büyük veri kümeleri ve% uygulamasına başlamanın bir sıçrama olmamasıdır: resim açıklamasını buraya girin

Ama bence en iyi yol yeniden düşünmek.

Ona bakmanın bir başka yolu, gerçekten çok basit yapmaktır. Burada hangi yaş gruplarını, hangi ağırlık gruplarını ve "sahip olmadığınız" tüm verileri bize anlatabildiğini görmek daha kolay . Sahip olduğunuz veriler alanla ilgili değildir, yalnızca birimlerdir (kg, yıl, sayılar + anahtar / kimlik / ad):

(Düzenleme: Yüzümdeki yumurta: Bu görüntüleri daha doğru olanlarla değiştirdim, "tüm yemekler burger, tüm yemekler birleşik değil")

resim açıklamasını buraya girin Daha fazla kişiyle genişletmek oldukça kolay olurdu:

resim açıklamasını buraya girin Ya da daha iyisi, 10, 20 ve 30 yaş gruplarını karşılaştırırsanız, istatistik görselleştirmeyi okumak oldukça kolay olabilir:

resim açıklamasını buraya girin

Ve mümkün olduğunca açık olmak gerekirse; İşte bu düşünce biçiminin bir örneği. Bu grafik Titanik'te hayatta kalanları, mürettebat, sınıf, erkek, kadın oranını göstermektedir. resim açıklamasını buraya girin

Bir sürü başka çözüm olacak, bunlar sadece birkaç düşünce.

Devam edebilirdim, ama şimdi kendimi ve muhtemelen herkesi bitirdim.

Oynamak için araçlar:

Gephi

Gapminder Hans Rosling'in bu olağanüstü TED sunumuna bakın - o adamı sevin

Google grafikleri

somvis

Raphael

MIT Sergisi (daha önce Similie olarak adlandırılıyordu)

d3

Highcharts

Daha fazla okuma:

PJ Onori; Sert savunmasında

Edward Tufte: Güzel kanıt

Edward Tufte: Bilgi tasavvur etmek

Edward Tufte: Nicel bilgilerin görsel gösterimi

Görsel Açıklamalar: İmgeler ve Miktarlar, Kanıt ve Anlatı

Bay, Alan., 2007 Teorik ve bağlamsal bir bakış açısı gösterimi Lozan, İsviçre; New York, NY: AVA Academia

Isles, C. & Roberts, R., 1997. Görünür ışık, fotoğraf ve sanatta, bilimde ve günlük sınıflandırmada Oxford Modern Sanat Müzesi.

Card, SK, Mackinlay, J. & Shneiderman, B. eds., 1999. Bilgi Görselleştirmede Okumalar: Düşünmek İçin Vizyon Kullanımı 1. baskı, Morgan Kaufmann.

Grafton, A. ve Rosenberg, D., 2010. Zaman Çizelgeleri: Zaman Çizelgesi Tarihi, Princeton Architectural Press.

Lima, M., 2011. Görsel Karmaşıklık: Bilgilerin Haritalama Desenleri, Princeton Architectural Press.

Bounford, T., 2000. Sayısal Diyagramlar: İstatistiki Bilgilerin Etkili Olarak Tasarlanması ve Sunulması 0 ed., Watson-Guptill.

Steele, J. & Iliinsky, N. eds., 2010. Güzel Görselleştirme: Uzmanların Gözüyle Verilere Bakmak 1. baskı, O'Reilly Media.

Gleick, J., 2011. Bilgi: Bir Tarih, Bir Teori, Bir Sel, Pantheon


Hepsini okudum, ama emilmesi haftalar alacak. Kitap yazmalısın!
Joshua Frank

Nobel ödül resmi için, bunu nasıl başardıklarını biliyor musunuz? Akan şeritler sadece güzel.
Joshua Frank

Hayır, o bunu nasıl yaptığını tam olarak bilmiyorum ama ona soran basitçe denemek böylece Giorgia Lupi, diğer bazı sorulara cevap çok yaklaşan olmuştur giorgialupi.net
benteh

Hey, iyi fikir. Ona bir e-posta gönderdim.
Joshua Frank

2
Bu cevap için bir novell ödülü hak ediyorsun n_n
Rafael

5

Bence, kitlenize veri sunmanın anahtarını aramanızı daraltabilecek birkaç soru daha var. Onları özgeçmişinizi istediğiniz belirli bir işe kısıtlamak gibi düşünüyorum.

  1. Neden bir infografik oluşturuyorsun.
  2. Kitlenizin verileriniz hakkında bilmesini istediğiniz net hedef veya sonuç nedir?
  3. Kitleniz hakkında ne biliyorsunuz ve verilerle nasıl bir ilişkisi var? (Demografik yaş, cinsiyet, coğrafi konum, ağırlık vb.)
  4. Göstereceğiniz en ve en önemli veri parçası ve bunlar arasındaki fark nedir?
  5. İlk etapta "net" hedefinize ulaşmak için verilerinizi hangi ortam / bağlamda göstereceksiniz? Örneğin, verilerin dijital veya fiziksel bir temsili mi olacak (hedef kitleniz çocuksa bir kavanoza jöle fasulye düşünün). Bir ofis toplantısı veya ticari bir girişim için mi olacak?
  6. Veri oluşturma hedefinizin bütünlüğünü korurken veriler farklı infograflara bölünebilir mi?

Verileriniz ve hedefiniz, göstermemeniz ve göstermemeniz gereken terimleri belirlemelidir. Örneğin, tüm hedefiniz insanların genel olarak sipariş ettiklerinin karşılaştırmasını göstermek iken, Salı günü öğleden sonra 13:00 ile 15:00 arasında McDonald's'ta ne sipariş ettiklerinin grafiğini göstermek ne kadar önemli olurdu. Ham verilere sahip olmamıza rağmen, zaman değişkenine gerek yoktur. Hedefimiz bu değildi.

Sorularınızı özel olarak cevaplamak için. Kayıp şahsen (sübjektif) Eğer okuyucu (me) / sıkılmış kaybetti ve sıkılıyor bunlar gibi temel bir grafikte three'ish / 4 değişkenleri (boyut, şekil, renk, konum) kullanarak geçmiş olsun düşünmek / muhtemeldir değil grafiğin oluşturulmasının nedeni. Ancak, tamamen eğlenceli olabilirler ve seyirciyle gerçekten etkileşime girebilirler. Örneğin, böyle bir şey bu şekilde karşı bu . İkinci örneğin önemini de azaltmıyorum, çünkü ofiste genel veriler gösteren bir toplantıda olsaydım gerçekten etkili bir infograf olurdu. Bu, verileri gösterme ortamı ve bağlamıyla ilgili soruya geri döner.

Verilerde değişkenleri göstermenin yollarını arıyorsanız, infographics araştırmayı öneririm. İşte etkili Infographics oluşturma konusunda Smashing Magazine'den iyi bir başlangıç ​​parçası. Bunlardan bazılarının öznel olabileceğini ve öznel olduğunu unutmayın.


2

Bu mükemmel bir soru. Gerçekten.

Olması gereken parlak düşünce hattı.

Bununla ilgili bazı tartışmalar olmalı. Ama bunu biraz farklı ifade ediyorum:

**

Modern açıklayıcı teknolojiler ve tasarımla kaç özelliği referans alabiliriz?

**

Cevap, prodüksiyonun üç yönüdür: sergileme, tasarım ve sunum şekli ... hepsi seyircilerin dikkatini çeken sıçramalarla harmanlanmıştır.

Ekran fiziksel bir şeydir. Boyut, çözünürlük ve renk alanı sınırlamaları ile.

Tasarım sınırsız, ancak bu sorunun gerçek ilginç yönü. Mümkün olduğu kadar iyi göstermek için modern açıklayıcı teknolojilerden ve tasarım ve yaratıcılık anlayışımızdan nasıl faydalanabiliriz.

Sunum modları statik, dinamik veya etkileşimlidir. Her biri kendi güçlü ve zayıf yönlerine sahiptir ve ekranın ortamı, türü ve boyutu ile birleştirilir.

Ve Javi'nin haklı olarak belirttiği gibi, ama belki de yeterince yaklaşmıyor ... BU TÜM KONU! Ya da değil.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.