Bir alanın veya bir karenin uzunluğunun görüntülenmekte olan verilerle orantılı olması gerekir mi?


16

Veri görselleştirmesi yapıyorum. Her referans noktası bir kare ile temsil edilir. Temel verileri sezgisel olarak okunaklı hale getirmek için, her bir karenin kenarının uzunluğu veya her karenin alanı temsil ettiği veri ile orantılı mı olmalıdır?


1
Henüz değil. Geniş mi? Cevabın kesin olduğunu umuyordum (bunun "alan" olduğunu varsayıyorum) ama buradaki halk bunu desteklemek için daha fazla grafik tasarım ve algısal psikoloji bilgisine sahip olacaktı.
dumbledad

1
IIRC, bir kez okuduğum bir Alman kitabında, en.wikipedia.org/wiki/Walter_Krämer tarafından yazılan "So lügt man mit Statistik" kitabında ele alındı - İngilizce karşılığı olup olmadığından emin değilim. TL; DR - okuyucularınızın görselleştirmelerden ne okumasını istediğinize bağlıdır.
Michael Schumacher

Cevap kesinlikle kesin değil. Her şey ayrıntılara bağlıdır - yani ne veri sunuyorsunuz, nasıl sunuyorsunuz ve adı geçen verilerle ne iletişim kurmak istiyorsunuz.
DA01

Spesifikasyonların veya okuyucuların görselleştirmeden okumasını istediğimiz örnekleri, bir kare kenarının uzunluğunu, kare alanı yerine veri ile orantılı yapmamıza yönlendirecek örnekler verebilir misiniz?
dumbledad

5
+1 Neden her ilginç soru en az bir yakın oy kullanıyor?!? <grump>
user56reinstatemonica8

Yanıtlar:


10

Yaratan sizden emin değilseniz, okuyucu hangisi olduğunu nasıl bilecek?

Kısa cevap: değer 1: 1 ile sayfadaki renk miktarına bağlanmalıdır . Yani örneğinizde, alan olmalıdır. Ama bundan da fazlası var: Bir okuyucunun yanlış okumasını sağlayabilecek yanıltıcı ipuçlarından da kaçınmanız gerekir ve gerçek artıları ve eksileri olduğu için neden uzunluk yerine alanı kullandığınızı bilmeniz gerekir (örn. Çubuk grafikler).


İlk olarak, asla değişken tek bir kenarının uzunluğuna bağlı olduğunda aslında bir şekil değişimi uzunluğu ve genişliği (yani alanı) her ikisi de. X iki kat Y ise ancak Y sayfada dört kat daha fazla renge sahipse, okuyucularınızı yanlış yönlendiriyorsunuz demektir. Bu tür bozulmalara bazen " yalan faktörü " denir ve çoğu zaman farklılıkları yanıltmak ve abartmak için kasıtlı bir girişim olduğu varsayılır.

resim açıklamasını buraya girin


Alanı bir önlem olarak kullanırsanız, kesinlikle tavsiye ederim:

  • Neden alanı kullandığınızı bilmek . Uzunluk gibi doğrusal bir boyut yerine alan kullanarak şunları yapabilirsiniz:

    • Farklılıkları matematiksel olarak açıkça görme yeteneğinden fedakarlık edin (kolayca "bak, diğerinin iki katı" diyemezsiniz)
    • Okuyucularınızı , kullanıcıların bir dükkandaki turta boyutlarını karşılaştırması gibi sezgisel günlük sayısal olmayan bir şekilde görüntülemeye davet edin . Daha az sofistike, ancak daha acil. Daha fazla bağırsak, daha az kafa.
    • Çok benzer sayılar arasındaki küçük farklar neredeyse görünmez hale gelir.
    • Bir değişken diğerinden birçok kez daha küçük olduğunda, çok küçük olan değişken, çubuk grafikte olduğu gibi kötü bir şekilde kaybolmaz ve bu da düzenlerde daha fazla esneklik sağlayabilir.

resim açıklamasını buraya girin

  • Kareler için değil, orta hizalı alan için daireler kullanın :

    • Daireler, çünkü çubuk grafikler ve benzerleriyle karışıklığı davet etmiyor. Yükseklik ve genişlik ön planda değildir: yükseklik veya genişlik tabanlı bir karşılaştırma davet ediyormuşsunuz gibi görünür.
    • Merkez hizalı çünkü insanları yükseklik karşılaştırması yapmaya davet etmiyor

resim açıklamasını buraya girin

Örneğin, yukarıda, "5" etiketli kareyi "10" etiketli karenin yüksekliğinin dörtte üçü olarak görmemek zordur, bu yüzden potansiyel olarak yanıltıcıdır.

Daireler bu tür bir karşılaştırmayı davet etmiyor: daha çok bağırsak seviyesinde, "Bu damla bir sonraki damladan çok daha büyük".


Kullanıcı testlerinden küçük ölçekli çalışmalara (daha sonra bazı örnekleri araştırmaya çalışacağız) kadar bu tür sezgisel alan tabanlı karşılaştırmanın daha ilgi çekici olabileceğine, daha az etkileşimli kitlelere giriş engelini azaltabileceğine ve sayıların soğuk minutileri yerine okuyucunun konuya odaklanmasına yardımcı olun. Ancak bu, daha sayısal olarak düşünülen analizlerin önüne geçmenin maliyetidir.

Estetik nedenlerden ötürü bir boyut (uzunluk veya mesafe) ve iki boyut (alan) arasında seçim yapmayın: kitlenize ve mesajınıza göre bunlar arasında seçim yapın.

Hangisi iletişim için daha uygundur: "bu çok daha büyük" düzeyinde anında bağırsak düzeyinde karşılaştırmalar mı, yoksa "diğerinin yaklaşık% 80'i" düzeyinde daha fazla sayısal karşılaştırmalar mı?

Veya alanı kullanmanız için pratik nedenler var mı?

Ardından, pratik nedenlerle seçtiğinizde estetik uygulayın.


'Sayfadaki renk miktarıyla orantılı' çok kullanışlı bir pratik kural (en azından 2B olarak); bunun için kullanacağım için teşekkürler. Hareket ettiğim tasarım dairelere dayanıyor, sanırım tam oradasınız
dumbledad

5

Alanı söyleyebilirim. Optik olarak, iki katı uzunluğa sahip bir kare, 4 kat daha büyük bir alanı gösterir. Sıradan gözlemciler, efsanenizi okumadan bile, bölgeyle ilgili olacak.

Güzel bir örnek, xkcd'den Randall Munroe'nin bu efsanevi grafiği :

resim açıklamasını buraya girin ( büyük, okunaklı sürüm )


4

Alandaki farklılıkların uzunluğunun yargılanmasında iyi değiliz. Uzunluğu proxy olarak kullanırız ve bu nedenle alanlardaki farklılıkları hafife alma eğilimindeyiz.

Bu nedenle, aslında diğerinin 2 katına sahip bir daire çok küçük görünür, çünkü beynimiz yarıçapları ile ilişkilidir, bu da 1,4x faktörü ile farklılık gösterir.

Uzunlukları ve alanları nasıl yargıladığımıza daha yakın hizalamak için sembollerin algısal ölçeklendirilmesini öneren R'deki Oransal Sembol Eşleme gibi bu fenomenleri uzlaştırmak için ilginç girişimler var .

İşte bu yazıda Şekil 2

resim açıklamasını buraya girin

Şahsen bu konuda herhangi bir deneyimim yok ve nicel kararlar gerekiyorsa alanları kullanmaktan kaçınıyorum.

İlginç bir tanjant, hacim ve uzunluk algısı arasındaki ilişkidir. Bunları nasıl algıladığımızdaki fark daha da çarpıcı. Bu, yıldız boyutu karşılaştırmalarının bu videosunda gösterilebilir .

Güneşin çapı yaklaşık 1.700x olan en büyük yıldıza ulaştığınız zaman, 1.700x'ten çok daha büyük olduğu izlenimine kapılırsınız.

Alanlar ve uzunluklardaki farklılıkları algılamadaki hatalarımıza daha sistematik bir bakış için bkz. Kitle Kaynak Kullanımı Grafik Algısı: Jeffrey Heer ve Michael Bostock tarafından Görselleştirme Tasarımını Değerlendirmek için Mekanik Türk Kullanımı .


4

Bence alan (D), her iki taraf (E) değil.

Uzunluk 2'nin bir tarafını kullanıyorsanız, alan değerin 4 katı olur ve çok örtüşen bir grafiğiniz olur. (E)

Normal bir çubuk grafiğiniz (A) olduğunda, veriler doğrusaldır ve çubuğun ile birlikte sadece estetik içindir. (B)

Bu durumlarda, alan yine verileri temsil eder, çünkü çubukların aynı olması. Bir 3B çubuğunuz olabilir ve yine de çubuğun hacmi verileri temsil eder (C)

Algısal farklılıkları ve çakışmaları boyutlandıran grafikler


4 kere? Doğrusal ve kare arasındaki fark değil mi?
dumbledad

Gönderiyi düzenleyip düzenleyeyim.
Rafael

Diyelim ki veri 81'dir. Eğer alan kullanırsak, yanlar 9 uzunluğu 81 olan bir alan verir. Yanlar yaparsak, bunlar 81 ve uzunluk 6,561'dir. 81 4 çarpı 9 değil 6.561 4 çarpı 81 değil. 4 nereden alıyorsunuz?
dumbledad

"Eğer 2 uzunluğunda bir taraf kullanıyorsanız, o zaman alan 4 kat değer olurdu" Orada ne söylemeye çalıştığınızı söyleyemem. Verilerin büyüklüğünü temsil etmek için kenar uzunluğunu kullanıyorsanız, veri değerinin iki katına çıkarılması alanı dörde katlar.
David Richerby

David - bu benim düzenlemem! Rafael'in orijinal gönderisi "bir taraf kullanıyorsanız, alan değerin 4 katı olacaktır" dedi. Bunu açıklığa kavuşturmanın daha iyi bir yolunu biliyorsanız lütfen yapınız.
dumbledad

1

Tufte bu konuyu kapsamlı bir şekilde ele aldı. Görmek:

  • Nicel Bilgilerin Görsel Gösterimi,
  • Bilgi ve diğerlerini tasavvur etmek.

Grafik bütünlüğünün bazı ilkeleri:

  1. Fiziksel olarak grafiğin yüzeyinde ölçülen sayıların gösterimi, temsil edilen sayısal miktarlarla doğru orantılı olmalıdır.
  2. Grafiksel bozulmayı ve belirsizliği ortadan kaldırmak için açık, ayrıntılı ve kapsamlı etiketleme kullanılmalıdır. Verilerin açıklamalarını grafiğin kendisine yazın. Verilerdeki önemli olayları etiketleyin.
  3. Tasarım varyasyonunu değil, veri varyasyonunu göster.
  4. Paranın zaman serisi gösterimlerinde, sönük ve standartlaştırılmış parasal ölçüm birimleri neredeyse her zaman nominal birimlerden daha iyidir.
  5. Gösterilen (değişken) boyutları taşıyan bilgi sayısı, verilerdeki boyut sayısını aşmamalıdır. Grafikler, bağlam dışında veri alıntılamamalıdır.

Sizin durumunuzda, verilerin bir 2D veya 3D görüntü veya çizgi ile daha iyi temsil edilip edilmediğini kendinize sormalısınız. Bir küp, bir kare ve bir çizgi aynı değildir. 3D çubuk grafiklerin bu kadar sık ​​yanıltıcı olmasının nedenlerinden biri de budur.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.