Veri görselleştirmesi yapıyorum. Her referans noktası bir kare ile temsil edilir. Temel verileri sezgisel olarak okunaklı hale getirmek için, her bir karenin kenarının uzunluğu veya her karenin alanı temsil ettiği veri ile orantılı mı olmalıdır?
Veri görselleştirmesi yapıyorum. Her referans noktası bir kare ile temsil edilir. Temel verileri sezgisel olarak okunaklı hale getirmek için, her bir karenin kenarının uzunluğu veya her karenin alanı temsil ettiği veri ile orantılı mı olmalıdır?
Yanıtlar:
Yaratan sizden emin değilseniz, okuyucu hangisi olduğunu nasıl bilecek?
Kısa cevap: değer 1: 1 ile sayfadaki renk miktarına bağlanmalıdır . Yani örneğinizde, alan olmalıdır. Ama bundan da fazlası var: Bir okuyucunun yanlış okumasını sağlayabilecek yanıltıcı ipuçlarından da kaçınmanız gerekir ve gerçek artıları ve eksileri olduğu için neden uzunluk yerine alanı kullandığınızı bilmeniz gerekir (örn. Çubuk grafikler).
İlk olarak, asla değişken tek bir kenarının uzunluğuna bağlı olduğunda aslında bir şekil değişimi uzunluğu ve genişliği (yani alanı) her ikisi de. X iki kat Y ise ancak Y sayfada dört kat daha fazla renge sahipse, okuyucularınızı yanlış yönlendiriyorsunuz demektir. Bu tür bozulmalara bazen " yalan faktörü " denir ve çoğu zaman farklılıkları yanıltmak ve abartmak için kasıtlı bir girişim olduğu varsayılır.
Alanı bir önlem olarak kullanırsanız, kesinlikle tavsiye ederim:
Neden alanı kullandığınızı bilmek . Uzunluk gibi doğrusal bir boyut yerine alan kullanarak şunları yapabilirsiniz:
Kareler için değil, orta hizalı alan için daireler kullanın :
Örneğin, yukarıda, "5" etiketli kareyi "10" etiketli karenin yüksekliğinin dörtte üçü olarak görmemek zordur, bu yüzden potansiyel olarak yanıltıcıdır.
Daireler bu tür bir karşılaştırmayı davet etmiyor: daha çok bağırsak seviyesinde, "Bu damla bir sonraki damladan çok daha büyük".
Kullanıcı testlerinden küçük ölçekli çalışmalara (daha sonra bazı örnekleri araştırmaya çalışacağız) kadar bu tür sezgisel alan tabanlı karşılaştırmanın daha ilgi çekici olabileceğine, daha az etkileşimli kitlelere giriş engelini azaltabileceğine ve sayıların soğuk minutileri yerine okuyucunun konuya odaklanmasına yardımcı olun. Ancak bu, daha sayısal olarak düşünülen analizlerin önüne geçmenin maliyetidir.
Estetik nedenlerden ötürü bir boyut (uzunluk veya mesafe) ve iki boyut (alan) arasında seçim yapmayın: kitlenize ve mesajınıza göre bunlar arasında seçim yapın.
Hangisi iletişim için daha uygundur: "bu çok daha büyük" düzeyinde anında bağırsak düzeyinde karşılaştırmalar mı, yoksa "diğerinin yaklaşık% 80'i" düzeyinde daha fazla sayısal karşılaştırmalar mı?
Veya alanı kullanmanız için pratik nedenler var mı?
Ardından, pratik nedenlerle seçtiğinizde estetik uygulayın.
Alanı söyleyebilirim. Optik olarak, iki katı uzunluğa sahip bir kare, 4 kat daha büyük bir alanı gösterir. Sıradan gözlemciler, efsanenizi okumadan bile, bölgeyle ilgili olacak.
Güzel bir örnek, xkcd'den Randall Munroe'nin bu efsanevi grafiği :
Alandaki farklılıkların uzunluğunun yargılanmasında iyi değiliz. Uzunluğu proxy olarak kullanırız ve bu nedenle alanlardaki farklılıkları hafife alma eğilimindeyiz.
Bu nedenle, aslında diğerinin 2 katına sahip bir daire çok küçük görünür, çünkü beynimiz yarıçapları ile ilişkilidir, bu da 1,4x faktörü ile farklılık gösterir.
Uzunlukları ve alanları nasıl yargıladığımıza daha yakın hizalamak için sembollerin algısal ölçeklendirilmesini öneren R'deki Oransal Sembol Eşleme gibi bu fenomenleri uzlaştırmak için ilginç girişimler var .
İşte bu yazıda Şekil 2
Şahsen bu konuda herhangi bir deneyimim yok ve nicel kararlar gerekiyorsa alanları kullanmaktan kaçınıyorum.
İlginç bir tanjant, hacim ve uzunluk algısı arasındaki ilişkidir. Bunları nasıl algıladığımızdaki fark daha da çarpıcı. Bu, yıldız boyutu karşılaştırmalarının bu videosunda gösterilebilir .
Güneşin çapı yaklaşık 1.700x olan en büyük yıldıza ulaştığınız zaman, 1.700x'ten çok daha büyük olduğu izlenimine kapılırsınız.
Alanlar ve uzunluklardaki farklılıkları algılamadaki hatalarımıza daha sistematik bir bakış için bkz. Kitle Kaynak Kullanımı Grafik Algısı: Jeffrey Heer ve Michael Bostock tarafından Görselleştirme Tasarımını Değerlendirmek için Mekanik Türk Kullanımı .
Bence alan (D), her iki taraf (E) değil.
Uzunluk 2'nin bir tarafını kullanıyorsanız, alan değerin 4 katı olur ve çok örtüşen bir grafiğiniz olur. (E)
Normal bir çubuk grafiğiniz (A) olduğunda, veriler doğrusaldır ve çubuğun ile birlikte sadece estetik içindir. (B)
Bu durumlarda, alan yine verileri temsil eder, çünkü çubukların aynı olması. Bir 3B çubuğunuz olabilir ve yine de çubuğun hacmi verileri temsil eder (C)
Tufte bu konuyu kapsamlı bir şekilde ele aldı. Görmek:
Grafik bütünlüğünün bazı ilkeleri:
- Fiziksel olarak grafiğin yüzeyinde ölçülen sayıların gösterimi, temsil edilen sayısal miktarlarla doğru orantılı olmalıdır.
- Grafiksel bozulmayı ve belirsizliği ortadan kaldırmak için açık, ayrıntılı ve kapsamlı etiketleme kullanılmalıdır. Verilerin açıklamalarını grafiğin kendisine yazın. Verilerdeki önemli olayları etiketleyin.
- Tasarım varyasyonunu değil, veri varyasyonunu göster.
- Paranın zaman serisi gösterimlerinde, sönük ve standartlaştırılmış parasal ölçüm birimleri neredeyse her zaman nominal birimlerden daha iyidir.
- Gösterilen (değişken) boyutları taşıyan bilgi sayısı, verilerdeki boyut sayısını aşmamalıdır. Grafikler, bağlam dışında veri alıntılamamalıdır.
Sizin durumunuzda, verilerin bir 2D veya 3D görüntü veya çizgi ile daha iyi temsil edilip edilmediğini kendinize sormalısınız. Bir küp, bir kare ve bir çizgi aynı değildir. 3D çubuk grafiklerin bu kadar sık yanıltıcı olmasının nedenlerinden biri de budur.