Isı haritaları “en az etkili veri görselleştirme türlerinden biri” midir?


22

Soru: Ne zaman (ne tür veri görselleştirme sorunları için) ısı haritaları en etkilidir? (Özellikle, diğer tüm görselleştirme tekniklerinden daha mı etkilidir?)

Isı haritaları en az ne zaman etkilidir?

Bir ısı haritasının verileri görselleştirmenin etkili bir yolu olup olmadığına ve ne zaman etkisiz olacağına karar vermek için kullanılabilecek herhangi bir genel kural ya da kural var mı?

(Prensipte 2 kategorik değişken ve 1 sürekli değişken için ısı haritalarını aklıma getirdim, fakat diğer ısı haritalarına ilişkin görüşlerini duymakla da ilgileniyorum.)

Bağlam: Veri görselleştirme konusunda çevrimiçi bir kurs alıyorum ve şu anda etkisiz ve aşırı kullanılmış arsa türlerini tartışıyorlar. Dinamit planlarından ve pasta grafiklerinden zaten bahsettiler ve neden etkili olmadıklarına ve neden daha iyi alternatiflerin mevcut olduğuna dair nedenler açık ve beni ikna ettiler. Dahası, dinamit arazileri ve pasta grafikler hakkında verilen fikirleri doğrulayan başka kaynaklar bulmak kolaydı.

Ancak, kurs ayrıca “ısı haritalarının en az etkili veri görselleştirme türlerinden biri” olduğunu söyledi. Nedenlerin nedenlerinin bir ifadesi aşağıda verilmiştir. Ancak Google'da bu görüş noktasını destekleyen başka yerler bulmaya çalıştığımda, pasta grafiklerinin ve dinamit parsellerinin etkinliği hakkındaki görüşlere bakmaktan çok zorlandım. Bu yüzden, kursta verilen ısı haritalarının karakterizasyonunun ne derece geçerli olduğunu ve bunlara karşı olan faktörlerin belirli bir bağlam için ne kadar önemli ve en önemli olduğunu bilmek istiyorum.

Verilen sebepler şunlardı:

  1. Rengi sürekli bir ölçekte eşleştirmek zordur.

    Bu kuralın bazı istisnaları vardır, bu nedenle bu genellikle bir anlaşma kırıcı değildir, ancak ısı haritaları söz konusu olduğunda, sorun özellikle zordur, çünkü renk algımız komşu renklere bağlı olarak değişir. Dolayısıyla ısı haritaları, küçük veri setlerinde bile bireysel sonuçları görmek için uygun değildir. Hangi yol açar:

  2. Tabloya bakma yöntemini kullanarak belirli soruları yanıtlamak genellikle mümkün değildir, çünkü belirli bir renge karşılık gelen sayısal değeri yeterli doğrulukta bulmak mümkün değildir.

  3. Genellikle, veriler trendleri ortaya çıkaracak şekilde kümelenmez.

    Böyle bir kümelenme olmadan, genel genel kalıplarla ilgili herhangi bir şey çıkarmak genellikle zor veya imkansızdır.

  4. Isı haritaları genellikle sadece bir "wow faktörü" iletmek veya sadece çok renkli bir gradyan kullanırken, sadece havalı görünmek için kullanılır, ancak verileri iletmenin genellikle daha iyi yolları vardır.

Sürekli verileri ortak bir ölçekte çizmek her zaman en iyi seçenektir. Bir zaman bileşeni varsa, en belirgin seçenek bir çizgi grafiğidir.


15
"Isı haritaları" eleştirisi (4) 'ün son satırına kadar iniyor: tam olarak bu "daha iyi iletişim yolları" nelerdir? (Daha iyi bir yol yoksa, o zaman (1) - (3) pek ilgili değildir.) Eğer amaç kelimenin tam anlamıyla verileri iletmekse, açıkçası daha iyi yollar vardır: sayıları yazın. Bir görselleştirmenin amacı, nadiren veri iletmek için: bunun yerine, bir yorumu desteklemek veya bir mesaj göndermek . Kaynağınızda hangi yorumlar var ve bu yorumları sunmanın daha iyi bir yolu olduğunu iddia ediyor mu?
whuber

4
@whuber Bunun bir eki olarak - ısı haritaları hakkında çok güzel bir şey, çoğu durumda ham verileri (belki de uygun yuvarlatılmış) doğrudan her bir karo üzerinde göstererek onları tamamlamanın kolay olmasıdır. Bir elektronik tablodaki hücrelerin arka plan rengi için koşullu biçimlendirmeyi kullanmak bile, bağlamda nasıl geliştirilebileceğini görmenin zor olduğu türlerin çok etkili ve çok yaygın bir "ısı haritası" dır.
Silverfish

2
Yorumum sadece eleştirmen 1 ile ilgilidir. Rengin (ton) fiziksel olarak (dalga boyu) olmasına rağmen psikolojik olarak düzenli bir ölçekle eşleşmemesi doğrudur. Ancak, parlaklık gibi yedekli bir boyut ekleyerek onları daha kolay yorumlanmasını sağlayabilir. Açıktan daha koyu koyu olabilir ancak açık mavi ve koyu kırmızı gibi renkler kullanabilirsiniz.
David Lane,

2
Bağlama göre değişir. Burada , başka bir daha kullanışlı veya kullanışlı veri görselleştirme türü olmadığını düşünebileceğim bir ısı haritasından elde edilen değerli, işlemden geçirilebilir bilgilere harika bir örnek .
Jason C

5
Renk gereksiz (ve kuşkusuz, kötü seçilmiş - sadece R'deki varsayılan görüntü renk haritası), ancak burada birkaç yıl önce çalıştığım Mayın Tarlası oyunu hakkında bir örnek var . Isı haritasını hemen aydınlatarak, bir kez gördüğünüzde ve bir an için düşündüğünüzde sezgisel olarak netleşen problemin yapısını ortaya çıkardığını, ancak arsayı görmeden önce (çoğu insan için) hemen belli olmadığı sonucunu buldum.
kardinal,

Yanıtlar:


15

Bunun ya da bunun için "en iyi" arsa diye bir şey yoktur. Verilerinizi nasıl çizdiğiniz, iletmek istediğiniz mesaja bağlıdır. Yaygın olarak kullanılan araziler, kullanıcıların bunları okuyabilmelerinin daha muhtemel olması avantajına sahiptir. Bununla birlikte, bu mutlaka en iyi seçenek oldukları anlamına gelmez.

Isı haritalarıyla ilgili olarak, cevabımı, onlara karşı sözde tartışmaların sonucu olarak verdim.

Reklam 1) Kodlama kanalı olarak renge güvenmiyorsanız, bunun yerine parlaklığı, koyu griden açık griye "renk" tonlarını içeren bir ölçek kullanın. Çoğu zaman, sürekli değişkenleri binmek istersiniz (ayrıca bkz. 5), böylece renk sayısını düşük tutabilir ve kullanıcılar tarafından çözülmesini kolaylaştırabilirsiniz. Bu bir zorunluluk değil. Sürekli değişkenin bindirilmediği bu örneğe bir bakın .

İlan 2) Kesinlikle, kesin değerlere bakmak için alternatif olarak kullanılmamalıdır. Isı haritaları öncelikle desenleri göstermek, tabloları değiştirmek için kullanılmamalıdır.

İlan 3 + 4) Bunun sadece ısı haritalarıyla nasıl bir bağlantısı olacağını anlamıyorum.

Reklam 5) Isı haritaları idealdir ancak zorunlu değişkenlerle birlikte kullanılması gerekmez. Sürekli değişkenler için, ısı haritaları bir kodlama kanalı olarak parlaklığın yanı sıra uygun bir binayla birlikte, iki boyutlu bir histogram veya çubuk grafik olarak kullanılabilir.


2
Müthiş cevap! Dışında "Reklam" ın ne anlama geldiğini bilmiyorum. Latin? Kısaltma?
xan

1
Teşekkürler! "reklam", "açık" veya "ilgili" anlamına gelir, sanırım Latincedir.
g3o2

"Reklam" ı da bu şekilde kullandığımı hiç görmedim (cc, @xan). Anlattıklarına bakılırsa, ben kullanabileceğini düşündüğünüz ayak .
gung - Monica'yı yeniden yerleştir

1
Ayrıca parlaklık tabanlı ısı haritalarınızı gama düzeltmeyi de unutmayın.
user253751

3
@gung Gerçekten değil, IMO. Hızından farklı olarak hiçbir çağrışım yok - sadece ek olarak, zeyilname anlamına geliyor, atıfta bulunmak, söz gelince ... Batı’da evrensel olmaktan, Latince’den gelmek ve ilahiyatta, bilimsel ve siyasal edebiyatta yoğun olarak kullanmaktan bahsetmiyorum. diğer şeyler. Bir (posta) iletişim kutusunda, iki taraf bunu noktaların her birine argümanlara gönderme yapmak için kullanırlar. Yine de, yazılı dil kesildikçe disfavourun içine düşüyor gibi görünüyor. Her zamanki değişiklik, "Kafa 1.1" yerine "1.1" kullanıyor, bu biraz kafa karıştırıcı olabilir ve bana biraz kaba görünüyor, ama ah evet.
Luaan

5

Birisi Isı Haritasının en az etkili görselleştirme türü olduğunu söyleyemez. Senin ihtiyacına bağlı olduğunu söylemeyi tercih ederim. Bazı durumlarda Isı haritaları çok faydalıdır. Diyelim ki bir ülkede (ya da şehir çapında) bir ülkede suçla ilgili bir rapor yapmalısınız. Burada, zamana bağlı olabilecek büyük bir veri setine sahip olacaksınız.

Benzer şekilde, diyelim ki şehirler için elektrik tüketimi hakkında bir rapor hazırlamak zorundasınız. Bu durumlarda Heat haritası üzerinden kolayca görselleştirebilirsiniz. Daha mantıklı ve daha az hantal olacak.

Özetle, çok sayıda sürekli veriye sahipseniz ve cevapları hızlı bir şekilde belirleyebilecek bir rapor hazırlamak istiyorsanız, o zaman Isı haritası en iyisidir.


2
Enerji tüketimi için, genellikle bir ısı haritasından daha iyi bir komplo yoktur: argustech.be/wp-content/uploads/2012/04/heatmap.png Hafta sonları ve çalışma saatleri tam izleyiciden atlar. Temel yükü görebilir, zirveleri görebilir, ne zaman olduklarını görebilirsiniz. Herhangi bir tuhaf deseni birkaç saniye içinde tespit edebilirsiniz, örneğin bazı elektrikli cihazlar her zaman açıksa veya çok erken veya çok geç başlarsa.
Eric Duminil

4

Orijinal sorudaki Eleştiri 1, en büyük dezavantajı kapsar - ısı haritasını okuyan birisinin iletilen nicel bilginin kodunu çözmesi zor. Alttaki miktarın doğrudan tablodaki uzaklıkla ilişkili olduğu bir xy-dağılım grafiği veya nokta grafiği düşünün - yorumlama için çok basittir.

Öte yandan, bir ısı haritasında, grafiği okuyan kişi% 10 “daha ​​kırmızı” veya “daha ​​koyu” değerlerini kendi memnuniyetleriyle yorumlama özgürlüğüne sahiptir. Bunun da ötesinde, insanların renk ve gölge ile baş edebilmeleri için farklı yetenekler sorunu var. Bunlar gerçek dezavantajlar, ancak evrensel olarak ölümcül değiller.

Buna karşın, üçüncü eleştirinin, yanlışlıkla ısı haritalarının özellikle yararlı olduğu bir olayı - yanlışlıkla bir 2D düzlemde kümelendiğinde, üçüncü bir boyuttaki benzer değerlerin belirli bir gölge veya rengin yamaları olduğunu gösterdiği zaman belirledikleri anlaşılıyor. Bu nedenle, ısı haritaları bazı şeylerde etkisiz kalırken, diğerleri için faydalıdırlar ve aynı şekilde, golfçüler araba sürmek veya koymak için işe yaramaz olmalarına rağmen marangoz takozlar veya benzerleri taşıdıkları gibi, çantanızda kalmalıdırlar. Çekiçleri görmezden gelin, çünkü odun kesmek için uygun değillerdir.

Genel olarak veri görselleştirme, birden fazla görselleştirme denemek ve ardından en iyi ayarları bulmak için denemek de dahil olmak üzere, verilerin önemli özelliklerini ortaya çıkaran bir dizi görselleştirmeyi denemeniz biraz zaman alacak iteratif aktivite olarak görülmelidir. belirli seçimler. Sonucun tek bir görselleştirme olacağı varsayılmamalıdır - bazen verilerin çok sayıda önemli özelliğini vurgulamak için verilerin bir dizi görselleştirmesi gerekebilir. Bu bağlamda, belirli veri kümelerinin belirli özellikleri için, ısı haritasının en etkili olacağı zamanlar olacak ve tarif edildiği gibi iletişim veren kümeler bu zamanlardan biri olabilir. Genel olarak, tek bir görselleştirmenin her şeyi yapamayacağı ve birden fazla kişinin gerekli olacağı sık sık durumlar olacaktır.


3

Diğerlerinin de belirttiği gibi, ısı haritalarının her zaman etkisiz olduğunu söylemek gerçekten yanlış. Aslında, birçok durumda oldukça etkilidirler.

Örneğin, 4B verilerini görselleştirmek istiyorsanız, ilk üç boyutu birçok çizim yazılımında yapmak yeterince kolaydır. Ancak, 4D kavramının tamamının kavramsallaştırılması oldukça zordur. "4." yön / boyut nedir?

Bu, bir ısı haritasının etkili olabileceği yerdir, çünkü ilk üç boyutun koordinat ekseni üzerine çizilmesine izin verir ve dördüncü, çizilen düzleminize (veya çizgi, ancak daha az olasıdır) bir ısı haritasını istifleyerek görselleştirilebilir.

Alt satırda, içeriğe ihtiyacınız var. Görselleştirmenizde neler arıyorsunuz? Ayrıca, kendi kendine bir öğretmen olarak, size bu çevrimiçi kursların çok önemsiz ve yararsız olma eğiliminde olduğunu söyleyebilirim. Bunları yalnızca, bütün bir konu hakkında öğretilmek yerine belirli konular hakkında bilgi / yardım ararken kullandığınızda çok daha iyisin.

Yine de iyi şanslar.


3

Doğası gereği, bir ısı haritası iki sürekli bağımsız değişkenle (veya tamamen eşit olmayan bir şekilde, iki boyutlu bir vektör uzayından bir bağımsız değişken) ve bir sürekli bağımlı değişken içeren verileri görüntüler . Bu tipteki veriler için, bir ısı haritası kesinlikle en etkili veri görselleştirme türlerinden biridir. Evet, onun sorunları var, ama bu kaçınılmazdır: gerçekten çalışmak için sadece iki boyutunuz vardır ve üç boyutlu bir alan yapı koruma yöntemiyle eşlenemez , bu nedenle bir boyutu renklendirmek veya eşlemek gibi bir kesmeye ihtiyacınız var. kontur çizgileri çizme vb.

R,2XxY|X||Y|kategorik bir değişken için sonlu olan - bir başka deyişle, iki kategorik değişkenin kartezyen ürünü tek bir kategorik değişken olarak kabul edilebilir ! Ve bu ışıkta, bir ısı haritasının problemi olmayan diğer arazileri de kullanabilirsiniz.

İki kategorik değişkenler üzerinde bir ısı haritası kullanışlı görünen bir durumda bulursanız, bu muhtemelen bir göstergesi olduğunu değil gerçekten kategorik değişkenler değil, quantised sürekli değişkenler.


4
Bu cevap ilginç, ancak kategorik değişkenlerle heatmaps kullanma fikrine kısa bir şekilde bürünüyor. Örneğin, bir kişi kategorik seviyeleri sayılarına göre (veya ilgili başka bir sıralama değişkenine göre) sıralayabilir ve daha sonra eklem dağılımını veya eklem kategorik seviyelerine göre değişen diğer miktarları görüntülemek için bir ısı haritası kullanabilir. Bu, kopulalara (ve genelleştirilmiş kavramlarına) bağlanabilir . Bu görselleştirmeler, iyi yapıldığında, verilerdeki gerçek yapıyı ortaya çıkarabilir, aksi takdirde tespit edilmesi çok zor olacaktır. (...)
kardinal

(...) Ve böyle bir yaklaşım, kategorik seviyelerin Öklid uzayına gömülmesinin (doğrudan) nosyonundan bağımsızdır.
kardinal,

Gen ekspresyonu / mikroarray verileri için ısı haritaları kullanma uygulaması hakkında herhangi bir yorumunuz olup olmadığını merak ediyordum - bunlar kategorik değişkenlerin gerçekten olamayacağı 2 kategorik ve bir sürekli değişken için ısı haritaları kullanma durumlarına benziyor. nicelenmiş sürekli değişkenler olarak yorumlanır. Veya genel olarak kategorik değişkenlerin korelasyon matrisleri için ısı haritaları olduğunu tahmin ediyorum.
Chill2Macht

3

Isı haritaları, zaman serisi perspektifinden çoklu değişkenlerin basit bir görünümünü sağlamada mükemmeldir; veriler zaman içinde mutlak değişiklikler olabilir veya değişkenleri farklı ölçüm aralıkları veya alt grupların göreli değişiklikleri ile incelemek için Z puanları veya başka araçlar kullanılarak standartlaştırılabilir. Kişinin korelasyonları görebileceği veya çok sayıda grafiğin yerini alabileceği ve yerini alabileceği çok görsel olarak fark edilebilir bir görünüm sağlar. Muhtemel boyutsallık azalmasını değerlendirmek için ön işlemlerde de kullanılabilirler - örneğin Faktoring veya PCA.

Kötü müdahale eden değişkenler ve diğer faktörler, korelasyonları bulmak için bu yaklaşımı kullanırken gizlenebilir ve geçilebilir. Aynı gizli yönler çizgi grafiklerde de görülür - ancak çok sayıda değişken verildiğinde - deneyimlerim, ısı haritalarının bir kullanıcının araya giren yönleri veya diğer gizli faktörleri göz önüne almadığı kadar fazla bilgi getirmesidir.

Bu, veri üreten 20 yıllık bir ekonomi bilimci bakış açısıyla, veri üreten ve bu tür verilerle genel halkı eğitme görevini üstlendi.


1

Isı haritaları, bir saçılma grafiği üzerinde görüntülenemeyecek kadar çok veri noktası olduğunda saçılma noktalarına göre avantajlıdır. Bu, saydam veri noktaları kullanılarak bir dağılım grafiğinde hafifletilebilir, ancak belirli bir eşiğin ötesinde, verileri özetlemek daha iyi hale gelir.

Gelen bu blog sonrası verilir yorumlamak zor olmak scatterplots bir zorlayıcı örnek.

Bir dağılım grafiği yalnızca görsel olarak belirli bir eşiğe kadar yoğunluğu temsil edebilir - "her yeri işaret eder" eşiği ...

Arsa yoğunluğu, nokta değil

Çözüm, noktaların kendisinden ziyade çentikli nokta yoğunluğunu çizmektir. Bu metodu zaten bir boyutta histogram olarak biliyoruz.

İki boyutta, bunu yapmanın birçok yolu vardır. Kutu şekilleri, kareler veya altıgenler gibi düzlemin herhangi bir şekilde döşenmesi yönteminden alınabilir. Her döşeme için, döşeme içindeki veri noktalarının sayısı sayılır. Karo nokta sayısına göre bir renk atanır.

Ggplot2 belgelerinde 2d bin sayısının ısı haritası ile ilgili benzer bir ifade :

Bu, geom_point()aşırı lekelenmenin varlığına faydalı bir alternatiftir .

Dokümanlarında geom_point():

çizme

Bir dağılım grafiğindeki en büyük potansiyel sorun aşırı çizmedir: birkaç noktadan fazlasına sahip olduğunuzda, noktalar birbirinin üzerine çizilebilir. Bu, arsanın görsel görünümünü ciddi şekilde bozabilir. Bu soruna bir çözüm yok, ancak yardımcı olabilecek bazı teknikler var. Sen ek bilgiler ekleyebilirsiniz geom_smooth(), geom_quantile()veya geom_density_2d(). Birkaç benzersiz x değeriniz varsa, geom_boxplot()ayrıca yararlı olabilir.

Alternatif olarak, kullanarak her yerde noktalarının sayısını özetlemek ve bir şekilde o görüntüleyebilir geom_count(), geom_hex()ya geom_density2d().

Başka bir teknik, noktaları saydam (örneğin geom_point(alpha = 0.05)) veya çok küçük (örn. geom_point(shape = ".")) Yapmaktır .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.