Birçok kümenin kesişme noktalarını görselleştirme


30

Birçok kümenin kesişme örtüşmesini göstermek için iyi bir görselleştirme modeli var mı?

Venn diyagramları gibi bir şey düşünüyorum ama bu bir şekilde 10 veya daha fazla gibi daha büyük setlere kendini daha iyi borç verebilir. Wikipedia bazı daha yüksek Venn şemalarını gösteriyor ancak 4 set şeması bile içeri girecek çok şey var.

Verilerin nihai sonucuna ilişkin tahminim, setlerin çoğunun üst üste binmeyeceği ve Venn şemalarının iyi olabileceği ihtimalinin olacağı yönünde olurdu - ama bunu üretebilecek bir bilgisayar aracı bulmak istiyorum. Görünüşe göre bana Google çizelgeleri pek çok sete izin vermiyor.


1
Ancak (referans için) kümelerinin az sayıda İlgili: stats.stackexchange.com/questions/4211/...

Yanıtlar:


18

Çok sayıda setiniz olduğunda, daha doğrusal olan ve doğrudan bağlantıları gösteren (ağ grafiği gibi) bir şey denerdim. İşaret fişeği ve Protovis'in her ikisi de bu görselleştirmelerle başa çıkmak için yardımcı programlara sahiptir.

Bunun gibi bazı örnekler için bu soruya bakın :

alt metin


(+1) Güzel cevap! - Özellikle grafikleri seviyorum. Bunu R'de yapmanın bir yolu olup olmadığını merak ediyordum.
suncoolsu

1
Bunu yapmanın hiçbir yolunun farkında değilim; webvis paketim Protovis için bir sarmalayıcı sağlar, ancak bu grafiği yapmak için çok çalışmak gerekir. Bu arada, bu makale ilgili olan "yay diyagramını" tanıtmaktadır: ieg.ifs.tuwien.ac.at/~aigner/teaching/ws06/infovis_ue/papers/…
Shane

1
@ suncoolsu, R paket şeması Shane işaret etti aynı "ark şeması" yapmak mümkün olabilir. Yukarıdaki görsel gibi görünmek için "arsa ağı" almak için olsa zor bir iş olacak gibi görünüyor. cran.r-project.org/web/packages/diagram/vignettes/diagram.pdf .
Andy,

ve Andy. Cevaplarınız için teşekkür ederim. @Shane, webvis paketinizi gördüm. Fakat hala daha fazla araştırmam gerekiyor. Protovis grafiklerini çok seviyorum. Harika bir web sitesi var.
suncoolsu

1
Güzel grafik, ancak 3 veya daha fazla kümenin kesişimini temsil edemediğiniz için ilk soruyu cevaplamıyor. Bir varyantı var mı?
nassimhddd

11

Bu, @ Shane'in cevabıyla rekabet etmez, çünkü dairesel göstergeler, yüksek boyutlu veri kümeleriyle karmaşık ilişkileri göstermek için gerçekten uygundur.

venn()K=4

K=4

Daha fazla başvuru için, ilginizi çekebilir

Kestler ve diğerleri, Generalized Venn diyagramları: karmaşık genetik küme ilişkilerini görselleştirmek için yeni bir yöntem , Bioinformatics, 21 (8), 1592-1595 (2004).

Yine de Venn şemalarının sınırlamaları var. Bu bakımdan, Robert Kosara'nın Sightings: The Venenerable Challenge veya Paralel Küme'ye uyguladığı yaklaşımı seviyorum (fakat aynı zamanda Andrew Gelman weblogundaki bu tartışmaya bakın ).


Güzel görünüyor. Nümerik olmayanları kabul ederse çok sevecektim. İlk önce verilerini sayısal bir listeye dönüştürmek gerekiyor.
eastafri

Pratik amaçlar için, bazı
senaryoları

7

UpSet adlı küme kesişmeleri için matris tabanlı bir yaklaşım geliştirdik, http://vcg.github.io/upset/ adresinden kontrol edebilirsiniz . İşte bir örnek:

UpSet Ekran Görüntüsü

Soldaki Matrix, bir satırın temsil ettiği kesişimi tanımlar; buradaki son satır, örneğin, "Aksiyon, Macera ve Çocuklar" film türlerinin kesişimidir. Sağdaki çubuklar, bu örnekte 4'ün kesişme boyutunu gösterir.

Ayrıca kavşakların veya diğer seçimlerin vb. Özelliklerini de çizebilirsiniz. Ayrıntılar için web sitesine göz atın.

Ayrıca, yukarıda belirtilen web sitesinde bulabileceğiniz R için statik bir sürüm var ya da buraya giderek: https://github.com/hms-dbmi/UpSetR/

Set görselleştirme ile ilgili son teknoloji raporuna http://www.cvast.tuwien.ac.at/SetViz adresinden erişilebilir - bunların çoğu akademik olsa da ve hazır kodla gelmiyor.


1
Bana geldiğinde, gönderdiğiniz görüntü, tek bir arsa üzerinde çok fazla bilgi bulunan aşırı çizime bir örnek ...
Tim

1
@Tim. Ne dediğinizi anladığım halde, tüm görsel unsurlar açıkça görülebilen ve ayrılabilen, gerçekten fazla çizilmez. Arsaların kolayca ayırt edilemeyecek kadar karmaşık olduğunu iddia edebilirsiniz, ancak bu durum arsa kullanımı konusunda eğitim almamanızla da ilgili olabilir - tüm görselleştirmeler genellikle kısıtlı kapsamlara yol açacağı için eğitim görmemiş kullanıcıları hedefleyemez veya hedeflememelidir (ör. venn şemalarının zayıf ölçeklenebilirliği)
ThomasP85

@ ThomasP85, insanların pasta grafiklerinin yorumlanmasında gerçekten kötü olduklarını gösteren çok fazla araştırma yapıldı (pasta uzmanları bile dahil). Çoğu durumda, karmaşık görselleştirme yanlış yorumlara ve yanlış anlamalara yol açmaktadır.
Tim

@Tim basitin her zaman daha iyi olduğuna katılıyorum, ancak karmaşık soruların bazen karmaşık cevapları olduğunu kabul ediyorum. Bu sorunun ilk olarak ortaya çıkmasının nedeni, şu ana kadar, çok sayıda kümelenmiş kavşakla baş etmek için zorlayıcı, basit bir görselleştirme tekniği olmadığıdır. Kabul edilen cevap, yalnızca kümelerin sayısı arttıkça, toplam kesişme sayısının daha küçük ve daha küçük bir parçası olan 2 derecelik kesişmeler ile ilgilidir.
ThomasP85

... ve pasta grafiklerle ilgili örneğiniz, insanların (uzman ya da olmayan) açıların karşılaştırılmasında korkunç olmaları ile ilgilidir, bu yüzden pasta grafiklerinin asla kullanılmaması gerekir :-)
ThomasP85
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.