Acil tablolar için elek / mozaik parsellere alternatif


17

Bir zamanlar gerçekten sevdiğim internette kategorik veriler (örn. Beklenmedik tablolar) için bir tür arsa üzerinde tökezledim, ancak bir daha asla bulamadım ve bunun ne olduğunu bile bilmiyorum. Esasen bir elek grafiğine benziyordu, çünkü satır yükseklikleri ve sütun genişlikleri marjinal olasılıklara göre ölçeklendirildi. Böylece, her bir kutu bağımsızlık altında beklenen göreceli frekansa ölçeklendirildi. Bununla birlikte, her bir kutuda çapraz tarama yapmak yerine, her gözlem için iki değişkenli bir üniformadan rastgele seçilen bir noktaya (dağılım grafiğinde olduğu gibi) bir nokta çizdiği için bir elek grafiğinden farklıydı. Bu şekilde noktaların yoğunluğu, gözlenen sayımların beklenen sayılarla ne kadar iyi eşleştiğini yansıtır. Yani, yoğunluk her kutuda benzer olsaydı, boş model mantıklıdır, ) sıfır modelinde pek olası olmayabilir. Çapraz tarama yerine noktalar çizildiği için, çizilen eleman ile gözlenen sayım arasında elek çizimleri için mutlaka doğru olmayan basit ve sezgisel bir yazışma vardır (aşağıya bakınız). Dahası, noktaların rastgele yerleştirilmesi grafiğe 'organik' bir his verir. Ek olarak, renk, boş modelden güçlü bir şekilde sapan kutuları / hücreleri vurgulamak için kullanılabilir ve birçok farklı değişken arasındaki çift ilişkileri incelemek için bir çizim matrisi kullanılabilir, böylece benzer grafiklerin avantajlarını içerebilir. ben,j

  • Bu komploya ne denildiğini bilen var mı?
  • Bunu R'de veya başka bir yazılımda (örneğin, Mondrian) kolayca yapacak bir paket / işlev var mı? Vcd'de böyle bir şey bulamıyorum . Tabii ki, sıfırdan zor kodlanmış olabilir, ama bu bir acı olurdu.

İşte elek grafiğinin basit bir örneği, farklı kategoriler için beklenen sayımların null model altında nasıl oynandığını görmenin kolay olduğunu, ancak çapraz tarama işlemini gerçek sayılarla uzlaştırmak zor olduğunu ve oldukça okumak kadar kolay ve estetik iğrenç:

    B ~B
 A 38  4
~A  3 19

resim açıklamasını buraya girin
Değeri ne olursa olsun, bir mozaik arsa bir tür zıt soruna sahiptir: hangi hücrelerin 'çok fazla' veya 'çok az' sayımına sahip olduğunu görmek daha kolay olsa da (boş modele göre), beklenen sayılar olurdu. Spesifik olarak, sütun genişlikleri marjinal olasılığa göre ölçeklendirilir, ancak satır yükseklikleri değildir, bu bilgi parçasının çıkarılmasını neredeyse imkansız hale getirir.
resim açıklamasını buraya girin
ve şimdi tamamen farklı bir şey...

  • 'Çok fazla' için mavi ve 'çok az' için kırmızı kullanma kuralının nereden geldiğini bilen var mı? Bu benim için her zaman mantıksızdı. O olağanüstü yüksek yoğunluklu (ya da çok fazla gözlemler) ile gider gibi geliyor bana sıcak ve düşük yoğunluklu ile gider soğuk ve bu (Sahne aydınlatması en azından) kırmızılar olan ısınır ve maviler olan soğur .

Güncelleme: Doğru hatırlıyorsam, gördüğüm arsa, çevrimiçi olarak bir pazarlama teaser olarak serbestçe sunulan bir kitaptan bir bölümün (giriş veya ch1) bir pdf'indeydi. İşte sıfırdan kodladığım fikrinin kaba bir versiyonu:
resim açıklamasını buraya girin
Bu ham versiyonla bile, elek grafiğinden daha kolay ve bazı açılardan mozaik grafiğinden daha kolay olduğunu düşünüyorum (örneğin, ilişkilerin ne olduğunu tanımak daha kolay hücre frekansları arasındaki bağımsızlık). Aşağıdaki gibi bir işleve sahip olmak güzel olurdu: a. bunu otomatik olarak herhangi bir beklenmedik durum tablosuyla yapar, b. bir arsa matrisinin yapı taşı olarak kullanılabilir ve c. yukarıdaki parsellerle gelen güzel özelliklere sahip olacaktı (mozaik arsada standart kalıntılar efsanesi gibi).


Yani, aslında farklı türde bir dolguya sahip bir mozaik çizim mi istiyorsunuz? Does Rfonksiyon assocplotyakın ne demek geliyor? Değilse, bahse girerim, bir Rprogramcı bunu değiştirebilir veya mosaicplotistediğinizi yapabilir.
Peter Flom - Monica'yı eski durumuna döndürün

1
İlgili ilgili referanslar, Bağımsızlığı Görselleştirmek için Artık Tabanlı Gölgeler (Koşullu) ( Zeileis ve ark. 2007 ), burada PDF ve birkaç referansla beklenmedik durum tablolarını görselleştirmekle ilgili başka bir konu . Zeileis makalesinin son sorunuza cevap verebilecek renk üzerine güzel bir tartışması olduğuna inanıyorum (referansları da bahsettiğiniz grafikten bahsedip geçmediğini görmek için incelemek iyi olabilir).
Andy W

Tersi, @PeterFlom, aslında farklı türde bir dolgu ile bir elek çizimi istiyorum. Alternatif olarak, görüntülenen kutuların bağımsızlık altında beklenen frekanslara (ve muhtemelen farklı türde bir dolguya) göre ölçeklendirildiği bir mozaik çizim istediğimi söyleyebilirsiniz.
gung - Monica'yı eski durumuna döndürün

"Herkes, 'çok fazla' için mavi ve 'çok az' için kırmızı kullanma kuralının nereden geldiğini biliyor mu? Bu benim için her zaman mantıksızdı." İyi bir nokta. Gerçekten de sezgiseldir. Işık tayfı sağda kırmızı (küçük dalga boyları ile ilişkili) soldaki mavi kabaca gider (daha büyük dalga boylarında ilişkili). Mozaik görüntüler kafasında bunu tersine çeviriyor gibi görünüyor ...
landroni

Elek diyagramı fikri, her bir hücredeki kutu sayısının gözlemlenen frekansla orantılı olmasıdır, bu nedenle nispi yoğunluk beklenenden daha fazla veya daha az gösterir. Renklerden hoşlanmıyorsanız, bunları varsayılanlardan kolayca değiştirebilirsiniz. Varsayılan elek gölgeleme işlevinden shading.points()hoşlanmıyorsanız, yukarıda belirtilen ve vcdpakette bir vinyet olarak kullanılabilen yapısal grafik çerçevesi içinde kendi istediğinizi, örneğin, istediğinizi yapmak için kolayca yazabilirsiniz .
user101089

Yanıtlar:


15

Açıkladığınız kitap 'Kategorik Verileri Görselleştirme' Michael Friendly gibi geliyor. 1. bölümde açıklanan, talebinize uygun görünen grafik, beklenmedik durum tablosu verilerini görselleştirmek için bir tür kavramsal model olarak tanımlanmıştır (yazar tarafından gözlem yoğunluğuna sahip bir dinamik basınç modeli olarak gevşek bir şekilde tanımlanmıştır) ve google önizlemesinde görülebilir Ch 1 için. Kitap SAS kullanıcılarına yöneliktir.

Konuyla ilgili bir makaleye burada referans verilmiştir: www.datavis.ca/papers/koln/kolnpapr.pdf

'Acil Durum Tablosu Verilerini Görselleştirmek için Kavramsal Modeller,' Michael Friendly.

http://i47.tinypic.com/148n5n7.jpg

resim açıklamasını buraya girin

* tesadüfen, yazar ayrıca vcd paketinin yazarlarından biri olarak listelenir (özellikle yukarıda belirtilen kitabından esinlenildiğinden) - belki ona doğrudan yerleşik işlevlerden birinde basit bir değişiklik olup olmadığını sorabilirsiniz kolayca belli değil.

** Renk şeması mavi rengi bağımsızlıktan pozitif sapmalar ve negatif sapmalar için kırmızı ile ilişkilendirmektedir. Kırmızı şema bu bağlamda mantıklı gelse de, belki de olumlu sapmaları temsil etmek için yeşili kullanmak daha uygun olurdu.

http://www.datavis.ca/papers/asa92.html


2
İyi iş gizem çözüldü! Aslında kitabı çeşitli çerezlerde önizlemek ve kütüphanemin ara sıra bana bölüm göndermesini sağlamak yerine satın almam gerekiyor. IMO bu görselleştirme biçimi, haritacıların "nokta haritaları" olarak adlandırdığı şeyleri hatırlatıyor ve noktaların çizgilerden ve çapraz taramalardan daha iyi bir görselleştirme aracı olduğunu haklı göstermek için oradan literatürü kullanabiliyor. Ayrıca, noktaların tercihli yerleşimleri açısından iyi bir literatürdür.
Andy W

Bu bana iyi bir başlangıç ​​yapıyor. Yardımın için teşekkürler.
gung - Monica'yı eski durumuna döndürün

1

Belki gördükleriniz değil, bağımsızlık altında beklenen hareketlerin görselleştirilmesi için yazışmalar iyi motive edilmiştir.

http://www.jstatsoft.org/v20/i03/

(Bir yana, SAS ve M Friendly'ın kitabı önerilen düzenleme hakkında yanılmıştı ve parsellerin çoğunda eserler vardı ve bu algılanan değerden sapmış olabilir.)


Yardımınız için teşekkürler, yazışma alanlarını seviyorum. Yanlış olan önerilen bu düzenleme hakkında daha fazla şey söyleyebilir misiniz? Hangi ayarlama yapıldı? Nasıl yanlıştı? Peki parsellerde yanlış olan neydi?
gung - Monica'yı eski durumuna döndürün

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.