“Boxplot ne zaman ve barplot ne zaman kullanılır” kuralları (baş parmaktan mı?)


14

Her iki kutu ve-bıyık parsel ve çubuk grafik olan ANOVA için uygun Graphics R Kitap (Crawley, 2013) uygun olarak, ancak daha uygun olduğunu ? Sanırım duruma göre değişir ... biri bana yardım edebilir mi?


5
" Her ne kadar bir problem birkaç alternatif testle çözülebilse de - her zaman en uygun olan tek bir test vardır " - Bu cümleyi kabul etmem; Bunun her zaman doğru olduğunu düşünmüyorum.
Glen_b-Monica'yı

5
Burada @Glen_b ile hemfikirim ve bu ifadenin bile anahtar noktayı kaçırdığını öneriyorum. En uygun testi belirlemek, veriler için kesin üretim sürecinin bilinmesine bağlıdır, ki bu olağandışıdır. Farklı avantaj ve dezavantajlara sahip çeşitli olası testlerin olması daha yaygındır.
Nick Cox

1
İyi istatistiksel düşüncenin herhangi bir kısa karakterizasyonunda (hipotez veya önem) testlerinden bile söz edeceğimi sanmıyorum ... Ancak bunun bir yan sorun olduğunu düşünüyorum. Sorunuz onsuz yeterince açık.
Nick Cox

Yanıtlar:


18

Özellikle ANOVA'nın grafiksel gösterimi için:

  • Bir kutu grafiği veya çubuk grafik, ANOVA için grafiksel olarak hiçbir şeyden çok daha iyidir, ancak yaygın olarak çizildiği gibi, her ikisi de grafiksel bir özet olarak dolaylı veya eksiktir.

  • ANOVA, bir veya daha fazla çeşit varyasyon bağlamında ortalamaların karşılaştırılması ile ilgilidir , bu nedenle en uygun grafik, ham verilerin yanı sıra minimal olarak araçları da gösterecektir. Grup standart sapmaları (SD) veya ilgili miktarlar zarar vermez.

  • Bazı kutu grafik çeşitleri medyanların yanı sıra araçlar da gösterse de, standart tür medyanları, çeyrekleri ve dağıtımın kuyruklarındaki bazı bilgileri gösterir. En yaygın varyant, münferit veri noktalarının, ancak yakın çeyreklerden 1,5 IQR'dan daha fazla uzanmaları durumunda gösterilmeleridir. Yani: çeyrekler arası aralık IQR üst çeyrek alt çeyrek, bu nedenle üst çeyrek 1.5 IQR'den daha düşük veya alt çeyrekten daha düşük puan değerleri olarak çizin- + -=+1.5 IQR. Böyle bir sözleşme, ANOVA için sorun yaratabilecek brüt aykırı değerlerin gösterilmesinde yardımcı olabilir, ancak ne medyanlar ne de çeyrekler ANOVA'da herhangi bir rol oynamamaktadır ve medyanların yaklaşık araçlarının kontrol edilmesi gereken bir nokta olup olmadığı varsayılmaktadır. Genellikle, deneyimli veri analistleri, örneğin belirgin işaretli aykırı değerleri ve / veya dağılım asimetrisini, verilerin dönüştürülmesi veya kimlik olmayan bir bağlantı fonksiyonuna sahip genelleştirilmiş doğrusal bir modele ihtiyaç duyulması gibi eylem gerektiren bir sorunun işareti olarak kabul eder. Bununla birlikte, bir ANOVA sunulduğunda kaç ders kitabı ve diğer hesapların kutu grafiklerini göstermesi şaşırtıcıdır, ancak odadaki fillerden, çizilmeyen araçlardan bahsetmeyin.

  • Tersine, bu bağlamdaki en yaygın çubuk grafik , verileri araçlarla ve SD'lerle veya standart hatalarla özetler, ancak tek tek veri noktalarının görüntülenmesini atlar. Dolayısıyla, örneğin, aykırı değerler veya işaretli asimetri, yalnızca hat dışı araçlardan veya ayrı ayrı gruplar içindeki şişirilmiş değişkenlikten çıkarılabilir.

Genel olarak, hangi grafik türlerinin yararlı olduğu ancak hangilerinin en iyi olduğu konusunda çok az fikir birliği vardır. İyi bir grafiğin gösterdiği kriterler olarak

  • En azından arka plan veya içerik olarak verilerdeki tam varyasyon modeli

  • Verilerin ilgili özetleri, özellikle eğlendirilen modelle veya dikkate alınan tanımlayıcılarla ilgili olanlar

  • Varsayımlardan şüphe uyandıran verilerle ilgili olası sorunların belirtileri.

ANOVA'ya yardımcı olan, ek araçlar ve SE'ler içeren nokta veya şerit grafikleri gibi çeşitli tasarımlar vardır.

John Tukey'nin bu makalesinde propaganda grafikleri ile burada bulunan analitik grafikler arasındaki fark açıklanmaktadır . ANOVA'nın çok fazla grafik gösterimi, fazla analiz yapılmadan propaganda grafikleri (bak! Gruplar çok farklı) (ve bu uygulamadaki veriler veya tekniğin sınırlamaları hakkında başka ne öğrenebiliriz?).


Peki, ideal olarak sd ve çizilmiş aykırı değerlerle keman çizimlerine ne dersiniz?
ziggystar

Keman çizimleri yardımcı olabilir. Şahsen ham verilere daha yakın bir şey tercih ediyorum, böylece modaliteyi ve tanecikliği de görebiliyorum.
Nick Cox

8

Lütfen çubuk grafikler (her bir ilgi miktarını göstermek için bir çubuk kullanılır) ve dinamit grafikleri (bir çubuk her grubun ortalamasını ve hata çubuklarını gösterir) arasında karıştırılmamalıdır. Dinamit grafikleri ASLA kabul edilemez, çünkü verilerin dağılımını hiçbir sebep olmadan gizlerler.

Evet, bunun en yaygın arsa türü olduğunun farkındayım. Araştırmacıların verilerinin şekline verdikleri (düşük) önemi yansıtan büyük bir sorundur. Bir cinayet silahı arayan bir dedektif olsaydınız, bir tanık size 1) sadece silahın yerini ve büyüklüğünü söyleseydi daha iyi olur mu? veya 2) konum, boyut ve şekil?

http://biostat.mc.vanderbilt.edu/wiki/pub/Main/TatsukiRcode/Poster3.pdf


Dinamit grafiklerinin neden ideal olmadığına dair başka kaynaklarınız var mı?
mguzmann

@mguzmann Üzgünüm, bilmiyorum. Ayrıca fikri kimin bulduğunu, zamanla benimsenmesini vb. Merak ettim ve bununla ilgili bir şey bulamadım. Bilgisayarlardan önceki günlerde ortalama +/- hata tablolarını raporlamadan geliştiğini hayal ediyorum. 1930'lardan eksiksiz veri kümesinin tablolarını yayınlamayı başaran yazılar gördüm, bu yüzden uygulamanın da gerçekten haklı olduğundan emin değilim. Örneğin: Hedrich AW. Kızamığa “duyarlı” çocuk nüfusunun aylık tahminleri, 1900–1931, Baltimore, Maryland. J Hyg 1933; 17: 613-636.
Canlı
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.