Ortalamayı bir histogramda çizmek uygun mudur?


13

Ortalama değeri görselleştirmek için bir histograma dikey bir çizgi eklemek "iyi" midir?

Benim için iyi görünüyor, ama bunu hiç ders kitaplarında ve benzerlerinde görmedim, bu yüzden bunu yapmamak için bir çeşit sözleşme olup olmadığını merak ediyorum?

Grafik bir dönem ödevi içindir, sadece yanlışlıkla önemli olmayan bazı sözlü istatistik kurallarını çiğnemediğimden emin olmak istiyorum. :)


Neden olmasın. Sadece bir yorum eklemek için. Histogram olduğu gibi ortalama bir özet değerdir. Örneğin, histogramın grup boyutunu değiştirerek sağlanan bilgi derecesini değiştirebilirsiniz. Bununla birlikte, genellikle histogram sadece ortalamadan daha fazla bilgi sağlar. Aslında bir histogramdan ortalama değere yaklaşabilirsiniz. Bu yüzden genellikle birlikte sunulmuyorlar.
Simone

Bazen bir overlaid dağılımı olan histogramlar görülür (örneğin en yaygın olarak tecrübelerime göre, numune ortalaması ve standart sapma kullanılarak çizilen normal dağılım.) Dikey çizgiyi çizmekle aynı şeyi yapan (ve biraz daha fazla) (nerede örnek olduğunu gösteren) ortalama eğrinin zirvesidir.)
James Stanley

Yanıtlar:


30

Tabii ki neden olmasın?

ortalama ile histogram

İşte bir örnek (basit bir google aramasıyla bulduğum düzinelerce biri):

ortalama ve medyan ile ısırmak

(Resim kaynağı, burada kullanılabilirlik ölçme blogudur .)

Ortalama, artı veya eksi standart sapma, çeşitli miktarlar (medyan, çeyrekler, 10. ve 90. yüzdelikler gibi) çeşitli şekillerde görüntülendiğini gördüm.

Çizimin hemen karşısında bir çizgi çizmek yerine, altındaki bilgileri işaretleyebilirsiniz - şöyle:

marjinal kutu ile histogram

Burada, altta değil, üstte bir kutu grafiğine sahip bir örnek (bulunacak birçok şeyden biri) var .

Bazen insanlar verileri işaretler:

histogram rugplot ile jitter
(Değerler tamsayılara yuvarlandığından ve göreceli yoğunluğu iyi göremediğiniz için veri konumlarını biraz değiştirdim.)

Üzerine, Stata yapılan bu tür bir örnek var bu sayfada (üçüncü görmek burada )

Histogramlar biraz ekstra bilgi ile daha iyidir - kendi başlarına yanıltıcı olabilirler

Sadece arsanızın neden oluştuğunu açıklamaya dikkat etmeniz gerekiyor! (Yeni başlayanlar için burada kullandığımdan daha iyi bir başlık ve x ekseni etiketi istiyorsunuz. Ayrıca şekil başlığında, üzerinde işaretlediğinizi açıklayan bir açıklama.)

-

Son bir konu:

çubuk grafik ile histogram

-

Grafiklerim R'de üretildi.

Düzenle:

@Gung tahmin ettiği gibi, abline(v=mean...arsa boyunca ortalama çizgiyi rugçizmek için kullanıldı ve veri değerlerini çizmek için kullanıldı rug(jitter(....

Histogram ve eksen arasındaki kutu grafiğini yapmanın bir yolu:

hist(Davis2[,2],n=30)
boxplot(Davis2[,2],
  add=TRUE,horizontal=TRUE,at=-0.75,border="darkred",boxwex=1.5,outline=FALSE)

Her şeyin ne için olduğunu listelemeyeceğim, ancak ?boxplotne için olduklarını öğrenmek ve onlarla kendiniz oynamak için yardımdaki argümanları ( ) kontrol edebilirsiniz .

Ancak, bu genel bir çözüm değildir - her zaman burada olduğu gibi çalışacağını garanti etmiyorum (notu zaten değiştirdim atve boxwexseçenekleri *). Her şeye dikkat etmek için akıllı bir işlev yazmazsanız, istediğiniz şeyi yaptığından emin olmak için her şeyin ne yaptığına dikkat etmek gerekir.

Kullandığım verileri nasıl oluşturacağım (Theil regresyonunun gerçekten birkaç etkili aykırı nasıl başa çıkabildiğini göstermeye çalışıyordum). Bu soruyu ilk cevapladığımda oynadığım veri oldu.

 library("car")
 add <- data.frame(sex=c("F","F"),
       weight=c(150,130),height=c(NA,NA),repwt=c(55,50),repht=c(NA,NA))
 Davis2 <- rbind(Davis,add)

* - için uygun bir değer at, değerinin -0.5 katı civarındadır boxwex; bunu yapmak için bir işlev yazarsanız iyi bir varsayılan değer olacaktır; boxwexkutu grafiğinin y ölçeği (yükseklik) ile ilgili bir şekilde ölçeklendirilmesi gerekir; Üst y sınırının 0.04 ila 0.05 katının genellikle iyi olabileceğini öneririm.

Marjinal stripchart'ın kodu:

 hist(Davis2[,2],n=30)
 stripchart(jitter(Davis2[,2],amount=.5),
       method="jitter",jitter=.5,pch=16,cex=.05,add=TRUE,at=-.75,col='purple3')

+1, bunlar güzel; kodu eklemek ister misiniz? abline(v=mean(Davis2[,2]))& rug(Davis2[,2])Tahmin ediyorum, ama nasıl orada Boxplot takoz mi?
gung - Monica'yı eski durumuna getirin

1
@gung Kutu grafiğiyle benzer tekrarlanabilir bir örnek de dahil olmak üzere kısa ayrıntılar için düzenlemeye bakın. Gerçekten, boxplotişleve yönelik birkaç argümanı kullanmaktan daha akıllı bir şey yapmıyor . Arasında boxplotve boxpçok az çaba ile oldukça şık şeyler yapabilirsiniz.
Glen_b -Monica

Çağlar için bilgelik: "Her şeye dikkat etmek için akıllı bir işlev yazmazsanız, istediğiniz şeyi yaptığından emin olmak için her şeyin ne yaptığına dikkat etmek gerekir" ;-).
gung - Monica'yı eski durumuna getirin

Evet. Hatta sete akıllıca bir şey yazmaya düşünülen atve boxwexvb ... ama en iyi ben sadece bir yıl gibi birkaç araziler yapmak ve bu tip birkaç saniye her zaman alır? Boxplot ve sağ seçenekleri ayarlayın. Yaptığım şeye dikkat etmenin daha kolay olduğunu düşündüm.
Glen_b

@gung Kullandığım Davis2 verilerini oluşturmak için kod vermek üzere düzenledim. Umarım yardımcı olur.
Glen_b -Rica Monica

3

Tabi ki yapabilirsin. Çizginin ne anlama geldiğini açıkça etiketlediğinizden / belirttiğinizden emin olun ve çizimi çok 'meşgul' yapmaktan kaçının.

Hiçbir şey, kolayca anlaşılabilir olmak için çok fazla bilgi taşıyan bir grafikten daha kötü değildir. Tablo, özet istatistikleri açık ve öz bir konuda görüntülemek için genellikle gözden kaçan bir yoldur.


2

Önceki cevaplar mükemmel bir noktaya değinmektedir, ancak eklenmesi gereken temel unsurlardan biri.

Ortalama bir dağılımın ağırlık merkezidir ve dolayısıyla bir histogramın dönme noktasıdır. Dağıtımın dengelendiği yer burasıdır. Yani, karşılıklı bir ilişki vardır: sadece histogram hakkında düşünmenize yardımcı olan ortalama araç değil, aynı zamanda bir histogram ortalama hakkında düşünmenize de yardımcı olabilir. Bu, bir dağılım çarpık olduğunda ve dağılımın ortada olması gerekmediğinde bile daha yararlıdır.


1

Anlıyorum, onunla hiçbir sorun göremiyorum bu , bu ve bu örnekler olarak.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.