Çentikli kutu grafikleri nasıl yorumlanır


11

Bazı EDA yaparken bir faktörün iki seviyesi arasındaki farkı göstermek için bir kutu grafik kullanmaya karar verdim.

Yolu ggplot kutu arsa hale tatmin edici, ama (aşağıdaki ilk arsa) biraz basit oldu. Kutu grafiklerinin özelliklerini araştırırken çentiklerle denemeye başladım.

Çentiklerin CI'yi medyan etrafında görüntülediğini ve iki kutunun çentiklerinin örtüşmemesi durumunda -% 95 güven düzeyinde - medyanların farklı olduğuna dair güçlü kanıtlar olduğunu anlıyorum.

Benim durumumda (ikinci arsa), çentikler anlamlı bir şekilde örtüşmüyor. Peki neden sağ taraftaki kutunun altı bu garip formu alıyor?

Aynı verileri bir keman çiziminde çizmek, karşılık gelen kemanın olasılık yoğunluğu hakkında olağandışı bir şey göstermedi.

şek.1 kutu grafiği

şek. 2 çentikli kutu çizimi


1
Ggplot kodunuzda, şu anda am sayısal değişken olarak kullanıldığından fill = factor (am) kullanmalısınız.
rnso

@Rnso
RDJ

Orijinal verileri herkes yayınlayabilir mi? Sanırım standart bir kum kutusundan ggplot2. Bireysel veri noktalarını da çizme fikrini seviyorum, ancak karanlık kutudaki noktalar görünmez hale geldiği sürece hayal kırıklığına uğruyor.
Nick Cox

Yanıtlar:


18

Benim durumumda (ikinci arsa), çentikler anlamlı bir şekilde örtüşmüyor. Peki neden sağ taraftaki kutunun altı bu garip formu alıyor? Bunu nasıl açıklayabilirim?

25. persentilin yaklaşık 21.55 persentil yaklaşık 30.5 olduğunu gösterir. Ve çentiğin alt ve üst sınırları yaklaşık 18 ve 27'dir.

Yaygın bir neden, dağılımınızın eğik olması veya örneklem boyutunun düşük olmasıdır. Çentiğin sınırı şunlara dayanmaktadır:

medbenbirn±1.57xbenSR,n

Medyan ile 25. persentil arasındaki mesafe ve medyan ile 75. persentil arasındaki mesafe (sağdaki gibi) son derece farklıysa ve / veya numune boyutu düşükse, çentik daha geniş olacaktır. Çentik sınırının 25. ve 75. persentillerden (kutu gibi) daha fazla olması yeterince genişse, çentikli kutu grafiği bu "içten dışa" şeklini gösterecektir.


1
Ayrıntılı açıklamanız için çok teşekkürler. Sormama izin verin, neden çentiğin alt ve üst sınırları yaklaşık 17 ve 24, yaklaşık 18 ve 27 değil (sağ kutu grafiğinde)?
Denis

@Denis, Yakaladığın için teşekkürler. Revize ettim.
Penguin_Knight
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.