Bazı EDA yaparken bir faktörün iki seviyesi arasındaki farkı göstermek için bir kutu grafik kullanmaya karar verdim.
Yolu ggplot kutu arsa hale tatmin edici, ama (aşağıdaki ilk arsa) biraz basit oldu. Kutu grafiklerinin özelliklerini araştırırken çentiklerle denemeye başladım.
Çentiklerin CI'yi medyan etrafında görüntülediğini ve iki kutunun çentiklerinin örtüşmemesi durumunda -% 95 güven düzeyinde - medyanların farklı olduğuna dair güçlü kanıtlar olduğunu anlıyorum.
Benim durumumda (ikinci arsa), çentikler anlamlı bir şekilde örtüşmüyor. Peki neden sağ taraftaki kutunun altı bu garip formu alıyor?
Aynı verileri bir keman çiziminde çizmek, karşılık gelen kemanın olasılık yoğunluğu hakkında olağandışı bir şey göstermedi.
ggplot2
. Bireysel veri noktalarını da çizme fikrini seviyorum, ancak karanlık kutudaki noktalar görünmez hale geldiği sürece hayal kırıklığına uğruyor.