Karşılıklı (eşleştirilmiş) deneyler için hata çubuklarını görüntüleme


19

Aşağıdaki senaryo, arsa yaratıcısı olarak araştırmacı (I), gözden geçiren / editör (R, CRAN ile ilgili değil) ve ben (M) üçlüsünde En Çok SSS olmuştur. (R) 'nin tipik bir tıbbi büyük patron incelemesi olduğunu varsayabiliriz, sadece her arsanın hata çubuğuna sahip olması gerektiğini bilir, aksi takdirde yanlıştır. İstatistiksel bir gözden geçiren söz konusu olduğunda, problemler çok daha az kritiktir.

senaryo

Tipik bir farmakolojik çaprazlama çalışmasında, iki A ve B ilacı glikoz seviyesi üzerindeki etkileri açısından test edilmiştir. Her hasta iki kez rasgele sırayla ve taşınma olmadığı varsayımıyla test edilir. Birincil son nokta, glikoz (BA) arasındaki farktır ve eşleştirilmiş bir t testinin yeterli olduğunu varsayıyoruz.

(I) her iki durumda da mutlak glikoz seviyelerini gösteren bir grafik istiyor. (R) 'nin hata çubukları arzusundan korkar ve çubuk grafiklerde standart hatalar ister. Burada çubuk grafik savaşına başlamayalım ._)

iki tedavi için çubuk grafikler ve SE glikoz

(I): Bu doğru olamaz. Çubuklar çakışıyor ve p = 0.03? Lisede öğrendiğim bu değil.

(M): Burada eşleştirilmiş bir tasarımımız var. İstenen hata çubukları tamamen ilgisizdir, önemli olan, grafikte gösterilmeyen eşleştirilmiş farklılıkların SE / CI'sidir. Bir seçeneğim olsaydı ve çok fazla veri olmasaydı, aşağıdaki grafiği tercih ederim

Birleştirilen çizgiler eşleştirmeyi gösterir, orijinal değerleri gösterir

Eklendi 1: Bu, birkaç yanıtta belirtilen paralel koordinat grafiğidir

(E): Çizgiler eşleşmeyi gösterir ve çoğu çizgi yükselir ve bu doğru izlenimdir, çünkü eğim önemli olan şeydir (tamam, bu kategoriktir, ancak yine de).

(I): Bu resim kafa karıştırıcı. Kimse anlamıyor ve hata çubukları yok (R gizleniyor).

(E): Farkın ilgili güven aralığını gösteren başka bir grafik daha ekleyebiliriz. Sıfır çizgisinden uzaklık, efekt boyutu hakkında bir izlenim verir.

(I): Bunu kimse yapmıyor

(R): Değerli ağaçları boşa harcıyor

(E): (İyi bir Alman olarak): Evet, ağaçların üzerindeki nokta alınır. Ancak, birden fazla tedavimiz ve çoklu kontrastlarımız olduğunda bunu kullanıyorum (ve asla yayınlamıyorum).

farkın güven aralığı

Herhangi bir öneriniz var mı? Bir komplo oluşturmak istiyorsanız, R Kodu aşağıdadır.

# Graphics for Crossover experiments
library(ggplot2)
library(plyr)
theme_set(theme_bw()+theme(panel.margin=grid::unit(0,"lines")))
n = 20
effect = 5 
set.seed(4711)
glu0 = rnorm(n,120,30)
glu1 = glu0 + rnorm(n,effect,7)
dt = data.frame(patient = rep(paste0("P",10:(9+n))),              
                treatment = rep(c("A","B"), each=n),glucose = c(glu0,glu1))

dt1 = ddply(dt,.(treatment), function(x){
  data.frame(glucose = mean(x$glucose), se = sqrt(var(x$glucose)/nrow(x)) )})

tt = t.test(glucose~treatment,paired=TRUE,data=dt,conf.int=TRUE)
dt2 = data.frame(diff = -tt$estimate,low=-tt$conf.int[2], up=-tt$conf.int[1])
p = paste("p =",signif(tt$p.value,2))

png(height=300,width=300)
ggplot(dt1, aes(x=treatment, y=glucose, fill=treatment))+      
  geom_bar(stat="identity")+  
  geom_errorbar(aes(ymin=glucose-se, ymax=glucose+se),size=1., width=0.3)+
  geom_text(aes(1.5,150),label=p,size=6)

ggplot(dt,aes(x=treatment,y=glucose, group=patient))+ylim(0,190)+
  geom_line()+geom_point(size=4.5)+
  geom_text(aes(1.5,60),label=p,size=6)

ggplot(dt2,aes(x="",y=diff))+
  geom_errorbar(aes(ymin=low,ymax=up),size=1.5,width=0.2)+ 
  geom_text(aes(1,-0.8),label=p,size=6)+
  ylab("95% CI of difference glucose B-A")+  ylim(-10,10)+
  theme(panel.border=element_blank(), panel.grid.major.x=element_blank(),
         panel.grid.major.y=element_line(size=1,colour="grey88"))

dev.off()

Aman tanrım @ dieter-menne, harika soru! Makaleyi gönderdiğiniz derginin türüne çok bağlıdır. Grafik savaşlarından uzak duracağım, ancak grafik 2 ve 3'ü seviyorum: çok az alanda çok fazla bilgi.
doug.numbers

4
Masson ve Loftus (2003) çoğu zaman bir referanstır. Aynı grafiğin ikinci panelindeki farkın CI'sını panelledikleri örnek grafikleri gösterirler. Bu sirkteki herkesi mutlu edip etmeyeceğimi bilmiyorum (Sana rağmen hissediyorum!)
Andy W

Referans için teşekkürler, @AndyW. Mesele şu ki, ama bir problemi var: psikolojiden. Konuyla ilgili, tıbbi gözden geçirenlere göre daha iyi bir istatistiksel geçmişe sahip psikologların daha iyi makaleleri var. Keşke konuyla ilgili üst düzey bir dergi rehberi bulabilseydim, işleyebileceğim tek keskin kılıç bu.
Dieter Menne

Yanıtlar:


17

Ortalamanın standart hatasını temsil eden hata çubuklarının konu içi tasarımlar için tamamen uygun olmadığı varsayımına göre tamamen haklısınız. Bununla birlikte, çakışan hata çubukları ve önemi sorunu, bu yorum yapılan referans listesinin sonunda geri döneceğim başka bir konudur.

Tam olarak ne istediğinizi yapan, konu içi güven aralıkları veya hata çubukları hakkında Psikoloji'den zengin literatür vardır. Referans çalışması açıkça:

Loftus, GR ve Masson, MEJ (1994). Konu içi tasarımlarda güven aralıklarının kullanılması . Psikonomik Bülten ve Gözden Geçirme , 1 (4), 476-490. doi: 10,3758 / BF03210951

Ancak, problemleri, özne-içi bir faktörün tüm seviyeleri için aynı hata terimini kullanmalarıdır . Bu sizin durumunuz için büyük bir sorun gibi görünmüyor (2 seviye). Ancak bu sorunu çözen daha modern yaklaşımlar var. En önemlisi:

Franz, V. ve Loftus, G. (2012). Özne içi tasarımlarda standart hatalar ve güven aralıkları: Loftus ve Masson'un (1994) genelleştirilmesi ve alternatif hesapların önyargılarının önlenmesi . Psikonomik Bülten ve Gözden Geçirme , 1–10. doi: 10,3758 / s13423-012-0230-1

Bağuley, T. (2011). ANOVA için özne güven aralıklarının hesaplanması ve grafiğinin çizilmesi. Davranış Araştırma Yöntemleri . doi: 10.3758 / s13428-011-0123-7 [ burada bulunabilir ]

Son iki makalede daha fazla referans bulunabilir (her ikisinin de okumaya değer olduğunu düşünüyorum).


Araştırmacılar CI'leri nasıl yorumlar? Aşağıdaki kağıda göre kötü:

Belia, S., Fidler, F., Williams, J. ve Cumming, G. (2005). Araştırmacılar Güven Aralıklarını ve Standart Hata Çubuklarını Yanlış Anlıyorlar . Psikolojik Yöntemler , 10 (4), 389-396. DOI: 10,1037 / 1082-989X.10.4.389

Çakışan ve örtüşmeyen CI'leri nasıl yorumlamalıyız?

Cumming, G. ve Finch, S. (2005). Gözle Çıkarım: Güven Aralıkları ve Verilerin Resimlerinin Okunması . Amerikalı Psikolog , 60 (2), 170–180. DOI: 10,1037 / 0003-066X.60.2.170


Son bir düşünce (durumunuzla ilgili olmasa da): Bir grafikte bölünmüş grafik tasarımınız varsa (yani, konu içinde ve arasında faktörler), hata çubuklarını birlikte unutabilirsiniz. Ben (alçakgönüllü) raw.means.plotR paketinde benim işlevi tavsiye ederim plotrix.


2
Çok kullanışlı referans listesi. Cumming, fikirlerinin çoğunu amazon.com/Understanding-New-Statistics-Meta-Analysis-ebook/dp/… 'de bir araya getirdi ("Yeni istatistikler" ifadesi hakkında ne söylemek istersen, muhtemelen katılıyorum.)
Nick Cox


@amoeba Alıntı yaptığım Baguley kağıdı Morey kağıt tekniğini kullanıyor.
Henrik

10

Soru, eşleştirilmiş verileri çizmenin en iyi yolları kadar hata çubuklarıyla ilgili görünmüyor.

Özünde buradaki hata çubukları en çok belirsizliği özetlemenin bir yoludur: Verilerdeki herhangi bir ince yapı hakkında fazla bir şey söylemezler ve zorunlu olarak söyleyemezler.

Soruda, bazen farklı alanlarda farklı şeyler anlamına gelen bir terim olan profil grafikleri olarak da adlandırılan paralel koordinat grafikleri belirtilmiştir. @Ray Koopman tarafından temel dağılım grafikleri zaten önerilmiştir.

bir-B(bir+B)/2bir+B

Bu arsa için bir başka kaynak Neyman, J., Scott, EL ve Shane, CD 1953'tür. Gökadaların mekansal dağılımı hakkında: özel bir model. Astrofizik Dergisi 117: 92-133.

Geniş anlamda, bu tür arsalar, Tukey ve kayınbiraderi kardeşi Anscombe tarafından da popüler hale getirilen artıklara karşı arsaları çizme fikrine benziyor.

bir-B=0bir=BbirB

İhmal edilmiş bir tasarım, McNeil, DR 1992'nin paralel çizgi grafiğidir. Eşleştirilmiş verilerin grafiğinde. Amerikalı İstatistikçi 46: 307–310. Bu ayrıca aşağıdaki iki referansta tartışılmıştır.

Birkaç referanslı, stata bağlantılı incelemeler

2004, Mutabakat anlaşması ve anlaşmazlık. Stata Journal 4: 329-349.

.pdf adresine http://www.stata-journal.com/sjpdf.html?articlenum=gr0005 adresinden erişilebilir.

Değişiklikler, korelasyonlar ve diğer karşılaştırmalar için eşleştirilmiş, paralel veya profil grafikleri. Stata Journal 9: 621-639.

.pdf adresine http://www.stata-journal.com/sjpdf.html?articlenum=gr0041 adresinden erişilebilir.

Stata olmayan kullanıcılar, grafikleri kendi favori yazılımlarında nasıl uygulayacaklarını araştırırken Stata kodunu atlamalı ve uyandırmalıdır.

birB


4

Bireysel (A, B) noktalarının dağılım grafiğini deneyin. Çoğu diyagonalin sadece bir tarafında yer almalıdır (A = B çizgisi). İki hata çubuğu analogu vardır. Ortalama fark için bir CI'ye denk olan geleneksel olan, ortalama fark için bir güven bandı olacaktır. Bant, her ikisi de diyagonal ile paralel olan iki çizgi arasındaki bölge olacaktır. Eşleştirilmiş bir t-testi, sadece bandın her iki kenarı diyagonalin aynı tarafındaysa anlamlı olacaktır.

Daha konservatif bir hata çubuğu analogu, sentroid için bir güven elipsidir.


1
cmethÖdBcmethÖdbir

Hayır, cl. - :) Klinik kimya çok karmaşık. "Orada" ya bazı referanslar eklemiş olabilirsiniz; Hangi kağıttan bahsettiğinizden emin değilim.
Dieter Menne

4

Ön özet:

Masson / Loftus çok kapsamlı ve "etkileşim" gibi bir şeyi kabul etmeyen tıbbi meslektaşlarıma vermek için kolay bir okuma değil. Ayrıca, çok basit karşılaştırmak istemediğinde ikili güven aralıklarının gösterilmesinin zor olduğunu gösteren çoklu karşılaştırmalar için bazı önerileri vardır.

Masson Loftus

Bu stili sevmiyorum: hata çubuklu çubuklar geçen bin yıllık Excelish görünüyor. Bununla birlikte, biraz daha zarif bir stil kullanırlar:

Barlar olmadan Masson Loftus

Cumming / Finch ve Belia ve diğ. okumaları gerekir. Birincisi, kelime etkileşimini gördüğünde titreyen arkadaşınıza vermek için mükemmel bir seçimdir . Bu makaleyi okuduktan sonra Cumming'in kitabını sipariş ettim. İkincisi, bir sonraki tıbbi araştırmacı toplantısı için Shiny'de yapacağım bir testi gösteriyor .

Cumming / Finch

Daha önce hiç kullanmadığım ikinci bir eksen olsa bile bu grafiği seviyorum; bunu elde etmek için bir R-taban grafik yöntemi için Henrik ve diğerlerinin StackOverflow üzerindeki katkısını kontrol edin . Değerlerin değiştiğinden kesinlikle emin olmak için ikinci ekseni farkın soluna koymayı ve belki de bir p-değeri ekseni eklemeyi tercih ederim.

Kafes / ggplot kısmından çekim yapan var mı? Sağlanan tüm çözümler temel grafiklerdir ve panelleştirilemez / yüzleşemez.

Ancak, yorumların ve makalelerin çoğunlukla psikoloji bölümünden (ve hardcore kimyadan @cbeleites) olduğunu unutmayın. Tıbbi dergilerin gözden geçirenlerinden yorum almak iyi olur.


0

Neden sadece her hasta için farkı * çizmiyorsunuz? Daha sonra bir histogram, bir kutu grafiği veya normal bir olasılık grafiği kullanabilir ve fark için% 95'lik bir güven aralığını kaplayabilirsiniz.

  • Bazı senaryolarda logaritmaların farkı olabilir. Bakınız örneğin Patterson & Jones, "Klinik Farmakolojide Biyoeşdeğerlik ve İstatistik", Chapman, 2006.

Neden olmasın? Geçerli bilgi sağlayabilir, ancak bireysel puan veya çiftlere sahip arsalar tıbbi araştırmalarda gerçekten popüler değildir. Bu nedenle (daha fazla bilgi sağlayan) paralel grafik bu kadar popüler değildir. Tıp araştırmacıları ortalamaları ve "normal aralıkları" (ne olursa olsun) istiyorlar.
Dieter Menne
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.