Bağımsız iki örnek t-testi nasıl görselleştirilir?


11

Bağımsız iki örneklemli t-testinin sonuçlarını görselleştirmenin en kabul edilen yolları nelerdir? Sayısal bir tablo daha sık mı yoksa bir çeşit arsa mı? Amaç, sıradan bir gözlemcinin şekle bakması ve hemen iki farklı popülasyondan olduklarını hemen görmesidir.


Kim tarafından "kabul edildi", hangi bağlamda? "Daha sık kullanılır" nerede?
Glen_b

Yanıtlar:


18

Arsa amacınızda net olmaya değer. Genel olarak, iki farklı hedef türü vardır: Yaptığınız varsayımları değerlendirmek ve veri analizi sürecine rehberlik etmek için kendiniz için planlar yapabilir veya bir sonucu başkalarına iletmek için planlar yapabilirsiniz. Bunlar aynı değil; örneğin, çiziminizin / analizinizin birçok izleyicisi / okuyucusu istatistiksel olarak karmaşık olmayabilir ve örneğin eşit varyans fikrini ve t testindeki rolünü bilmiyor olabilir. Grafiğinizin, verileriniz hakkındaki önemli bilgileri, onlar gibi tüketicilere bile iletmesini istiyorsunuz. Bir şeyi doğru yaptığınıza dolaylı olarak güveniyorlar. Soru düzeninizden, sizi ikinci türden sonra topladım.

Gerçekçi olarak, bir t-testi 1'in sonuçlarını başkalarına iletmek için en yaygın ve kabul edilen grafik (aslında en uygun olup olmadığını bir kenara koyun), standart hata çubuklarına sahip bir araç çubuk grafiğidir. Bu, t-testinin standart hatalarını kullanarak iki yolu karşılaştırması bakımından t-testiyle çok iyi eşleşir. İki bağımsız grubunuz olduğunda, bu, istatistiksel olarak sofistike olmayanlar için bile sezgisel bir resim verecektir ve (veri isteyen) insanlar “muhtemelen iki farklı popülasyondan olduklarını hemen görebilirler”. @ Tim'in verilerini kullanan basit bir örnek:

nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
smokers <- c(16,20,14,21,20,18,13,15,17,21)
m        = c(mean(nonsmokers), mean(smokers))
names(m) = c("nonsmokers", "smokers")
se       = c(sd(nonsmokers)/sqrt(length(nonsmokers)), 
             sd(smokers)/sqrt(length(smokers)))
windows()
  bp = barplot(m, ylim=c(16, 21), xpd=FALSE)
  box()
  arrows(x0=bp, y0=m-se, y1=m+se, code=3, angle=90)

resim açıklamasını buraya girin

Bununla birlikte, veri görselleştirme uzmanları genellikle bu grafikleri küçümsüyor. Genellikle "dinamit grafikleri" olarak atılırlar (çapraz başvuru, Neden dinamit grafikleri kötüdür ). Özellikle, yalnızca birkaç veriniz varsa, genellikle verileri kendiniz göstermeniz önerilir . Noktalar çakışırsa, yatay olarak titreyebilirsiniz (az miktarda rastgele gürültü ekleyin), böylece artık çakışmazlar. Bir t-testi temel olarak ortalamalar ve standart hatalar ile ilgili olduğu için, ortalamaları ve standart hataları böyle bir arsa üzerine yerleştirmek en iyisidir. İşte farklı bir sürüm:

set.seed(4643)
plot(jitter(rep(c(0,1), each=10)), c(nonsmokers, smokers), axes=FALSE, 
     xlim=c(-.5, 1.5), xlab="", ylab="")
box()
axis(side=1, at=0:1, labels=c("nonsmokers", "smokers"))
axis(side=2, at=seq(14,22,2))
points(c(0,1), m, pch=15, col="red")
arrows(x0=c(0,1), y0=m-se, y1=m+se, code=3, angle=90, length=.15)

resim açıklamasını buraya girin

Çok fazla veriniz varsa, dağıtımlar hızlı bir genel bakış elde etmek için kutu grafikleri daha iyi bir seçim olabilir ve orada da araçların ve SE'lerin üzerine bindirebilirsiniz.

data(randu)
x1 = qnorm(randu[,1])
x2 = qnorm(randu[,2])
m  = c(mean(x1), mean(x2))
se = c(sd(x1)/sqrt(length(x1)), sd(x2)/sqrt(length(x2)))
boxplot(x1, x2)
points(c(1,2), m, pch=15, col="red")
arrows(x0=1:2, y0=m-(1.96*se), y1=m+(1.96*se), code=3, angle=90, length=.1)
# note that I plotted 95% CIs so that they will be easier to see

resim açıklamasını buraya girin

Verilerin basit grafikleri ve kutu grafikleri, çoğu insanın istatistiksel olarak anlayışlı olmasalar bile bunları anlayabileceği kadar basittir. Bununla birlikte, bunların hiçbirinin, gruplarınızı karşılaştırmak için bir t testi kullanmanın geçerliliğini değerlendirmeyi kolaylaştırmadığını unutmayın. Bu hedeflere en iyi şekilde farklı arsa türleri hizmet eder.

1. Bu tartışmanın bağımsız bir örnek t-testi aldığını unutmayın. Bu grafikler , bağımlı bir örnek t-testi ile kullanılabilir, ancak bu bağlamda da yanıltıcı olabilir (bkz., İç konulardaki bir çalışmada araçlar için hata çubukları kullanmak yanlış mı? ).


Bar + CI grafiğini kullanmayla ilgili büyük bir sorun, bazen farkın istatistiksel olarak anlamlı olması, ancak CI'lerin çakışmasıdır . Bar + CI grafiğinin genelci bir kitleye hitap etmeye çalıştığı göz önüne alındığında, bu ekstra kırışıklığı açıklamak için gerçekten zaman harcamak istemiyoruz.
Heisenberg

@Heisenberg, bunun farkındayım. Tüm durumlar ve amaçlar için tek ve mükemmel bir arsa yoktur. Ayrıca CI'lerden bahsetmedim, sadece SE'ler (df'ye bağlı olarak bazı CI'ye eşdeğer olsa da). Anlam, şekil başlığında sıkça dile getirilir ve metinde tartışılır. Grafiğin kendisinde net bir şekilde görüntülenmesini istiyorsanız, parantez ve p-değerleri ekleyebilirsiniz (örneğin, burada ).
gung - Monica'yı eski durumuna döndürün

Ton agresif geliyorsa özür dilerim. Sonunda, genel bir izleyici kitlesine daha fazla açıklama yapmadan bir t-testi görselleştirmenin hala zarif bir yolu olmadığına biraz şaşırdım. Çizime gelebilir: SE ile grup araçlarını gösteren 2 çubuk grafik ve farkı ve CI'sini gösteren üçüncü bir grafik ( bağlantınız gibi ). Ancak bu tür görselleştirme, izleyicileri de karıştırabilen gereksiz bilgileri (gruplar, ortalamalar arasındaki AND anlamına gelir) gösterir.
Heisenberg

@Heisenberg, bir hasta içi t-testi göstermeye çalışmadıkça diğer cevabımdaki planı kullanmazdım. Bence bir t-testi için 2 çubuk w / SEs basit bir şekil başlığı w / genellikle sunmak için iyi olduğunu düşünüyorum. Eğer önemini gerekirse de arsa, parantez ya da (genellikle gereksiz buluyorum) Böyle bir şey ekleyebilir.
gung - Monica'yı eski durumuna döndürün

14

Görselleştirmenin en yaygın kullanılan yolu t-test benzeri karşılaştırma boxplot kullanmaktır . Aşağıda, bu siteden "esrar içimi ve kısa süreli belleği ölçen bir görevde performans eksikliği arasındaki ilişki" tanımlayan veri kümesini kullanarak örnek veriyorum .

> nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
> smokers <- c(16,20,14,21,20,18,13,15,17,21)
> 
> t.test(nonsmokers, smokers)

    Welch Two Sample t-test

data:  nonsmokers and smokers
t = 2.2573, df = 16.376, p-value = 0.03798
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.1628205 5.0371795
sample estimates:
mean of x mean of y 
     20.1      17.5 

resim açıklamasını buraya girin

Aslında, boxplotlar yaygın olarak "gayri resmi" hipotez testleri için kullanılır, örneğin Yoav Benjamini tarafından 1988 tarihli bir Boxplot Kutusunun Açılması belgesinde açıklandığı gibi :

Normal kutu çizimi, kutunun yanlarından alınan bir çift takoz olarak gösterilen, partinin medyanı için yaklaşık bir güven aralığı ile desteklenir. Bu güven aralıkları, farklı kutu grafiklerinin iki çentiği üst üste gelmediğinde, medyanları önemli ölçüde farklı olacak şekilde yapılandırılmıştır. (...) Güven aralığı formülü, çeyrekler arası aralığın, parti boyutunun kare köküne bölünmesiyle sabit bir zaman olduğundan, ikincisi, kutunun uzunluğuna göre kamaların uzunluğundan algılanabilir.

Ayrıca bkz: Kutu çiziminde yalnızca özet verileri kullanarak T testi

Bu grafik doğrudan ilgili miktarları göstermemektedir t-NickCox fark ettiği gibi test . Ortalamaların güven aralıkları ile doğrudan karşılaştırılmasını istiyorsanız, belirgin aralıklarla bar grafiği kullanabilirsiniz . Ortalamaları ve güven aralıklarını kullanmak hipotez testi yapmanıza da olanak tanır ( buraya veya buraya bakınız ).

resim açıklamasını buraya girin

Bu konu altındaki diğer yayınlardan ve yorumlardan görebileceğiniz gibi, hem kutu grafikleri hem de dinamit grafikleri biraz tartışmalı bir seçimdir, bu yüzden size henüz bahsedilmeyen bir alternatif daha vereyim. İlk olarak, şunu hatırlayınt-test ve regresyon ilişkilidir . Sen çizebilirsintile bağlantılı hata çubukları (güven aralıkları) ile iki nokta olarak -test benzeri karşılaştırma. Çizginin eğimi, doğrusal regresyon kullanmak yerine regresyon eğimi ile orantılıdır.t-bu durumda test. Bu arsanın en büyük avantajı, hattın eğimine bakarak araçların farkının büyüklüğünü kolayca değerlendirebilmenizdir. Bunun dezavantajı, araçlar arasında bir miktar "süreklilik" olduğunu gösterebilmesidir (örn. Eşleştirilmiş numuneleriniz vardır).

resim açıklamasını buraya girin

Boxplotlar , görselleştirilen değişkenlerin dağılımı hakkında daha fazla bilgi sağladıkları için daha yaygın olarak kullanılmaktadır (yalnızca güven aralığıyla ortalamaya kıyasla). Ayrıca bilgileri çoğaltmak yerinet-testin ve bu tür kullanımların çoğu, örneğin Amerikan Psikoloji Derneği Yayın El Kitabı ile birçok stil rehberi tarafından teşvik edilmektedir :

İlk düşünce şeklin görüneceği kağıdın metnindeki bilgi değeridir. Şekil, kağıdın anlaşılmasına önemli ölçüde katkıda bulunmuyorsa veya kağıdın diğer öğelerini çoğaltıyorsa, dahil edilmemelidir.


4
Bu, t-testleri ve ANOVA'yı tartışan metinlerde bile gerçekten yaygındır, ancak yine de olağanüstü bir seçimdir. Kutu grafiği, doğrudan bir t-testine dahil olan miktarları göstermez. Minimal olarak, ilgili bir çizim, araçları göstermeli ve dağıtım hakkında bir kutu grafiğinden daha fazla ayrıntı vermelidir. Kuyruklardaki ayrıntılar genellikle testi yorumlarken çok önemlidir.
Nick Cox

Tamam @ NickCox, veri kümesi sadece görselleştirme için seçildi, ancak şimdi daha uygun bir örneğe değiştirdim.
Tim

3
Çubuk grafik ("dinamit grafik" olarak da bilinir) son derece yüksek bir mürekkep: bilgi oranına sahiptir.
Frank Harrell

APA El Kitabından alıntı (bağlam üzerinde kontrol etmedim) iyi bir genel tavsiyedir, ancak bu bağlamda kısmen ilgili kutu grafiğini kullanmak için kendi başına doğrudan bir argüman değildir. Doğal olarak, boxplotların çok yararlı ve çoğu zaman tamamlayıcı olabileceğine ve çok sık kullanıldıklarına katılıyorum, ancak ilk noktam kaldı.
Nick Cox

@NickCox Size diasagree olduğumu söyleyemem, ancak yine de t-testi ile ilgili olmasa bile ek bilgi sağlamak ve t-testi sonuçlarını çoğaltmamak için boxplot'u düşünürdüm. Basit, açık ve bilgilendirici.
Tim

8

Bu çoğunlukla @Tim ve @gung'un yararlı cevapları üzerinde bir değişikliktir, ancak grafikler bir yoruma eklenemez.

Küçük ama muhtemelen faydalı noktalar:

  1. @Gung tarafından gösterildiği gibi bir şerit çizimi veya nokta grafiğinin, örnek verilerde olduğu gibi bağlar varsa değiştirilmesi gerekir. Noktalar istiflenebilir veya karıştırılabilir veya aşağıdaki örnekte olduğu gibi, Emanuel Parzen tarafından önerildiği gibi hibrit bir kantil kutu grafiği kullanabilirsiniz (en erişilebilir referans muhtemelen 1979'dur. Parametrik olmayan istatistiksel veri modelleme. Journal, American Statistics Association74: 105-121). Bunun da başka yararları vardır, verinin yarısı kutunun içindeyse, o zaman yarısı da dışarıdadır ve esas olarak dağılımın tüm detaylarını gösterir. Sadece iki grubun olduğu yerlerde, bu bağlamda olduğu gibi, daha geleneksel bir tür kutu arsa minimal, gerçekten iskeletsel bir görüntü olabilir. Bazıları bunu bir erdem olarak kabul eder, ancak daha fazla ayrıntı göstermenin kapsamı vardır. Bunun tersi argüman, belirli noktaları işaretleyen bir kutu grafiğinin, özellikle de yakın çeyrekte 1,5 IQR'den daha fazla olanın kullanıcıya açık bir uyarı olmasıdır: bir t-testi ile dikkat edin, çünkü kuyruklarda noktalar olması gerekir hakkında endişelenmek.

  2. Doğal olarak, oldukça sık yapılan bir kutu grafiğine araçların bir göstergesini ekleyebilirsiniz. Farklı bir işaretçi veya nokta sembolü eklemek yaygındır. Burada referans çizgilerini seçiyoruz.

resim açıklamasını buraya girin

Sigara içenler ve içmeyenler için kantil kutu grafikleri. Kutular medyanları ve çeyrekleri gösterir. Mavi renkteki yatay çizgiler anlamına gelir.

Not. Grafik Stata'da oluşturuldu. İşte ilgilenenler için kod. stripplotile önceden yüklenmiş olmalıdır ssc inst stripplot.

clear 
mat nonsmokers = (18,22,21,17,20,17,23,20,22,21)
mat smokers = (16,20,14,21,20,18,13,15,17,21)
local n = max(colsof(nonsmokers), colsof(smokers)) 
set obs `n' 
gen smokers = smokers[1, _n] 
gen nonsmokers = nonsmokers[1, _n] 
stripplot smokers nonsmokers, vertical cumul centre xla(, noticks) ///
xsc(ra(0.6 2.4)) refline(lcolor(blue)) height(0.5) box ///
ytitle(digit span score) yla(, ang(h)) mcolor(red) msize(medlarge) 

DÜZENLE. @Frank Harrell'ın cevabına cevaben bu yeni fikir, iki normal olasılık grafiğini (gerçekten kantil-kantil grafikler) üst üste koyuyor. Yatay çizgiler araçları gösterir. Bazıları her grup için mükemmel uyumu gösteren satırlar eklemek isteyebilir, örneğin (0, ortalama) ve (1ortalama + SD) veya sağlam dirençli alternatifler.

resim açıklamasını buraya girin


1
+1, veriyi sarsmak istedim ama henüz ulaşamadım. Ayrıca, kantil kutu grafikleri, keman grafikleri ve qq grafikleri de dahil olmak üzere daha gelişmiş grafikler eklemeyi düşünüyordum, ama sonuçta daha fazla grafik listeleme fikrinden vazgeçtim.
gung - Monica'yı eski

@gung Yeterince adil; maalesef veya neyse ki, iş parçacığı genellikle iki dağılımın nasıl karşılaştırılacağına kolayca dönüşebilir. Diğer veri örneği için, histogramlar ciddi bir rakip vb.
Nick Cox

5

Sonuçları sunmanın iyi amacının yanı sıra, iki örneklem eşit varyansının varsayımlarını hangi grafiklerin kontrol ettiği konusunda biraz düşünülmelidir.tmükemmel performans için test. Bu, iki ampirik kümülatif dağılım fonksiyonunun normal ters fonksiyonları olacaktır. Test varsayımlarını karşılamak için bu iki eğri paralel düz çizgiler olmalıdır.


Cevabım için çeşitli olasılıklardan birini ekledim.
Nick Cox
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.