Eşleştirilmiş ve eşleştirilmemiş t testi


20

Farz edin ki 20 farem var. Fareleri bir şekilde eşleştiriyorum, böylece 10 çift elde ederim. Bu sorunun amacı için, rastgele bir eşleştirme olabilir, VEYA aynı çöpten, aynı cinsiyetten, benzer ağırlıkta fareleri eşleştirmeye çalışmak gibi mantıklı bir eşleştirme olabilir, VEYA kasten aptal bir eşleştirme olabilir fareleri olabildiğince eşit olmayan ağırlıklar ile eşleştirmeye çalışmak. Sonra her çift bir fare kontrol grubuna ve diğer fare tedavi edilecek gruba atamak için rasgele sayılar kullanın. Şimdi deneyi yapıyorum, sadece tedavi edilecek fareleri tedavi ediyorum, ama başka şekilde yapılan düzenlemelere hiç dikkat etmiyorum.

Biri sonuçları analiz etmeye geldiğinde, eşleştirilmemiş t testi veya eşleştirilmiş t testi kullanılabilir. Varsa, cevaplar ne şekilde farklı olacak? (Temel olarak tahmin edilmesi gereken herhangi bir istatistiksel parametrenin sistematik farklılıklarıyla ilgileniyorum.)

Bunu sormamın nedeni, yakın zamanda dahil olduğum bir makalenin biyolog tarafından eşleştirilmemiş bir t-testi yerine eşleştirilmiş bir t-testi kullandığı için eleştirilmesidir. Tabii ki, gerçek deneyde durum, çizdiğim durum kadar aşırı değildi ve bence, eşleştirmenin iyi nedenleri vardı. Ancak biyolog aynı fikirde değildi.

Bana öyle geliyor ki, çizdiğim durumlarda, eşleşmek uygun olmasa bile eşleştirilmiş bir test yerine eşleştirilmiş bir t-testi kullanarak istatistiksel önemi (p-değerini düşürmek) yanlış bir şekilde iyileştirmek mümkün değil. Bununla birlikte, fareler kötü bir şekilde eşleştirilirse, istatistiksel önemi daha da kötüleşebilir. Bu doğru mu?

Yanıtlar:


23

Hem Frank'in hem de Peter'ın öne sürdüğü noktalara katılıyorum, ancak konunun kalbine ulaşan ve OP'nin dikkate alması faydalı olabilecek basit bir formül olduğunu düşünüyorum.

Let ve Y olan korelasyon bilinmeyen iki rastgele değişken olsun.XY

Let Z=XY

varyansı nedir ?Z

İşte basit formül: Ne olursa Cov ( X , Y ) > 0 (yani X ve Y pozitif bir korelasyon vardır)?

Var(Z)=Var(X)+Var(Y)2Cov(X,Y).
Cov(X,Y)>0XY

Sonra Var(Z)<Var(X)+Var(Y). Bu durumda, eşleştirme, müdahale öncesi ve sonrası aynı konu ile uğraşırken olduğu gibi pozitif korelasyon nedeniyle yapılırsa, bağımsız eşleştirilmiş fark, eşleştirilmemiş vaka için aldığınız varyanstan daha düşük varyansa sahiptir. Yöntem varyansı azalttı. Test daha güçlü. Bu, döngüsel verilerle dramatik bir şekilde gösterilebilir. Washington DC'deki sıcaklığın New York'takinden daha yüksek olup olmadığını görmek istedikleri bir kitapta bir örnek gördüm. 2 yıl boyunca her iki şehirde de ortalama aylık sıcaklık aldılar. Tabii dört mevsim nedeniyle yıl boyunca büyük bir fark var. Bu varyasyon, eşleştirilmemiş bir t testinin bir farkı algılaması için çok büyük. Ancak, aynı yılın aynı ayına dayalı eşleştirme, bu mevsimsel etkiyi ve eşleştirilmiş testi, DC'deki ortalama sıcaklığın New York'a göre daha yüksek olduğunu gösterdi. X i ( A ayında NY sıcaklık) ve Y i ( A ayda DC sıcaklık) pozitif ilişkilidir çünkü mevsimler NY ve DC'de aynıdır ve şehirler genellikle aynı hava sistemlerini deneyimleyecek kadar yakındır. sıcaklığı etkiler. DC biraz daha sıcak olabilir çünkü daha güneydedir.tXiAYiA

Kovaryans veya korelasyon ne kadar büyük olursa, varyanstaki azalma o kadar büyük olur.

Şimdi negatif olduğunu varsayalım .Cov(X,Y)

Sonra . Şimdi eşleştirme eşleştirmekten daha kötü olacaktır çünkü varyans aslında artmıştır!Var(Z)>Var(X)+Var(Y)

ve Y ilişkisiz olduğunda muhtemelen hangi yöntemi kullandığınız önemli değildir. Peter'ın rastgele eşleşme durumu bu duruma benzer.XY


3
Michael, "<" ve ">" Web sayfalarında özel anlamlara sahip olduğu için, metninizin büyük alanlarının görünmemesi için T görünümü kullanmanız çok önemlidir .Denklemlerde onlar için X işaretlemesi (kodlar sırasıyla "\ lt" ve "\ gt" dir). Bu soruna neden olan iki denklemi işaretledim. Gelecekte, insanların gördüklerini düşündüklerini gördüklerinden emin olmak için lütfen gönderdikten hemen sonra yayınladığınızı okuyun ve ardından işaretlemeyle ilgili bir sorun varsa gönderinizi moderatörlerin dikkatine çekmek için çekinmeyin. TEX
whuber

@whuber Teşekkür ederim. Genelde kayıt sırasında ve sonrasında kontrol ediyorum çünkü özellikle abone olurken denklemleri çok fazla bozduğumu görüyorum. Bunu kaçırmak olağandışı ve muhtemelen oldu çünkü uzun bir yazıydı ve dikkatsizce yapmak istediğim veya yapmak istediğim başka bir şeye devam ettim. Bazen bir telefon beni rahatsız ediyor ve kontrol etmeyi unutuyorum. Bir yazıda metnin kaybolmasına neden olan özel sembollerle ilgili olarak bunu gözlemledim. Bence basit bir çözüm, sembolden sonra bir boşluk bıraktığınızdan emin olmaktır. Sanırım bu geçmişte benim için çalıştı.
Michael R. Chernick

+1, gerçekten yerinde. Not eğer & Y mükemmel ilintisiz sizin numunede , Var ( Z ) = Var ( X ) + Var ( Y ) . XYVar(Z)=Var(X)+Var(Y)
gung - Monica'yı eski durumuna döndürün

@MichaelChernick Cov (X, Y) <0 olduğunda, bir sorum var: Amacım E [X] -E [Y] 'yi deneyimden çıkarmak ise, o zaman DÜŞÜNCE Eşleştirilmiş bir çalışma yürüttüm, Verilerimi analiz edersem, yine de deneme sonucumun EŞSİZ randomize denemenin gerçekleştiğini önceden tahmin edebilirim. Bunu yapabilir miyim? Çünkü gerçekten eşleştirilmemiş rastgele bir deneme yaptıysanız, aynı sonucu elde edebilirsiniz. Sonra her bir grubun ortalamasını alabilirim (eşleştirme şeylerini görmezden gelebilirim) ve iki grup ortalamasının farkını alabilirim. Bu, E [Z] 'nin tarafsız bir tahmincisidir. Tahmincimin varyansı için sadece kullanıyorum ...
KevinKim

@MichaelChern X grubunun ve Y grubunun örnek varyansını seçin ve toplayın
KevinKim

7

Eşleştirmektense altta yatan veri modelini anlamak daha iyidir. Eğer kontrolsüz heterojenlik ile başa çıkmak için eşleştirme yapılırsa, eşleştirme genellikle bu değişkenlik kaynağını kısmen kontrol eder ve çoklu regresyon daha iyi olur. Bunun nedeni, sürekli değişkenler üzerinde eşleşmenin, bu tür değişkenler üzerinde tam eşleme yapamaması nedeniyle sık sık artık değişkenliğe neden olmasıdır.


2
Hepimiz gerileme yapsak, neden Deneysel Tasarım üzerine kitaplar, David Cox'un kitabı gibi, biyolojik deneylerde eşleştirmenin veya gruplandırmanın önemini vurguluyor? Eşleştirme, regresyonda gizli doğrusal bağımlılık varsayımını önler. Ama belki başka sebepler de var: kimse ??
David Epstein

6

İki test (eşleştirilmiş ve eşleştirilmemiş), farklı cevaplar alabilmeleri için farklı sorular sorar. Doğru eşleme neredeyse her zaman eşleştirmeden daha güçlüdür - bu gerçekten eşleştirmenin noktasıdır. Bu nedenle, eşleştirmenin doğru olduğunu söylediğiniz için, eşleştirilmiş testiniz için p değerinin eşleştirilmemiş aynı verilerden daha düşük olması muhtemeldir. Elbette her ikisini de yapabilir ve kendiniz görebilirsiniz.

Bu nedenle, ikileminizin cevabı istatistiksel değildir, önemlidir. Eşleştirmeniz doğru mu?

Rastgele eşlemeden, eşleştirilmemiş bir testten daha önemli bir sonuç elde edebilir misiniz? Bakalım:

set.seed(2910110192)
x <- rnorm(100, 10, 2)
y <- rnorm(100, 10, 2)
t.test(x, y)
t.test(x, y, paired = T)

Evet, burada fark çok küçük olmasına rağmen, eşleştirilmiş daha düşük bir p'ye sahipti. Bu kodu birkaç kez çalıştırdım. Şaşırtıcı olmayan bir şekilde, bazen bir p daha düşük, bazen diğeri daha düşüktür, ancak her durumda fark küçüktü. Ancak, bazı durumlarda p değerlerindeki farkın büyük olabileceğinden eminim.


Cevabınız için teşekkürler, ancak sorum sistematik farklılıklar istedi . Açıkçası, uzun bir x ve y serisinde, x ve y bazen çok iyi eşlenmiş gibi ve bazen de kasten kötü bir şekilde eşleştirilmiş gibi görünüyorlar. Elbette, x ve y'yi rastgele seçerken, p değerlerinin dağılımının iki testte aynı olup olmadığı istatistiksel bir sorudur. Sanırım daha fazla teorik istatistik bilen biri için p-değerlerinin iki teorik dağılımını gerçekte hesaplamam çok zor olmamalı. Benim tahminim onlar aynı.
David Epstein

Katıldığım gerçek durumda, eşleştirilmemiş için p değeri .04 civarında ve eşleştirilmiş .001 içindi. Eleştirel biyologa göre, alıntı yapmalıyız .04. Bana göre, p-değerindeki iyileşme eşleşmemizin geçerli olduğunu güçlü bir şekilde göstermektedir. Burada istatistiklerde, nesnel bir cevapla objektif bir soru olduğunu ve bunun sadece belirli eşleştirmenin geçerliliği hakkında iyi bir biyolojik yargılama sorunu olmadığını iddia ediyorum - ikincisi Peter Flom'un ve kritik biyolog.
David Epstein

1
Bence istatistikler hikayeyi anlatıyor. Her iki sonuç da açıklanmalıdır, ancak veriler doğru olduğu ve korelasyon açıklanabildiği sürece, eşleştirilmiş test daha doğrudur, çünkü korelasyonu dikkate alır.
Michael R.Chernick

5

Eşleştirilmiş ve eşleştirilmemiş t-testleri ve ilişkili p-değerleri konusunda beni endişelendiren şeyin ne olduğunu daha iyi anlıyorum. Öğrenmek ilginç bir yolculuktu ve yol boyunca birçok sürpriz oldu. Bir sürpriz Michael'ın katkısının soruşturulmasıyla sonuçlandı. Bu pratik tavsiye açısından geri alınamaz. Dahası, neredeyse tüm istatistikçilerin inandığını düşündüğümü söylüyor ve bunu destekleyecek birkaç oyu var. Bununla birlikte, bir teori parçası olarak, kelimenin tam anlamıyla doğru değildir. Bunu, p-değerleri için formüller üzerinde çalışarak ve sonra karşı örneklere yol açmak için formülleri nasıl kullanacağını dikkatlice düşünerek keşfettim. Ben eğitimle bir matematikçiyim ve karşı örnek bir "matematikçinin karşı örneğidir". Pratik istatistiklerde karşılaşacağınız bir şey değil, orijinal sorumu sorduğumda öğrenmeye çalıştığım şey.

Karşı örneği veren R kodu:

vLength <- 10; meanDiff <-10^9; numSamples <- 3;
pv <- function(vLength,meanDiff) {
    X <- rnorm(vLength)
    Y <- X - meanDiff + rnorm(vLength,sd=0.0001)
    Paired <- t.test(X,Y,var.equal=T,paired=T)
    NotPaired <- t.test(X,Y,var.equal=T,paired=F)
    c(Paired$p.value,NotPaired$p.value,cov(X,Y))
}
ans <- replicate(numSamples,pv(vLength,meanDiff))

Aşağıdaki özelliklere dikkat edin: X ve Y, farkı çok büyük ve neredeyse sabit olan iki 10'lu tupledir. Birçok anlamlı rakama göre korelasyon 1.000'dir. Eşleştirilmemiş testin p değeri, eşleştirilmiş testin p değerinden yaklaşık 10 ^ 40 kat daha küçüktür. Yani bu, hesabını tam anlamıyla, matematikçi tarzı okumak şartıyla, Michael'ın hesabıyla çelişir. Cevabımın Michael'ın cevabı ile ilgili kısmı burada sona eriyor.


İşte Peter'ın cevabının getirdiği düşünceler. Orijinal sorumun tartışılması sırasında, bir yorumda farklı görünen p-değerlerinin iki özel dağılımının aslında aynı olduğunu tahmin ettim. Şimdi bunu ispatlayabilirim. Daha da önemlisi, ispatın bir p-değerinin temel doğasını açığa çıkarmasıdır, o kadar temeldir ki, hiçbir metin (karşılaştığım) açıklamak rahatsız etmez. Belki de tüm profesyonel istatistikçiler sırrı bilir, ama bana göre p-değerinin tanımı her zaman garip ve yapay görünüyordu. İstatistikçinin sırrını vermeden önce soruyu belirteyim.

n>1n2(n-1)n-1özgürlük derecesi. Bu iki dağılım farklıdır, bu yüzden p değerlerinin ilişkili dağılımları nasıl olabilir? Ancak çok daha fazla düşünmeden sonra, varsayımın bu bariz şekilde işten çıkarılmasının çok kolay olduğunu fark ettim.

f:(0,)(0,)[0,1]

p=tf(s)ds
f(-,)[0,)

[0,1]

n-1[0,1]2(n-1)[0,1][0,1]


P-değerinin herhangi bir gizemli parçası olduğunu düşünmüyorum. Bazı insanlar bununla zor zamanlar geçirir. Sıfır hipotezi DOĞRU olduğunda gerçekte gözlemlenenden daha fazla veya aşırı olarak bir değer gözlemleme olasılığıdır. Bence formüllerinizden birinde haklısınız. Sanırım p-değerlerinin eşit dağıldığını söylediniz. Evet, sıfır hipotezi doğru olduğunda buna katılıyorum. T testinizle sıfır hipotezinin doğru olmayabileceğini unutmayın. O zaman p değeri eşit değildir. 0'a daha yakın konsantre olmalıdır.
Michael R. Chernick

İkinci olarak, iki farklı test istatistikinden bahsediyoruz. Biri eşleştirmeye, diğeri örneğinizde değil. Cevabımda belirtip söylemediğim, eşleşmemiş t testinin 2n-2 serbestlik dereceli merkezi bir t dağılımı varken, eşleştirilmiş t testinin karşılık gelen t dağılımının n-1 serbestlik derecesi vardır. Bu nedenle, daha fazla serbestlik derecesine sahip olan, standart normal dağılıma diğerinden daha yakındır. Bu testleri gerçek verilere uyguladığınızda bunun önemi var mı? Hayır! N oldukça büyük olduğunda değil.
Michael R.Chernick

Bir yan not olarak, eşleştirilmiş testin bir sınırlaması, tüm verilerin eşleştirilebilmesi durumunda sahip olmanız gereken eşit örnek boyutu gerektirir. Ancak eşleştirilmemiş test, eşit olmayan örnek boyutları ile geçerlidir. Bu yüzden genel olarak eşleştirilmemiş testin n + m-2 serbestlik derecesi vardır.
Michael R.Chernick

Cevabınız uzun ve soyut ve ben bunun üzerinden geçmeye çalıştım ama karşı örneği anlamadım. Sıfır hipotezini ve gerçek verileri nerede dikkate aldığınızı görmüyorum. Gözlenen p değeri, veriler verilen test istatistiği için uygun t dağılımının integralidir. Bu sayıları iki t dağılımı ve aynı ortak veri seti için karşılaştırırsınız. Gözlenen verileri koşullandırırsanız, bu tekdüze dağılımlar bir rol oynamaz. Üzgünüm ama cevabınızın sorunuza gerçekten cevap verdiğini görmüyorum.
Michael R.Chernick

Michael: Verdiğim R koduna odaklan. Çalışması sadece bir saniye sürer. Sıfır hipotezi, X ve Y'nin benim durumumda elbette çılgınca yanlış olan aynı normal dağılımdan gelmesidir. Örneğimde Cov (X, Y)> 0 ve yine de eşleştirilmemiş test eşleştirilmiş testten daha fazla önem veriyor.
David Epstein

1

Başka bir bakış açısı öneririm. Çoğunlukla eşleştirme yapılır, önyargıyı azaltır. E maruziyetinin sürekli bir sonuç Y için bir risk faktörü olup olmadığına ilgi duyduğunuzu varsayalım. Her E + öznesi için, E- olan yaş ve cinsiyet uyumlu bir özne elde edersiniz. Şimdi, eşleştirilmiş bir t-testi veya eşleştirilmemiş bir t-testi yapabiliriz. Açıkça eşleştirmeyi hesaba katmalı ve eşleştirilmiş bir t testi yapmalıyız. Tasarımı dikkate alması daha prensiplidir. Analizde eşleşmenin dikkate alınıp alınmayacağı, sapma-varyans dengesinin bir konusudur. Analizde eşleşmenin muhasebeleştirilmesi yanlılığa karşı daha fazla koruma sağlar, ancak varyansı artırabilir. Eşleştirilmemiş bir t testi yapmak daha verimli olabilir, ancak yanlılığa karşı herhangi bir koruma sağlamaz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.