Lineer karma etkili modellemenin özel bir örneği olarak eşleştirilmiş t-testi


20

Eşleştirilmiş bir t -testinin, R'de nlme paketiyle gösterilebilen lineer karışık etkili modelin yanı sıra tek yönlü tekrarlanan ölçümlerin (veya öznenin içinde) özel bir örneği olduğunu biliyoruz. Aşağıda gösterildiği gibi.

#response data from 10 subjects under two conditions
x1<-rnorm(10)
x2<-1+rnorm(10)

# Now create a dataframe for lme
myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), rep(paste("S", seq(1,10), sep=""), 2))
names(myDat) <- c("y", "x", "subj")

Aşağıdaki eşleştirilmiş t-testini çalıştırdığımda:

t.test(x1, x2, paired = TRUE)

Bu sonucu aldım (rastgele jeneratör nedeniyle farklı bir sonuç alacaksınız):

t = -2.3056, df = 9, p-value = 0.04657

ANOVA yaklaşımı ile aynı sonucu elde edebiliriz:

summary(aov(y ~ x + Error(subj/x), myDat))

# the F-value below is just the square of the t-value from paired t-test:
          Df  F value Pr(>F)
x          1  5.3158  0.04657

Şimdi iki model için pozitif-kesin bir simetrik korelasyon matrisi varsayarak, aşağıdaki modelle aynı sonucu elde edebilirim:

summary(fm1 <- lme(y ~ x, random=list(subj=pdSymm(form=~x-1)), data=myDat))

# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.3142115  9 -0.7918878  0.4488
# xx2          1.3325786 0.5779727  9  2.3056084  0.0466

Veya iki durumun korelasyon matrisi için bileşik bir simetri varsayarak başka bir model:

summary(fm2 <- lme(y ~ x, random=list(subj=pdCompSymm(form=~x-1)), data=myDat))

# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.4023431  9 -0.618428  0.5516
# xx2          1.3325786 0.5779727  9  2.305608  0.0466

Eşleştirilmiş t-testi ve tek yönlü tekrarlanan ölçümler ANOVA ile, geleneksel hücre ortalama modelini şöyle yazabilirim:

Yij = μ + αi + βj + εij, i = 1, 2; j = 1, ..., 10

burada i indeksi indeksler, j konusu indeksler, Y ij cevap değişkenidir, μ genel ortalama için sabit etki için sabittir, α i koşul için sabit efekttir, β j N (0, σ'yı takip eden konu için rastgele etkidir p 2 ) (σ p 2 ) kitle varyansı ve ε ij kalıntı olduğu σ N (0 aşağıdaki 2 σ () 2 ) içi konu varyansını.

Yukarıdaki hücre ortalama modelinin lme modelleri için uygun olmayacağını düşündüm, ama sorun şu ki, korelasyon yapısı varsayımı ile iki lme () yaklaşımı için makul bir model bulamıyorum. Bunun nedeni, lme modelinin rastgele bileşenler için yukarıdaki hücre ortalama modelinden daha fazla parametreye sahip gibi görünmesidir. En azından lme modeli tam olarak aynı F-değerini, serbestlik derecesini ve p-değerini sağlar; Daha spesifik olarak gls, her bir deneğin iki gözlemi olduğu gerçeğini açıklamaması nedeniyle yanlış DF'ler verir ve bu da çok şişirilmiş DF'lere yol açar. Lme modeli büyük olasılıkla rastgele efektlerin belirlenmesinde aşırı parametrelendirilir, ancak modelin ne olduğunu ve parametrelerin ne olduğunu bilmiyorum. Yani sorun hala benim için çözülmedi.


2
Ne istediğini tam olarak bilmiyorum. Yazdığınız model tam olarak rastgele efektler modelidir; korelasyon yapısı rastgele etkiden kaynaklanır.
Aaron - Monica'yı eski

@Aaron: hücre ortalama modelindeki rasgele etki βj'nin N (0, σp2) izlemesi beklenir. Benim karışıklığım, bu terim (sadece bir parametre σp2 ile) bileşik simetri veya lme ​​modelinde basit bir simetrik matris tarafından belirtilen korelasyon yapısı ile nasıl ilişkilidir?
Şubat'ta bluepole

Aynı konudaki iki gözlem arasındaki korelasyonu hesapladığınızda, korelasyon aynı beta_j'yi paylaştıkları için sigma_p ^ 2 / (sigma_p ^ 2 + sigma ^ 2) olur. Bkz. Pinheiro / Bates s.8. Ayrıca, yazdığınız rastgele etki modeli bileşik simetriye eşdeğerdir; diğer korelasyon yapıları daha karmaşıktır.
Aaron - Monica'yı eski

@Aaron: Teşekkürler! Bu konuda Pinheiro / Bates kitabını zaten okudum ve hala rastgele efektlerle ilgili ayrıntıları anlayamadım. Daha alakalı sayfalar P.160-161'deki örnek gibi görünmektedir. Ayrıca, lme () 'den bileşik simetri varsayımı ile elde edilen rastgele etkiler, hücre ortalama modelinde σp2 / (σp2 + σ2) korelasyonu ile uyumlu görünmemektedir. Hala model yapısı hakkında şaşkın.
bluepole

Neredeyse bileşik simetriye eşdeğer; CS'de korelasyon negatif olabilir ancak rastgele etkilerle olmayabilir. Belki de farkın ortaya çıktığı yer burasıdır. Ayrıntılar için stats.stackexchange.com/a/14185/3601 adresine bakın.
Aaron - Monica'yı eski

Yanıtlar:


16

Modellerin denkliği, aynı kişiden iki gözlem arasındaki korelasyonun aşağıdaki şekilde hesaplanmasıyla gözlemlenebilir:

Ybenj=μ+αben+βj+εbenjβj~N-(0,σp2)εbenj~N-(0,σ2)CÖv(ybenk,yjk)=CÖv(μ+αben+βk+εbenk,μ+αj+βk+εjk)=CÖv(βk,βk)=σp2Vbirr(ybenk)=Vbirr(yjk)=σp2+σ2σp2/(σp2+σ2)

Bununla birlikte, rastgele etki modeli korelasyonu pozitif olmaya zorladığı için modellerin oldukça eşdeğer olmadığını unutmayın. CS modeli ve t-testi / anova modeli yoktur.

EDIT: Başka iki fark daha var. İlk olarak, CS ve rastgele etki modelleri rastgele etki için normallik kabul eder, ancak t-testi / anova modeli bunu yapmaz. İkincisi, CS ve rastgele etki modelleri maksimum olasılık kullanılarak, anova ortalama kareler kullanılarak uygundur; her şey dengelendiğinde aynı fikirde olurlar, ancak daha karmaşık durumlarda olması gerekmez. Son olarak, modellerin ne kadar anlaştığının ölçüsü olarak çeşitli uyumlardan F / df / p değerlerini kullanmaktan kaçınırım; daha fazla bilgi için Doug Bates'ün df'lerde ünlü şapı bakın. (SON DÜZENLEME)

RKodunuzdaki sorun , korelasyon yapısını doğru bir şekilde belirtmemenizdir. Korelasyon yapısı glsile kullanmanız gerekir corCompSymm.

Konu etkisi olacak şekilde veri oluşturun:

set.seed(5)
x <- rnorm(10)
x1<-x+rnorm(10)
x2<-x+1 + rnorm(10)
myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), 
                    rep(paste("S", seq(1,10), sep=""), 2))
names(myDat) <- c("y", "x", "subj")

O zaman rastgele efektlere ve bileşik simetri modellerine nasıl uyacaksınız.

library(nlme)
fm1 <- lme(y ~ x, random=~1|subj, data=myDat)
fm2 <- gls(y ~ x, correlation=corCompSymm(form=~1|subj), data=myDat)

Rastgele efektler modelindeki standart hatalar şunlardır:

m1.varp <- 0.5453527^2
m1.vare <- 1.084408^2

Ve CS modelinden korelasyon ve artık varyans:

m2.rho <- 0.2018595
m2.var <- 1.213816^2

Ve beklenenlere eşitler:

> m1.varp/(m1.varp+m1.vare)
[1] 0.2018594
> sqrt(m1.varp + m1.vare)
[1] 1.213816

Diğer korelasyon yapıları genellikle rastgele etkilerle değil, sadece istenen yapının belirtilmesiyle uyumludur; yaygın bir istisna, rastgele bir etkiye sahip olan AR (1) + rastgele etki modelidir ve aynı rastgele etki üzerindeki gözlemler arasında AR (1) korelasyonudur.

EDIT2: Üç seçeneği sığdırdığımda, gls ilgi terimi için df tahmin etmeye çalışmak dışında tam olarak aynı sonuçları elde.

> summary(fm1)
...
Fixed effects: y ~ x 
                 Value Std.Error DF   t-value p-value
(Intercept) -0.5611156 0.3838423  9 -1.461839  0.1778
xx2          2.0772757 0.4849618  9  4.283380  0.0020

> summary(fm2)
...
                 Value Std.Error   t-value p-value
(Intercept) -0.5611156 0.3838423 -1.461839  0.1610
xx2          2.0772757 0.4849618  4.283380  0.0004

> m1 <- lm(y~ x + subj, data=myDat)
> summary(m1)
...
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)  -0.3154     0.8042  -0.392  0.70403   
xx2           2.0773     0.4850   4.283  0.00204 **

(Burada kesme farklıdır, çünkü varsayılan kodlama ile tüm konuların ortalaması değil, ilk konunun ortalamasıdır.)

Ayrıca, yeni lme4paketin aynı sonuçları verdiğini, ancak bir p değeri hesaplamaya çalışmadığını belirtmek de ilgi çekicidir .

> mm1 <- lmer(y ~ x + (1|subj), data=myDat)
> summary(mm1)
...
            Estimate Std. Error t value
(Intercept)  -0.5611     0.3838  -1.462
xx2           2.0773     0.4850   4.283

Yardım için tekrar teşekkürler! Bu kısmı hücre ortalama modeli açısından biliyorum. Bununla birlikte, bileşik simetri ile lme () 'nin aşağıdaki sonucu ile: Rastgele etkiler: Formül: ~ x - 1 | subj Yapısı: Bileşik Simetri StdDev xx1 1.1913363 xx2 1.1913363 Corr: -0.036 Kalıntı 0.4466733. Bu sayıları hala hücre ortalama modeliyle bağdaştıramıyorum. Belki bu sayıları çözmeme yardımcı olabilirsiniz?
bluepole

Ayrıca, model formülasyonu ile ilgili basit simetrik matris gibi diğer korelasyon yapıları hakkında herhangi bir düşünce?
bluepole

Anlıyorum! Diğer konudaki cevabınızı daha dikkatli okumalıydım. Daha önce gls () kullanmayı düşündüm, ancak korelasyon spesifikasyonunu anlayamadım. Rastgele etki için bileşik simetri yapısına sahip lme () 'nin hala aynı t-değerini oluşturduğu ilginçtir, ancak rastgele etkiler için varyanslar doğrudan yorumlanamaz gibi görünmektedir. Yardımın için sağol!
bluepole

Bazı 2. düşüncelerden sonra, orijinal karışıklığımın hala çözülmediğini hissediyorum. Evet, gls korelasyon yapısını ve ortalama kare romları göstermek için kullanılabilir, ancak altındaki model eşleştirilmiş t testi (veya genel olarak tek yönlü tekrarlanan ölçümler ANOVA) ile tam olarak aynı değildir ve böyle bir değerlendirme ayrıca gls'den yanlış DF'ler ve p değeri tarafından desteklenir. Buna karşılık, bileşik simetriye sahip lme komutum aynı F, DF'leri ve p-değerini sağlar. Şaşkın olduğum tek şey, lme modelinin orijinal yazımda belirtildiği gibi nasıl parametrelendirildiği. Orada yardım var mı?
bluepole

Size nasıl yardımcı olacağınızdan emin değilim. İki farklı modelin ne olduğunu düşündüğünüzü yazabilir misiniz? Bunlardan birini nasıl düşündüğünüzde bir şeyler yanlış.
Aaron - Monica'yı

3

Eşleştirilmiş t testi olarak aynı p değerlerini döndüren Kenward-Roger df yaklaşımı ile p değerlerini döndürmek için mixedpaketteki işlevi kullanmayı da düşünebilirsiniz afex:

library(afex)
mixed(y ~ x + (1|subj), type=3,method="KR",data=myDat) 

Veya

library(lmerTest)
options(contrasts=c('contr.sum', 'contr.poly'))
anova(lmer(y ~ x + (1|subj),data=myDat),ddf="Kenward-Roger")
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.