Bileşik simetrisi durumunda (0 + faktör | grup) ve (1 | grup) + (1 | grup: faktör) rastgele etki spesifikasyonlarının denkliği


13

Douglas Bates, aşağıdaki modellerin "vektör değerli rasgele efektler için varyans-kovaryans matrisinin bileşik simetri adı verilen özel bir formu varsa" eşdeğer olduğunu belirtir ( bu sunumdaki slayt 91 ):

m1 <- lmer(y ~ factor + (0 + factor|group), data)
m2 <- lmer(y ~ factor + (1|group) + (1|group:factor), data)

Özellikle Bates bu örneği kullanır:

library(lme4)
data("Machines", package = "MEMSS")

m1a <- lmer(score ~ Machine + (0 + Machine|Worker), Machines)
m2a <- lmer(score ~ Machine + (1|Worker) + (1|Worker:Machine), Machines)

ilgili çıkışlarla:

print(m1a, corr = FALSE)

Linear mixed model fit by REML ['lmerMod']
Formula: score ~ Machine + (0 + Machine | Worker)
   Data: Machines
REML criterion at convergence: 208.3112
Random effects:
 Groups   Name     Std.Dev. Corr     
 Worker   MachineA 4.0793            
          MachineB 8.6253   0.80     
          MachineC 4.3895   0.62 0.77
 Residual          0.9616            
Number of obs: 54, groups:  Worker, 6
Fixed Effects:
(Intercept)     MachineB     MachineC  
     52.356        7.967       13.917  

print(m2a, corr = FALSE)

Linear mixed model fit by REML ['lmerMod']
Formula: score ~ Machine + (1 | Worker) + (1 | Worker:Machine)
   Data: Machines
REML criterion at convergence: 215.6876
Random effects:
 Groups         Name        Std.Dev.
 Worker:Machine (Intercept) 3.7295  
 Worker         (Intercept) 4.7811  
 Residual                   0.9616  
Number of obs: 54, groups:  Worker:Machine, 18; Worker, 6
Fixed Effects:
(Intercept)     MachineB     MachineC  
     52.356        7.967       13.917

Herkes modelleri arasındaki farkı açıklayabilir ve nasıl m1düşer m2sezgisel bir şekilde (verilen bileşik simetri)?


6
+1 ve imho, bu kesinlikle konuyla ilgili. Yeniden açmak için oy verin.
amip diyor ki Reinstate Monica

2
@Peter Flom bu soruyu neden konu dışı olarak değerlendiriyorsunuz?
statmerkur

3
Belki sentakstan ziyade modeller hakkında soru sorduğunuz açık değildi lme4. Eğer tanıdık olmayan insanlar için onları açıkladı yararlı - ve potansiyel cevaplar havuzunu genişletmek - yararlı olacaktır lme4.
Scortchi - Monica'yı eski durumuna döndürün

Kodlama ile ilgili gibi görünüyor.
Peter Flom - Monica'yı eski durumuna döndürün

1
Yararlıysa, burada lme4 sözdiziminin ne yaptığı ve karışık modeller bağlamında hangi bileşik simetrinin ne olduğu hakkında iki iyi mesaj vardır (her iki soru için kabul edilen cevaplara bakın). stats.stackexchange.com/questions/13166/rs-lmer-cheat-sheet ve stats.stackexchange.com/questions/15102/…
Jacob Socolar

Yanıtlar:


11

Bu örnekte, üç makinenin (A, B, C) ve altı işçinin her kombinasyonu için üç gözlem vardır. Ben kullanacağız bir göstermek için boyutlu kimlik matrisi ve bir ifade etmek için olanları boyutlu vektör. Diyelim ki gözlem vektörü, işçi tarafından sipariş edildikten sonra makine tarafından kopyalanacağını varsayıyorum. Let gelen beklenen değerler (örn sabit etkiler) ve izin beklenen değerler (ya da rasgele etkileri) grup özel sapmalar bir vektör olabilir. Üzerinde Şartlı , model yazılabilir:Inn1nnyμγγy

yN(μ+γ,σy2I54)

burada "artık" varyanstır.σy2

Rasgele etkilerin kovaryans yapısının gözlemler arasında bir kovaryans yapısını nasıl indüklediğini anlamak için , rasgele etkiler üzerine entegre olan eşdeğer "marjinal" temsil ile çalışmak daha sezgiseldir . Bu modelin marjinal şekli,γ

yN(μ,σy2I54+Σ)

Burada, yapısına bağlı olan bir kovaryans matrisidir (örneğin, rastgele etkilerin altında yatan "varyans bileşenleri"). "marjinal" kovaryans olarak değineceğim .ΣγΣ

İçinde m1, rastgele etkiler şu şekilde ayrışır:

γ=Zθ

Burada rastgele katsayıları gözlemlerle eşleyen bir tasarım matrisidir ve işçi ve makine tarafından sipariş edilen 18 kat rasgele katsayılar vektörüdür ve şu şekilde dağıtılır:Z=I1813θT=[θ1,A,θ1,B,θ1,Cθ6,A,θ6,B,θ6,C]

θN(0,I6Λ)

Burada rastgele katsayıların kovaryansıdır. Varsayımı bileşik simetri aracı arayacağım o iki parametresi vardır ve ve yapısı:ΛΛσθτ

Λ=[σθ2+τ2τ2τ2τ2σθ2+τ2τ2τ2τ2σθ2+τ2]

(Başka bir deyişle, altında yatan korelasyon matrisi, alt kenardaki tüm öğelere aynı değere ayarlanmıştır.)Λ

Bu rastgele etkilerin neden olduğu marjinal kovaryans yapısı , böylece belirli bir gözlemin varyansı ve ve makinelerinden gelen iki (ayrı) gözlem arasındaki kovaryans : Σ=Z(I6Λ)ZTσθ2+τ2+σy2i,ju,v

cov(yi,u,yj,v)={0if ijτ2if i=j,uvσθ2+τ2if i=j,u=v

Sizin için m2, rastgele etkiler ayrışır:

γ=Zω+Xη

Z, daha önce olduğu gibi, , çalışan başına rastgele kesişmeleri gözlemlerle eşleyen bir tasarım matrisidir, , her makine ve işçinin kombinasyonu için rastgele 18 boyutlu vektörüdür; ve , çalışan için rastgele kesişimlerin 6 boyutlu vektörüdür. Bunlar Nerede bu rastgele kesişmelerin varyanslarıdır.X=I619ωT=[ω1,A,ω1,B,ω1,C,,ω6,A,ω6,B,ω6,C]ηT=[η1,,η6]

ηN(0,ση2I6)
ωN(0,σω2I18)
ση2,σω2

Marjinal kovaryans yapısı m2olup , belirli bir gözlem varyansını böylece ve ve makinelerinden gelen iki gözlem arasındaki kovaryans : : Σ=σω2ZZT+ση2XXTσω2+ση2+σy2i,ju,v

cov(yi,u,yj,v)={0if ijση2if i=j,uvσω2+ση2if i=j,u=v

Yani ... ve . Eğer (rastgele etkiler kovaryans yapılandırılmamış olduğu için, llmer için çağrı ile değil) kabul bileşik simetri. τ 2σ 2 ησθ2σω2τ2ση2 m1

Kısalık benim güçlü noktam değil: bu, her modelin rastgele etkiler için iki varyans parametresine sahip olduğunu ve aynı "marjinal" modeli yazmanın sadece iki farklı yolu olduğunu söylemenin sadece uzun ve kıvrımlı bir yoludur.

Kodda ...

sigma_theta <- 1.8
tau         <- 0.5
sigma_eta   <- tau
sigma_omega <- sigma_theta
Z <- kronecker(diag(18), rep(1,3))
rownames(Z) <- paste(paste0("worker", rep(1:6, each=9)), 
                     rep(paste0("machine", rep(1:3, each=3)),6))
X <- kronecker(diag(6), rep(1,9))
rownames(X) <- rownames(Z)
Lambda <- diag(3)*sigma_theta^2 + tau^2

# marginal covariance for m1:
Z%*%kronecker(diag(6), Lambda)%*%t(Z)
# for m2:
X%*%t(X)*sigma_eta^2 + Z%*%t(Z)*sigma_omega^2

1
Çok güzel bir cevap! Ama bence, aynı üç makine birden fazla (aslında her) işçi seviyesinde göründüğü için "işçi içinde yuvalanmış makine" ifadesi yanıltıcı olabilir.
statmerkur

@statmerkur Teşekkürler, bu çizgiyi açıklığa kavuşturmaya çalıştım. Başka bir öneriniz varsa bana bildirin.
Nate Pope

1
Meli olarak tanımlanabilir ? X = I 61 9XX=I619
S. Catterall Monica'yı Yeniden

1
@ S.Catterall Yup, bu bir yazım hatası - yakaladığınız için teşekkürler! Cevabımı düzelttim.
Nate Pope

2
@statmerkur ne demek istediğini açıklayabilir misin? Burada sürekli ortak değişkenler yok, bu yüzden "eğim" ile ne demek istediğinizden emin değilim. Modeli düşündüğüm yol, makineler arasındaki yanıtın (sabit etkiler) ortalamasında sistematik farklılıklar olmasıdır; daha sonra her işçi için rastgele bir sapma (rastgele kesişmeler / işçi); daha sonra her bir makine-işçi kombinasyonu için rastgele bir sapma; ve son olarak gözlem başına rastgele bir sapma. İşçi başına rastgele sapmaların sapması ne kadar büyük olursa, belirli bir işçiden daha fazla ilişkili gözlemler, vb.
Nate Pope
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.