Tekrarlanan ölçümler için lmer kullanımı doğrusal karışık efekt modeli


41

EDIT 2: Başlangıçta bir faktör üzerinde tekrarlanan önlemlerle iki faktörlü bir ANOVA çalıştırmam gerektiğini düşündüm, ama şimdi doğrusal bir karma etki modelinin verilerim için daha iyi çalışacağını düşünüyorum. Sanırım ne olması gerektiğini neredeyse biliyorum, ama hala birkaç noktayla kafam karıştı.

Analiz etmem gereken deneyler şöyle gözüküyor:

  • Denekler birkaç tedavi grubundan birine atandı
  • Her konunun ölçümleri birden fazla gün alındı
  • Yani:
    • Konu tedavi içinde yuvalanmış
    • Tedavi gün ile geçti

(her denek sadece bir tedaviye atanır ve her gün her denekte ölçümler alınır)

Veri setim aşağıdaki bilgileri içerir:

  • Konu = engelleme faktörü (rastgele faktör)
  • Gün = özne içinde veya tekrarlanan önlemler faktörü (sabit faktör)
  • Tedavi = konu faktörü arasında (sabit faktör)
  • Obs = ölçülen (bağımlı) değişken

GÜNCELLEME Tamam, ben de gittim ve bir istatistikçiyle konuştum, ama o bir SAS kullanıcısı. Modelin olması gerektiğini düşünüyor:

Tedavi + Gün + Konu (Tedavi) + Gün * Konu (Tedavi)

Açıkçası, notasyonu R sözdiziminden farklı, ancak bu modelin aşağıdakileri hesaba katması gerekiyordu:

  • Tedavi (sabit)
  • Gün (sabit)
  • Tedavi * Gündüz etkileşimi
  • Tedavi içinde iç içe geçmiş konu (rastgele)
  • "Tedavi İçindeki Konu" ile geçen gün (rastgele)

Yani, bu kullanmak için doğru sözdizimi mi?

m4 <- lmer(Obs~Treatment*Day + (1+Treatment/Subject) + (1+Day*Treatment/Subject), mydata)

Özellikle “Tedavi İçindeki Konu” kısmının geçtiğinin doğru olup olmadığı konusunda endişeliyim. SAS ile aşina olan ya da kendi modelinde neler olup bittiğini anladığından emin olan ve R sözdizimindeki üzücü girişimin uyuşup uyuşmadığı konusunda yorum yapabilen var mı?

Bir model oluşturma ve sözdizimi yazma konusundaki önceki girişimlerim (cevaplar ve yorumlar bölümünde tartışılmıştır):

m1 <- lmer(Obs ~ Treatment * Day + (1 | Subject), mydata)

Bireyin tedavi içinde yuvalanmış olduğu gerçeğiyle nasıl başa çıkabilirim? Nasıl m1farklıdır:

m2 <- lmer(Obs ~ Treatment * Day + (Treatment|Subject), mydata)
m3 <- lmer(Obs ~ Treatment * Day + (Treatment:Subject), mydata)

ve vardır m2ve m3(neden, değilse ve) eşdeğer?

Ayrıca, korelasyon yapısını (gibi correlation = corAR1) belirtmek istersem lme4 yerine nlme kullanmam gerekir mi? Tekrarlanan Ölçümlere göre , bir faktör üzerinde tekrarlanan ölçümlerle tekrarlanan ölçümler analizi için, kovaryans yapısı (aynı konunun ölçümleri arasındaki korelasyonun niteliği) önemlidir.

Tekrarlanan ANOVA ölçümleri yapmaya çalışırken, Tip II SS kullanmaya karar verdim; Bu hala geçerli mi, ve eğer öyleyse, bunu belirlemeye nasıl devam edebilirim?

İşte verilerin nasıl göründüğüne bir örnek:

mydata <- data.frame(
  Subject  = c(13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 29, 30, 31, 32, 33, 
               34, 35, 36, 37, 38, 39, 40, 62, 63, 64, 65, 13, 14, 15, 16, 17, 18, 
               19, 20, 21, 22, 23, 24, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 
               40, 62, 63, 64, 65, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 
               29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 62, 63, 64, 65), 
  Day       = c(rep(c("Day1", "Day3", "Day6"), each=28)), 
  Treatment = c(rep(c("B", "A", "C", "B", "C", "A", "A", "B", "A", "C", "B", "C", 
                      "A", "A", "B", "A", "C", "B", "C", "A", "A"), each = 4)), 
  Obs       = c(6.472687, 7.017110, 6.200715, 6.613928, 6.829968, 7.387583, 7.367293, 
                8.018853, 7.527408, 6.746739, 7.296910, 6.983360, 6.816621, 6.571689, 
                5.911261, 6.954988, 7.624122, 7.669865, 7.676225, 7.263593, 7.704737, 
                7.328716, 7.295610, 5.964180, 6.880814, 6.926342, 6.926342, 7.562293, 
                6.677607, 7.023526, 6.441864, 7.020875, 7.478931, 7.495336, 7.427709, 
                7.633020, 7.382091, 7.359731, 7.285889, 7.496863, 6.632403, 6.171196, 
                6.306012, 7.253833, 7.594852, 6.915225, 7.220147, 7.298227, 7.573612, 
                7.366550, 7.560513, 7.289078, 7.287802, 7.155336, 7.394452, 7.465383, 
                6.976048, 7.222966, 6.584153, 7.013223, 7.569905, 7.459185, 7.504068, 
                7.801867, 7.598728, 7.475841, 7.511873, 7.518384, 6.618589, 5.854754, 
                6.125749, 6.962720, 7.540600, 7.379861, 7.344189, 7.362815, 7.805802, 
                7.764172, 7.789844, 7.616437, NA, NA, NA, NA))

Yanıtlar:


18

Yaklaşımınızın doğru olduğunu düşünüyorum. Model m1her konu için ayrı bir engelleme belirler. Model m2her konu için ayrı bir eğim ekler. Eğiminiz günler boyuncadır çünkü denekler sadece bir tedavi grubuna katılır. Aşağıdaki m2gibi bir model yazarsanız, her bir konu için ayrı bir engelleme ve eğim modellemeniz daha açıktır.

m2 <- lmer(Obs ~ Treatment * Day + (1+Day|Subject), mydata)

Bu eşdeğerdir:

m2 <- lmer(Obs ~ Treatment + Day + Treatment:Day + (1+Day|Subject), mydata)

Yani tedavinin ana etkileri, gün ve ikisi arasındaki etkileşim.

Tedavi grupları içindeki konu kimliğini tekrar etmediğiniz sürece yuva yapmaktan endişe duymanıza gerek olmadığını düşünüyorum. Hangi model doğrudur, gerçekten araştırma sorunuza bağlıdır. Tedavi etkisine ek olarak deneklerin eğimlerinin de değiştiğine inanmak için sebep var mı? Her iki modeli de çalıştırabilir anova(m1,m2)ve verilerin ikisini de destekleyip desteklemediğini görmek için bunları karşılaştırabilirsiniz .

Modelle ne ifade etmek istediğinizi bilmiyorum m3? Yuvalama sözdizimi /, örneğin a kullanır (1|group/subgroup).

Bu kadar az zaman noktasıyla oto-korelasyon konusunda endişelenmeniz gerektiğini düşünmüyorum.


Bu doğru değil. Tedavi bir seviye-2 değişkenidir, denekler içinde yuvalanamaz.
Patrick Coulombe

Otokorelasyon ve zaman noktalarının sayısı hakkında: Bu örnek verilerde sadece üç tane gösterdim, ancak gerçek verilerim 8 farklı günde gözlemler içeriyor, bu yüzden muhtemelen bir sorun olacağını düşünüyorum. Bunu nasıl koyacağına dair bir fikrin var mı?
fosforlu

1
Ayrıca, şimdi yuvalama konusunda kafam oldukça karıştı; (1 + Tedavi | Konu) 'dan (1 + Tedavi / Konu)' dan farklı mı? "|" Ne yapar , düz İngilizce olarak? Okuduğum açıklamaları anlamıyorum.
fosforlu

Selam. Burada "her konu için ayrı bir eğim" nedir? çünkü konu sürekli değişken değil faktör değişkendir.
skan

12

Otomatik olarak ilişkili hatalarınız hakkında (ya da lme4 ile nlme'deki farklı uygulamalar hakkında) yorum yapmak için yeterince rahat hissetmiyorum, ancak geri kalanıyla konuşabilirim.

Modeliniz m1(Günün etkisi Tedavi grupları arasında değişmesine izin verilir) Eğer Tedavi ve Day arasındaki çapraz seviyede etkileşim dahil ettik rastgele kesişim modelidir. Zaman içindeki değişimin katılımcılar arasında farklılık göstermesine izin vermek için (yani zaman içindeki değişimin bireysel farklarını açıkça modellemek için), Günün etkisinin rastgele olmasına izin vermeniz gerekir . Bunu yapmak için, şunu belirtirsiniz:

m2 <- lmer(Obs ~ Day + Treatment + Day:Treatment + (Day | Subject), mydata)

Bu modelde:

  • Tedavi referans kategorisi için Gündeki öngörülen puanın = 0 olması durumunda müdahale
  • Gün katsayısı, tedavi referans kategorisi için gün içindeki her 1 birimlik artış için zaman içinde öngörülen değişimdir.
  • Tedavi grupları için iki sahte kodun katsayıları (otomatik olarak R tarafından yaratılır), kalan her bir tedavi grubu ile Gün = 0'daki referans kategorisi arasındaki öngörülen farktır.
  • İki etkileşim terimine ilişkin katsayılar, zamanın (Gün) referans kategorisi ve kalan tedavi grupları arasında öngörülen skorlar üzerindeki etkisindeki farktır.

Hem yakalama hem de Günün puan üzerindeki etkisi rastgeledir (her bireyin Gün = 0'da farklı bir tahmin puanı ve zaman içinde farklı bir doğrusal değişime sahip olmasına izin verilir). Kavramalar ve eğimler arasındaki kovaryans da modellenmiştir (kovarlanmalarına izin verilir).

Görebileceğiniz gibi, iki kukla değişken için katsayıların yorumlanması Gün = 0'da şartlıdır. Referans kategorisi için Gün = 0'daki öngörülen puanın, kalan iki tedavi grubundan önemli ölçüde farklı olup olmadığını size söyleyecektir. Bu nedenle, Gün değişkeninizi merkezlemeye karar verdiğiniz yerde önemlidir. Eğer 1. Gününde merkezi, o zaman katsayıları referans kategorisi için öngörülen puanı olmadığı konusunda bilgi 1. Gününde kalan iki grubun tahmin puanından önemli farklar var. Bu şekilde, gruplar arasında önceden var olan farklılıklar olup olmadığını görebilirsiniz . Eğer 3. Günde merkezlenirseniz, katsayılar size 3. Günde referans kategorisi için öngörülen puanın olup olmadığını söyler.kalan iki grubun öngörülen puanlarından önemli ölçüde farklıdır. Bu şekilde, müdahalenin sonunda gruplar arasında farklılıklar olup olmadığını görebilirsiniz .

Son olarak, Konular olan notu o değil Tedavisi yerleştirildi. Üç tedaviniz, sonuçlarınızı genelleştirmek istediğiniz bir seviyeler popülasyonunun rastgele seviyeleri değildir - aksine, sizin de belirttiğiniz gibi, seviyeleriniz sabittir ve sonuçlarınızı yalnızca bu seviyelere genellemek istiyorsunuz. (Sadece 3 üst seviye üniteniz varsa, çok seviyeli modellemeyi kullanmamalısınız; Maas ve Hox, 2005'e bakınız.) Bunun yerine, tedavi seviye 2 belirleyicisidir, yani Günler boyunca tek bir değer alan bir tahmin cihazıdır. Her konu için (seviye-1 adet). Bu nedenle, yalnızca modelinize bir yordayıcı olarak dahil edilir.

Referans:
Maas, CJM ve Hox, JJ (2005). Çok seviyeli modelleme için yeterli örneklem büyüklüğü. Metodoloji: Avrupa Davranış ve Sosyal Bilimler Araştırma Yöntemleri Dergisi , 1 , 86-92.


1
Gözlemci tarafından tahmin edilemez, çünkü obs sayısı <= sayı rasgele etkiler ve artık değişkenlik muhtemelen tanımlanamaz.
Shuguang

Cevaptaki formül yapısı doğru. @Shuguang tarafından belirtilen hatayı geçersiz kılmak için, eklemeniz gerekir ...,control=lmerControl(check.nobs.vs.nRE="ignore"). Ben Bolker tarafından daha fazla açıklama için bu bağlantıya bakın .
NiuBiBang

Güzel açıklamalar. Lütfen neden “Tedavi içerisinde iç içe geçmediğini” ve neden + (Tedavi | Konu) hata terimi oluşturmadığını ve neden sadece (1 | Konu) veya hatta (1 | Tedavi * Gün) yaratmadığınızı açıklayabilir misiniz? )?
skan

Teknik olarak siz olabilir tedavi içinde yuva denekler, belirleyicisi olursa olsun denemesi çalıştırdı kaç kez aynı olacaktır biridir ancak, eğer sabit bir (bir rastgele) etkisi olması gerekir. Faktörler ediyorum onların başlangıç değeri veya zaman içinde tedavi değişikliklere de kendilerine göre bir yanıt örneğin - - Böyle konunun bireysel özellikleri gibi deney, ran her defasında farklı bir rasgele etkileridir. (1 + Day|Subject)her bireyin başlangıç ​​değerinin (Kesişme) ve sonuçtaki değişiklik oranının farklı olmasına izin veren rastgele bir eğim modeli anlamına gelir.
llewmills
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.