R'deki karışık modellerin lmer / lme karışık modellerini kontrol etme


25

Üç farklı görevde 30 erkek ve 30 kadını test ettiğim tekrarlanan bir tasarım yaptım. Erkeklerin ve kadınların davranışlarının nasıl farklı olduğunu ve bunun göreve nasıl bağlı olduğunu anlamak istiyorum. Bunu araştırmak için hem lmer hem de lme4 paketini kullandım, ancak her iki yöntem için de varsayımları kontrol etmeye çalışıyorum. Çalıştırdığım kod

lm.full <- lmer(behaviour ~ task*sex + (1|ID/task), REML=FALSE, data=dat)
lm.full2 <-lme(behaviour ~ task*sex, random = ~ 1|ID/task, method="ML", data=dat)

Etkileşim olmadan daha basit modelle karşılaştırarak ve bir anova çalıştırarak etkileşimin en iyi model olup olmadığını kontrol ettim:

lm.base1 <- lmer(behaviour ~ task+sex+(1|ID/task), REML=FALSE, data=dat)
lm.base2 <- lme(behaviour ~ task+sex, random= ~1|ID/task), method="ML", data=dat)
anova(lm.base1, lm.full)
anova(lm.base2, lm.full2)

S1: Bu kategorik belirleyicileri doğrusal karma modelde kullanmak uygun mudur?
S2: Doğru anlıyor muyum, sonuç değişkeninin ("davranış") normal olarak (cinsiyet / görevler arasında) dağıtılması gerekmiyor mu?
S3: Varyansın homojenliğini nasıl kontrol edebilirim? Basit bir doğrusal model için kullanıyorum plot(LM$fitted.values,rstandard(LM)). Kullanmak plot(reside(lm.base1))yeterli mi?
S4: Normallik kontrolü için aşağıdaki kodu kullanıyor mu?

hist((resid(lm.base1) - mean(resid(lm.base1))) / sd(resid(lm.base1)), freq = FALSE); curve(dnorm, add = TRUE)

Dikkatimi çeken bir şey de, kullandığım lme4'ün en son sürüm olmadığı ve bu nedenle basit arsaların (myModel.lm) çalışmadığı, belki de diğer okuyucuların bilmesi yararlı oluyor.
crazjo

Yanıtlar:


26

S1: Evet - sadece herhangi bir regresyon modelinde olduğu gibi.

S2: Genel doğrusal modellerde olduğu gibi, sonuç değişkeninizin normalde tek değişkenli bir değişken olarak dağıtılması gerekmez. Ancak, LME modelleri, modelin artıklarının normal dağıldığını varsaymaktadır. Bu yüzden modele dönüşüm veya ağırlık ekleme, bununla ilgilenmenin bir yolu olabilir (ve elbette tanı alanlarını kontrol etmek).

S3: plot(myModel.lme)

S4: qqnorm(myModel.lme, ~ranef(., level=2)). Bu kod, rastgele efektlerin her seviyesi için QQ grafikleri yapmanıza izin verecektir. LME modelleri, yalnızca küme içi artıkların normal dağıldığını değil, rastgele etkilerin her seviyesinin de olduğunu varsayar. Vary level0, 1, sen sıçan, görev ve içinde-konu artığı kontrol edebilmesi 2'ye.

EDIT: Ayrıca, normalliğin varsayıldığı ve dönüşümün normal olmayan hatalar / rastgele etkilerle ilgili sorunların azaltılmasına yardımcı olduğu halde, tüm sorunların gerçekte çözüldüğü ya da yanlılığın ortaya çıkmadığı açık değildir. Verileriniz dönüşüm gerektiriyorsa, rasgele etkilerin tahmini konusunda dikkatli olun. İşte adresleme kağıt var bu .


Cevabınız için teşekkürler. Yaptığım şeyin gerçekten doğru olup olmadığını görmek için çıktı içeren analiz için veri setimi ve senaryoyu paylaşmak istiyorum. Yığın değişiminde mümkün mü? Üstelik yanlış rastgele faktör (1 | sıçan / görev) koştum, değil mi (1 | sıçan)? Üç görevde 60'ar tane (her cinsiyetten 30'unu) test ettim.
crazjo

9
Geçenlerde Q4 kodunu denedim ve 'S4' nesnesiyle ilgili altküme edilemez bir hata aldım. Bu kod lme paketine uygun modeller için miydi? Peki ya lme4?
emudrak

S4 ile ilgili olarak, bu arsaları yapan insanların, üretilen parsellerin her birinin N'sinin toplamdan önemli ölçüde daha küçük olacağını ve bu nedenle arsaların çok daha değişken olacağını akılda tutmaları gerekir. Genel olarak tutarlı bir şekilde normal dağılmış olarak görünmelerini beklemeyin.
John

14

Çok seviyeli modelleri çevreleyen varsayımlar konusunda yanıltıcı görünüyorsunuz. Verilerde homojenlik değişkenliği varsayımı yoktur, sadece artıkların normalde dağılması gerektiği düşünülmektedir. Ve kategorik prediktörler her zaman regresyonda kullanılır (R'de ANOVA çalıştıran temel fonksiyon doğrusal regresyon komutudur).

Varsayımların incelenmesi ile ilgili detaylar için Pinheiro ve Bates kitabını inceleyin (s. 174, bölüm 4.3.1). Ayrıca, lme4'ü kullanmayı planlıyorsanız (kitabın etrafına yazılmamış), grafiklerini arsa kullanarak bir lmermodel ( ?plot.merMod) ile çoğaltabilirsiniz .

Hızlı bir şekilde normallik kontrol etmek için olur qqnorm(resid(myModel)).


Yorumun için teşekkürler. Lmer4'ü lmer4 metodu üzerinde kullanmanızı öneriyor musunuz? Ve cevap değişkeninin normal olarak dağılması gerekmediğini anlama konusunda haklı mıyım? Pinheiro ve Bates kitabını okudum.
crazjo

Ayrıca, qqnorm (kalıntı (myModel)) 'ı çoklu faktörlerin çalıştığı karma bir model üzerinde çalıştırdığınızdan emin misiniz?
crazjo

Yeni lmer işlevi daha fazla yetenek ve daha yüksek performansa sahiptir. Qqnorm'ı denediniz mi? Kitabın başındaki nasıl okunacağına ilişkin tavsiyelere uyun.
John

Başlangıçta garip görünüyordu komplo, muhtemelen gerçekten yeni lmer sürümüne sahip olmadığımdan. Bunu kaydettiğiniz için teşekkür ederiz, şimdi gerektiği gibi çalışıyor.
crazjo,

12

S2 ile ilgili:

Pinheiro ve Bates kitabına göre aşağıdaki yaklaşımı kullanabilirsiniz:

" lmeİşlev, hata içi grubun heteroscesdasticity'sinin bir weightsargüman yoluyla modellenmesine izin verir . Bu konu, § 5.2'de detaylı olarak ele alınacaktır, ancak şimdilik, varIdentvaryans fonksiyon yapısının her seviye için farklı varyanslara izin verdiğini bilmek yeterlidir . bir faktör ve heteroscedastik modele uyacak şekilde kullanılabilir [...] "

Pinheiro ve Bates, s. 177

Aranızdaki eşit sapma olup olmadığını kontrol etmek sexistiyorsanız, bu yaklaşımı kullanabilirsiniz:

plot( lm.base2, resid(., type = "p") ~ fitted(.) | sex,
  id = 0.05, adj = -0.3 )

Farklılıklar farklıysa, modelinizi aşağıdaki şekilde güncelleyebilirsiniz:

lm.base2u <- update( lm.base2, weights = varIdent(form = ~ 1 | sex) )
summary(lm.base2u)

Dahası, robustlmmtartım yaklaşımı kullanan pakete de bakabilirsiniz . Koller'in bu konseptle ilgili doktora tezi açık erişim ("Doğrusal Karışık Modellerin Sağlam Tahmini") olarak mevcuttur. Soyut devletler:

"Daha sonra yapılan sağlam testler için sağlam bir temel oluşturmak amacıyla yeni bir ölçek tahmini, Tasarım Uyarlamalı Ölçeği tahmini geliştirilmiştir. Bunu, artıkların doğal heteroskedasticitesini eşitlemek ve ölçeğin sağlam tahmin denklemini ayarlamak için yapar. Bu tasarım uyarlamalı düzeltmeleri, küçük örnek ayarlarında, gözlem sayısının yalnızca tahmin edilebilecek parametre sayısının yalnızca birkaç katı olabileceği yerlerde çok önemlidir. "



Yorumlar için yeterli puanım yok. Bununla birlikte, yukarıdaki @John'un cevabının bir kısmını açıklığa kavuşturma gerekliliğini görüyorum. Pinheiro ve Bates durumu s. 174:

Varsayım 1 - Grup içi hatalar bağımsızdır ve aynı şekilde normal olarak dağılır, ortalama sıfır ve σ2 değişkenleriyle ve rastgele etkilerden bağımsızdır.

Bu ifade aslında homojen farklılıklar hakkında net değil ve LME kavramının arkasındaki tüm matematiği bilmek için yeterince derin değilim. Ancak, s. 175, §4.3.1, Varsayım 1 ile ilgili bölümleri yazdıkları

Bu bölümde, grup içi hataların normal olarak dağıldığı, sıfır merkezli olduğu ve sabit varyansa sahip olduğu varsayımını değerlendirme yöntemleri üzerinde duruyoruz .

Ayrıca, aşağıdaki örneklerde " sabit varyanslar " gerçekten önemlidir. Bu nedenle, kişi , p'ye " aynı şekilde normal dağılmış" yazarken homojen farklılıklar ima edip etmediklerini tahmin edebilir . 174 daha doğrudan adreslemeden.


-6

S1: Evet, neden olmasın?

S2: Bence şart, hataların normal dağılmış olması.

S3: Örneğin, Leven'in testiyle test edilebilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.