REML ve ML stepAIC


10

En iyi modeli veya modelleri seçmek için AIC'yi kullanarak karışık model analizimi nasıl yürüteceğime dair literatürü araştırmaya çalıştıktan sonra bunalmış hissediyorum. Verilerimin bu kadar karmaşık olduğunu düşünmüyorum, ancak yaptığımın doğru olduğunu doğrulamak için arıyorum ve sonra nasıl ilerleyeceğiniz konusunda tavsiyede bulunuyorum. Lme veya lmer kullanmam gerekip gerekmediğinden emin değilim ve sonra bunlardan biriyle, REML veya ML kullanmam gerekirse emin değilim.

Bir seçim değere sahibim ve hangi değişkenlerin bu değeri en iyi etkilediğini ve tahminlere izin verdiğini bilmek istiyorum. İşte bazı örnek veriler ve benim çalıştığım test kodumu:

ID=as.character(rep(1:5,3))
season=c("s","w","w","s","s","s","s","w","w","w","s","w","s","w","w")
time=c("n","d","d","n","d","d","n","n","n","n","n","n","d","d","d")
repro=as.character(rep(1:3,5))
risk=runif(15, min=0, max=1.1)
comp1=rnorm(15, mean = 0, sd = 1)
mydata=data.frame(ID, season, time, repro, risk, comp1)
c1.mod1<-lmer(comp1~1+(1|ID),REML=T,data=mydata)
c1.mod2<-lmer(comp1~risk+(1|ID),REML=T,data=mydata)
c1.mod3<-lmer(comp1~season+(1|ID),REML=T,data=mydata)
c1.mod4<-lmer(comp1~repro+(1|ID),REML=T,data=mydata)
c1.mod5<-lmer(comp1~time+(1|ID),REML=T,data=mydata)
c1.mod6<-lmer(comp1~season+repro+time+(1|ID),REML=T,data=mydata)
c1.mod7<-lmer(comp1~risk+season+season*time+(1|ID),REML=T,data=mydata)

Ben bu verileri çeşitli kombinasyonlar ve 2 yönlü etkileşim şartları, ancak her zaman rasgele bir etki olarak ID ve bağımlı değişken olarak comp1 ile keşfetmek ~ 19 modelleri var.

  • S1. Hangisi kullanılır? Ya ben? önemli mi?

Bunların her ikisinde de ML veya REML kullanma seçeneğim var - ve çok farklı cevaplar alıyorum - ML'yi ve ardından AIC'yi kullanıyorum, hepsi benzer AIC değerlerine sahip 6 modelle sonuçlanıyor ve model kombinasyonları mantıklı değil, REML en olası modellerin 2'siyle sonuçlanır. Ancak, REML çalıştırırken artık anova kullanamıyorum.

  • S2. ile kullanım nedeniyle ML'nin REML yerine kullanılmasının ana nedeni nedir? Bu benim için net değil.

StepAIC'i hala çalıştıramıyorum veya bu 19 modeli daraltmanın başka bir yolunu bilmiyorum.

  • Q3. bu noktada stepAIC kullanmanın bir yolu var mı?

3
Q2 için ML gereklidir, çünkü sabit etkiler değiştiğinde REML kullanan karşılaştırmalar geçerli değildir. Olası faydalı bir soru burada: stats.stackexchange.com/a/16015/3601
Aaron Stack Overflow'dan ayrıldı

@Aaron Daha önce bu soruya bakmıştım ama yine de kafam karışmıştı. REML, rastgele etki değiştiğinde yalnızca "çalışır" mı kullanılır? Ben açıkça ML vs REML yeterince anlamıyorum. Yine de teşekkürler, bu sorularımdan birine yardımcı oluyor!
Kerry

Evet doğru. Modeller karşılaştırılırken, REML sadece modeller aynı sabit etkilere sahipse kullanılmalıdır. Yanıt aşağıda genişletildi.
Aaron Stack Overflow'dan ayrıldı

Yanıtlar:


16

S1. Hangisi kullanılır? Ya ben? önemli mi? Her ikisi de iyi. Size aynı uyumu verecekler. lmesize p değerleri verecek ve lmervermeyecek, ama bu buraya girmek istediğimden daha fazla. En ünlü referans R yardım posta listesine Doug Bates mesajların biridir burada .

(ikaz: Onlar kullanımı biraz farklı algoritmalar böylece potansiyel olarak bazı hesaplama zor bir ya da diğer daha iyi yapabilir, ama bu pratikte çok nadirdir durumlar ve aslında, model mlama çeşit büyük olasılıkla nokta vardır yapmak Bkz. Tamamen farklı lmer () ve lme () 'nin sonuçları .)

S2. ile kullanım nedeniyle ML'nin REML yerine kullanılmasının ana nedeni nedir? Bu benim için net değil. ML gereklidir, çünkü sabit etkiler değiştiğinde REML kullanan karşılaştırmalar geçerli değildir. Olası faydalı bir soru şudur: https://stats.stackexchange.com/a/16015/3601 . Yukarıdaki yorumda sorunuza cevap vermek için, evet, modelleri karşılaştırırken, REML sadece modellerin aynı sabit etkilere sahip olması durumunda (yani, sadece rastgele etkiler değiştiğinde) kullanılmalıdır. REML olasılığı modelde hangi sabit etkilerin olduğuna bağlıdır ve bu nedenle sabit etkiler değişirse karşılaştırılamaz. REML'in genellikle rastgele etkiler için daha iyi tahminler verdiği düşünülür, bu nedenle her zamanki tavsiye, nihai çıkarım ve raporunuz için REML kullanarak en iyi modelinize uymaktır.

Q3. bu noktada stepAIC kullanmanın bir yolu var mı? Durumunuzda anlamlı olan 19 modeliniz arasında karşılaştırma yapmak için AIC'yi hepsi için karşılaştırmanız yeterlidir. Kademeli bir prosedür kullanmak için hiçbir sebep yok. Adım adım prosedürler, günümüzde en iyi modelin bulunacağını garanti etmediği ve bilgisayarların birçok modeli karşılaştırmayı kolaylaştıracağı için genellikle eski moda olarak görülmektedir.


1

Daha fazla kazma, Aaron'un sağladığı bağlantıları destekleyen ve kendim gibi başlayanlar için iyi okumalar olan bu kaynakları da buldum. Örnekler için http://lme4.r-forge.r-project.org/ adresinde bağlanan bölümlerde aynı proje sayfasındaki http://lme4.r-forge.r-project.org/slides/ slayt bağlantısını inceleyin. . Kısa kursların çoğunda bile büyük bir yardımcı olan örnek R kodu var.
Ayrıca Dr. Bolker'in bu kısa cevabı http://r.789695.n4.nabble.com/lme-vs-lmer-how-do-they-differ-td2534332.html

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.