REML veya ML, farklı sabit efektlere sahip, ancak aynı rastgele etkiye sahip iki karışık efekt modelini karşılaştırmak için mi?


18

Arka plan: Not: Veri kümem ve r kodum aşağıdaki metinde yer almaktadır

R'de lme4 paketi kullanılarak oluşturulan iki karışık efekt modelini karşılaştırmak için AIC'yi kullanmak istiyorum. Her modelin bir sabit etkisi ve bir rastgele etkisi vardır. Sabit etki modeller arasında farklılık gösterir, ancak rastgele etki modeller arasında aynı kalır. Ben REML = T kullanırsanız, model2 düşük AIC puanı olduğunu, ancak REML = F kullanırsanız, model1 düşük AIC puanı olduğunu buldum.

ML kullanma desteği:

Zuur ve diğ. (2009; SAYFA 122) "İç içe sabit efektli (ancak aynı rastgele yapıya sahip) modelleri karşılaştırmak için, REML yerine ML tahmini kullanılmalıdır." Bu bana, rastgele etkilerimin her iki modelde de aynı olması nedeniyle ML kullanmam gerektiğini gösteriyor, ancak sabit etkilerim farklı. [Zuur ve diğ. 2009. R. Springer ile Ekolojide Karışık Etki Modelleri ve Uzantıları.]

REML kullanma desteği:

Bununla birlikte, ML kullandığımda, rastgele etkilerle ilişkili artık varyansın iki model arasında (model1 = 136.3; model2 = 112.9) farklı olduğunu fark ettim, ancak REML kullandığımda, modeller arasında aynıdır (model1 = model2 = 151.5). Bu bana REML kullanmam gerektiğini ima ediyor, böylece rastgele artık varyans aynı rastgele değişkene sahip modeller arasında aynı kalıyor.

Soru:

Sabit etkilerin değiştiği ve rastgele etkilerin aynı kaldığı modellerin karşılaştırması için REML kullanmak ML'den daha mantıklı değil mi? Değilse, nedenini açıklayabilir veya beni daha fazla açıklayan diğer literatüre yönlendirebilir misiniz?

# Model2 "wins" if REML=T:
REMLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = T)
REMLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = T)
AIC(REMLmodel1,REMLmodel2)
summary(REMLmodel1)
summary(REMLmodel2)

# Model1 "wins" if REML=F:
MLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = F)
MLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = F)
AIC(MLmodel1,MLmodel2)
summary(MLmodel1)
summary(MLmodel2)

Veri kümesi:

Response    Fixed1  Fixed2  Random1
5.20    A   A   1
32.50   A   A   1
6.57    A   A   2
24.77   A   B   3
41.69   A   B   3
34.29   A   B   4
1.80    A   B   4
10.00   A   B   5
15.56   A   B   5
4.44    A   C   6
21.65   A   C   6
9.20    A   C   7
4.11    A   C   7
12.52   B   D   8
0.25    B   D   8
27.34   B   D   9
11.54   B   E   10
0.86    B   E   10
0.68    B   E   11
4.00    B   E   11

2
Faraway's (2006) Doğrusal modelin R ile genişletilmesi (s. 156): "Bunun nedeni, REML'nin sabit etkileri kaldıran verilerin doğrusal kombinasyonlarını dikkate alarak rastgele etkileri tahmin etmesidir. Bu sabit etkiler değişirse, iki model doğrudan karşılaştırılamaz. "
jvh_ch

Her ne kadar AIC olasılık temelinde olsa da, bilgim dahilinde, tahmin amacıyla geliştirilmiştir. Tahmin için karışık bir modeli tam olarak nasıl uygularsınız?
AdamO

@AdamO, daha kesin olabilir misin? Takılan karışık bir model, nüfus düzeyinde (koşullu modları / BLUP'ları sıfıra ayarlayarak tanımlanmamış / bilinmeyen bir ünite için yanıtları tahmin et) veya bireysel düzeyde (koşullu modların / BLUP'ların tahminlerindeki koşul tahmini) tahmin için kullanılabilir ). Daha spesifik olabilirseniz, bu yeni bir CV sorusu oluşturabilir.
Ben Bolker

Bu modeli nasıl uygulayacağınız belli değildi. Problemdeki hiçbir şey, eğer varsa, ne tür bir tahminin yapıldığını ya da gerekli olup olmadığını ve eğer öyleyse ne amaçla olduğunu önermiyordu.
AdamO

Yanıtlar:


22

Zuur ve diğerleri ve Faraway (@ janhove'nin yukarıdaki yorumundan) doğrudur; REML tarafından takılan farklı sabit etkileri olan iki modeli karşılaştırmak için olasılık tabanlı yöntemler (AIC dahil) kullanmak genellikle saçmalıklara yol açacaktır.


4
@Janhove, AdamO ve Ben Bolker'e teşekkürler. Ayrıca bu soruyu cevaplamak için Aaron'dan bu bağlantıyı buldum . "REML olasılığı, modelde hangi sabit etkilerin olduğuna bağlıdır ve bu nedenle sabit etkiler değişirse karşılaştırılamaz. son çıkarım ve raporlama için REML kullanan en iyi modeliniz. "
O Şekil

11

XX~RnX~XB

X~=XB

BXB tersinir olduğu .

V bir kovaryans matrisi olmasına izin verirsek, en üst düzeye çıkarmamız gereken REML ölçütünü düşünelim (bir sabit atlıyorum)

|V|1/2|X~V1X~|1/2exp((yX~β~)V1(yX~β~)/2)

β=(X~V1X~)1yX=X~B

|B||V|1/2||XV1X|1/2|exp((yXβ¯)V1(yXβ¯)/2),

where β¯=(XV1X)1y. This is the REML likelihood for the other parametrization times the determinant of |B|.

We therefore have an example of two different parametrizations of the same model, giving different likelihood values, assuming that |B|1 (such a matrix can easily be found). The same parameter value will maximize the criterion in both cases but the value of the likelihood will be different. This shows that there is an arbitrary element in the likelihood value and therefore illustrates why one cannot use the value of the likelihood for comparison between models with different fixed effects: you would be able to change the results simply be changing the mean value space parametrization in one of the models.

This an example of why REML should not be used when comparing models with different fixed effects. REML, however, often estimates the random effects parameters better and therefore it is sometimes recommended to use ML for comparisons and REML for estimating a single (perhaps final) model.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.