Neden iç içe var-covar modelleri arasında seçim yapmak için REML (ML yerine) kullanmak zorunda?


16

Doğrusal Karışık Modellerin rastgele etkileri üzerine model seçimi ile ilgili çeşitli açıklamalar REML kullanmayı öğretmektedir. Bir düzeyde REML ve ML arasındaki farkı biliyorum, ancak ML önyargılı olduğu için REML'nin neden kullanılması gerektiğini anlamıyorum. Örneğin, ML kullanarak normal bir dağıtım modelinin varyans parametresinde bir LRT yapmak yanlış mıdır (aşağıdaki koda bakın)? Model seçiminde ML olmanın neden tarafsız olmasının daha önemli olduğunu anlamıyorum. Bence nihai cevap "çünkü model seçimi REML ile ML'den daha iyi çalışır" olmalı ama bundan biraz daha fazlasını bilmek istiyorum. LRT ve AIC türevlerini okumadım (onları iyice anlamak için yeterince iyi değilim), ancak REML türevlerinde açıkça kullanılıyorsa, sadece bunun yeterli olacağını bilerek (örn.

n <- 100
a <- 10
b <- 1
alpha <- 5
beta <- 1
x <- runif(n,0,10)
y <- rnorm(n,a+b*x,alpha+beta*x)

loglik1 <- function(p,x,y){
   a <- p[1]
   b <- p[2]
   alpha <- p[3]
  -sum(dnorm(y,a+b*x,alpha,log=T))
}

loglik2 <- function(p,x,y){
   a <- p[1]
   b <- p[2]
   alpha <- p[3]
   beta <- p[4]
  -sum(dnorm(y,a+b*x,alpha+beta*x,log=T))
}

m1 <- optim(c(a,b,alpha),loglik1,x=x,y=y)$value
m2 <- optim(c(a,b,alpha,beta),loglik2,x=x,y=y)$value
D <- 2*(m1-m2)
1-pchisq(D,df=1) # p-value

1
REML ve AIC hakkında bu soruya bir göz atmalısınız .
Elvis

Yanıtlar:


13

Çok kısa bir cevap: REML bir ML'dir, bu yüzden REML'ye dayanan test zaten doğrudur. REML ile varyans parametrelerinin tahmini daha iyi olduğundan, onu kullanmak doğaldır.

REML neden ML? Örneğin , , ve sabit efektlerin vektörü, rastgele efektlerin vektörü ve . Kısıtlı Olasılık , sabit etkileri "kaldırmak" için kontrastları düşünülerek elde edilebilir . Daha doğrusu, , öyle ki ve (yani sütunları)X R n × p Z R n × q β R p u N C C = I n - p C X C Y = C Z u + ϵ ϵ N ( 0 , σ 2 I n - p

Y=Xβ+Zu+e
XRn×pZRn×qβRpe N ( 0 , σ 2 I n ) n - p C R ( n - p ) × n C XuN(0,τIq)eN(0,σ2In)npCR(np)×nCX=0CC=InpC sütunları tarafından üretilen boşluğun ortognal vektör uzayının ortonormal bir temelidir ); o zaman ile ve verilen olasılığı Kısıtlı Olabilirliktir.X
CY=CZu+ϵ
τ , σ 2 C YϵN(0,σ2Inp)τ,σ2CY

Güzel cevap (+1), matrisinin ortalama için modele bağlı olduğunu söylemek doğru mudur? Yani sadece aynı matrisi için REML tahminlerini karşılaştırabilir misiniz ? CCC

Evet, , bağlıdır (cevabı netleştirmek için bir dakika içinde düzenleyeceğim), bu nedenle iç içe modellerinizin sabit efektlerle aynı değişkenlere sahip olması gerekir. XCX
Elvis

REML bir ML değildir ! ML benzersiz Belirli bir olasılık modeli için tanımlandığı gibidir, ancak REML sabit etkiler parametre bağlıdır. Bkz. Örneğin Doug Bates'in bu yorumu (R-SIG-karma modeller hakkında birçok tarihi yorum).
Livius

1
@Livius Sanırım cevabım, sınırlı olasılığın nasıl inşa edildiğini yeterince açık bir şekilde ifade ediyor. Bu ise o gözlenen verilen adil değil olabilirlik var, bir olasılık ilk görüntülenen denklemde yazılı modelde, ancak öngörülen vektör verilen ikinci yazılı modelinde denklemi sergiledi. REML , bu olasılıktan elde edilen ML'dir . C YYCY
Elvis

2
Bence bu, DBate'lerin bu konudaki protestolarının noktası: farklı bir model ve model ve parametreleştirmenin iç içe geçtiği için karşılaştırmanın zor olduğu bir model. Eğer işlem değiliz Yani orijinal model için ML ama için ML farklı modelde orijinal modelin belirli bir parameterization kaynaklanan. Bu nedenle iç içe sabit efektli yapılara sahip REML donanımlı modeller artık iç içe geçmiş modeller değildir (yukarıda belirttiğiniz gibi). Ancak ML ile donatılmış modeller hala yuvalanmıştır, çünkü belirtilen modeldeki olasılığı en üst düzeye çıkarıyorsunuz.
Livius

9

Olabilirlik oranı testleri, iki olasılık oranına dayanan istatistiksel hipotez testleridir. Özellikleri maksimum olabilirlik kestirimiyle (MLE) bağlantılıdır. (bakınız layman terimleriyle Maksimum Olabilirlik Tahmini (MLE) ).

Durumda da 'Diyelim ki var-COVAR olan bir model arasında seçim yapmak istediğinizi varsayalım, iç içe geçmiş iki var-COVAR modeller arasında' 'seçim' isteyen (soruya bakın) ve var-COVAR olan bir modeli (basit model) birincisinin (genel olanın) özel bir olduğu . Σ sΣgΣs

Test, olabilirlik oranına dayanmaktadır. . Burada ve maksimum olabilirlik tahmin vardır.LR=2(log(Ls(Σ^s))log(Lg(Σ^g))Σ^sΣ^g

İstatistik olduğu asimptotik (!) . LR χ2

Maksimum olabilirlik tahmin edicilerinin tutarlı olduğu bilinmektedir, ancak çoğu durumda yanlıdırlar. Bu, ve varyansı için MLE tahmin edicileri için önyargılı olduklarını gösterebilir. Bunun nedeni, verilerden türetilen bir ortalama kullanılarak hesaplanmasıdır, böylece bu 'tahmini ortalama' etrafındaki yayılma, gerçek ortalamanın etrafındaki yayılmadan daha küçüktür (bkz. Örneğin standart sapmayı hesaplarken bölme sezgisel açıklaması ? )Σ^sΣ^gn1

İstatistik üzerindedir bu sırf büyük numunelerde, gerçeği olduğu, büyük numunelerde ve gerçek değerlerine yakınsama (MLE tutarlıdır ). (Not: yukarıdaki bağlantıda, çok büyük örnekler için n'ye veya (n-1) 'e bölünmesi fark yaratmaz)LRχ2Σ^sΣ^g

Daha küçük örnekler için MLE ait tahminleri ve önyargılı edilecek ve dolayısıyla dağılımı olacaktır sapma dan REML tahminleri için tarafsız tahminler verecektir ederken, ve , bu nedenle, var-covar modelinin seçimi için kullanırsanız, REML , daha küçük numuneler için tarafından daha iyi tahmin edileceğini tahmin eder . Σ gLR, x,2ΣsΣgLR, x,2Σ^sΣ^gLRχ2ΣsΣgLRχ2

REML'nin sadece aynı ortalamaya sahip modellerin iç içe var-kovar yapıları arasından seçim yapmak için kullanılması gerektiğini unutmayın, farklı araçlara sahip modeller için REML uygun değildir, farklı araçlara sahip modeller için bir ML kullanılmalıdır.


"İstatistik LR, asimptotik olarak (!) Χ2" ifadesi bu durumda doğru değildir. Eğer olmasıdır iç içe ardından sınırlarında yer . Bu durumda, dağıtımı tutmaz. Örneğin, buraya bakınΣ g Σ s Σ g χ 2ΣsΣgΣsΣgχ2
Cliff AB

@Cliff AB, bu ifadenin altında açıklanan şey budur ve REML'yi kullanmanızın nedeni budur.

-4

Benim sağduyumla ilgisi daha fazla olan bir istatistik var. SAS'ta PROC MIXED'e bakarsanız, tahmin altı yöntemle gerçekleştirilebilir:

http://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#statug_mixed_sect008.htm

ancak REML varsayılan değerdir. Neden? Görünüşe göre, pratik deneyim en iyi performansa sahip olduğunu gösterdi (örneğin, en yakınsama problemleri olasılığı). Bu nedenle, hedefinize REML ile ulaşılabilirse, REML'yi diğer beş yöntemin aksine kullanmak mantıklıdır.


2
'Büyük örnek teorisi' ve MLE tahminlerinin yanlılığı ile ilgilidir, cevabımı gör.

1
"Bu SAS'ta varsayılan" Bu sitede "neden" sorusuna kabul edilebilir bir cevap değil.
Paul

SAS tarafından varsayılan olarak sağlanan karma modeller için p değerleri, güvenilmez olduğu için R için lme4 kitaplığında tasarım tarafından kullanılamaz ( stat.ethz.ch/pipermail/r-help/2006-May/094765.html ). Yani "varsayılan SAS" bile yanlış olabilir.
Tim
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.