Karışık bir modelin (rastgele etki olarak konu) basit bir doğrusal modelle (sabit etki olarak konu) karşılaştırılması


10

Büyük bir veri kümesi üzerinde bazı analizleri bitiriyorum. Çalışmanın ilk bölümünde kullanılan doğrusal modeli almak ve doğrusal karışık bir model (LME) kullanarak yeniden takmak istiyorum. LME, modelde kullanılan değişkenlerden birinin rastgele bir etki olarak kullanılması dışında çok benzer olacaktır. Bu veriler, küçük bir gruptaki (~ 10) birçok gözlemden (> 1000) gelmektedir ve konunun etkisini modellemenin rastgele bir etki olarak daha iyi yapıldığını biliyorum (bu değiştirmek istediğim bir değişkendir). R kodu şöyle görünecektir:

my_modelB <- lm(formula = A ~ B + C + D)    
lme_model <- lme(fixed=A ~ B + C, random=~1|D, data=my_data, method='REML')

Her şey yolunda gidiyor ve sonuçlar oldukça benzer. Bu iki modeli karşılaştırmak ve hangisinin en uygun olduğuna karar vermek için RLRsim veya AIC / BIC gibi bir şey kullanabilirsem iyi olurdu. Meslektaşlarım LME'yi rapor etmek istemiyorlar çünkü LME'nin daha uygun bir model olduğunu düşünmeme rağmen "daha iyi" olan kolay erişilebilir bir yol yok. Herhangi bir öneri?

Yanıtlar:


6

A ~ B + CDH0:σ2=0χ2χ2

library(lme4)
my_modelB <- lm(formula = A ~ B + C)
lme_model <- lmer(y ~ B + C + (1|D), data=my_data, REML=F)
lrt.observed <- as.numeric(2*(logLik(lme_model) - logLik(my_modelB)))
nsim <- 999
lrt.sim <- numeric(nsim)
for (i in 1:nsim) {
    y <- unlist(simulate(mymodlB))
    nullmod <- lm(y ~ B + C)
    altmod <- lmer(y ~ B + C + (1|D), data=my_data, REML=F)
    lrt.sim[i] <- as.numeric(2*(logLik(altmod) - logLik(nullmod)))
}
mean(lrt.sim > lrt.observed) #pvalue

Önyükleme yapılan LRT'lerin oranı, gözlemlenen LRT'nin p-değeri olduğundan daha fazladır.


Cevabımı tamamladığınız için teşekkür ederim. Ayrıca, bazen insanlar test istatistiği için ki-kare dağılımı yerine ki-kare karışımı kullanırlar.
ocram

@ocram +1, değişkene rastgele mı yoksa analizden ayrı olarak mı sabitleneceğine karar verme konusundaki yorumunuz için. @MudPhud PI'nız sorunu anlamıyorsa ve bir p değeri üzerinde ısrar ediyorsa, belki de ona rastgele etki testinin sonucunu gösterebilirsiniz (buna yine de yazma işlemine dahil edersiniz).
lockedoff

Kod için teşekkürler. Koştuğumda sonuç bootstrapped LRT'lerin hiçbiri gözlenenden daha büyük değil, bu yüzden rastgele efektler veya hatta atılan orijinal değişken olmadan
lm'ye

@MudPhud: Herhangi bir hata aldınız mı? lrt.simHepsinin sıfır olmadığından emin olmak için yazmaya çalışın , bu durumda en olası suçlu paketin lme4yüklü olmamasıdır .
lockedoff

0 değiller, gözlemlenenlere göre çok küçük (~ 1e-6) (63,95).
MudPhud

2

0H0:variance=0H1:variance>0...

DÜZENLE

Karışıklığı önlemek için: Yukarıda belirtilen test bazen rastgele etkinin önemli olup olmadığına karar vermek için kullanılır ... ancak bunun sabit bir etkiye dönüştürülüp dönüştürülmeyeceğine karar vermemek için kullanılır.


Soru şudur: Değişkenin karışık efekt mi yoksa rastgele efekt olarak modellenip modellenmeyeceğine karar vermek için test var mı? Aksi takdirde, tarif ettiğiniz testi yapabilir ve daha sonra ki-kare dağıtım ile test edebilirsiniz (uygun testin ne olacağından emin değilim).
MudPhud

2
@MudPhud: Bir değişkenin sabit veya rastgele bir etki olarak modellenmesine, çalışma planlanırken analizden önce karar verilmelidir. Özellikle, sonuçlarınızın kapsamına bağlıdır. Rastgele etkiler daha genelleştirilebilirlik sağlar. Ayrıca bazı teknik zorluklardan da kaçınabilir. Örneğin, çok sayıda seviyeye sahip kategorik bir değişken sabit bir değişken olarak kabul edildiğinde, parametre sayısı arttığında asimtotik parçalanabilir.
ocram

Kabul ediyorum, ama bunu PI'ma açıklamaya çalıştığımda döndü ve bir tür p değeri istedi. Bu analizi bir el yazmasına dahil etmek istiyorum, ancak daha somut bir gerekçe yoksa bunu kabul etmeyecektir.
MudPhud

1
@MudPhud: Bildiğim kadarıyla böyle bir karar için p değeri yok. Eğer faiz, seçilen belirli seviyelerin etkisi üzerinde yoğunlaşıyorsa, sabit olarak değerlendirilmelidir. Mevcut faktör seviyeleri daha büyük bir popülasyondan rastgele bir örnek olarak görülüyorsa ve daha büyük popülasyon için çıkarımlar isteniyorsa, etki rastgele olmalıdır.
ocram
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.