Üç değişken göz önüne alındığında yve xsürekli pozitif olan ve zkategorik olan iki aday modelim var:
fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) )
ve
fit.fe <- lm( y ~ 1 + x )
Hangi modelin daha uygun olduğunu belirlemek için bu modelleri karşılaştırmayı umuyorum. Bana öyle geliyor ki bir anlamda fit.feiç içe geçmiş fit.me. Tipik olarak, bu genel senaryo tutulduğunda, bir ki kare testi yapılabilir. İçinde R, bu testi aşağıdaki komutla yapabiliriz,
anova(fit.fe,fit.me)
Her iki model (oluşturulan rasgele-efektleri içeren zaman lmergelen lme4paket), anova()komut iyi çalışır. Sınır parametrelere sayesinde yine, hala olabilir, simülasyon yoluyla elde edilen Ki-Kare istatistik test etmek normalde tavsiye edilir kullanmak simülasyon prosedüründe istatistik.
Her iki model de yalnızca sabit efektler içerdiğinde , bu yaklaşım --- ve ilişkili anova()komut --- iyi çalışır.
Bununla birlikte, bir model rastgele efektler içerdiğinde ve azaltılmış model , yukarıdaki senaryoda olduğu gibi yalnızca sabit efektler içerdiğinde , anova()komut çalışmaz.
Daha spesifik olarak, aşağıdaki hatayı alıyorum:
> anova(fit.fe, fit.me)
Error: $ operator not defined for this S4 class
Yukarıdan Chi-Square yaklaşımını kullanmanın yanlış bir yanı var mı (simülasyonla)? Yoksa bu sadece anova()farklı işlevler tarafından üretilen doğrusal modellerle nasıl başa çıkılacağını bilmeme sorunu mu?
Başka bir deyişle, modellerden türetilen Ki-Kare istatistiği manuel olarak oluşturmak uygun olur mu? Öyleyse, bu modelleri karşılaştırmak için uygun serbestlik dereceleri nelerdir? Benim hesabımla:
Sabit etkiler modelinde iki parametre (eğim ve kesişim) ve karışık efektler modelinde iki parametre (rastgele eğim ve rastgele kesişim için varyans parametreleri) tahmin ediyoruz. Tipik olarak, kesişim parametresi serbestlik hesaplama derecelerinde sayılmaz, bu nedenle ve ; rastgele etki parametreleri için varyans parametrelerinin serbestlik hesaplama derecelerine dahil edilmesi gerekip gerekmediğinden emin olmadığımı söyledikten sonra; sabit etki parametreleri için varyans tahminleri dikkate alınmaz , ancak bunun bilinmeyen rastgele değişkenler olarak kabul edilirken sabit etkiler için parametre tahminlerinin bilinmeyen sabitler olduğu varsayıldığına inanıyorum.karışık efektler için. Bu konuda bazı yardımları takdir ediyorum.
Son olarak, Rbu modelleri karşılaştırmak için daha uygun ( tabanlı) bir çözüm var mı?
lm()ilegls()gelennlmepaketin velmer()ilelme()(tekrarnlmepakete), herşey yolunda çalışacaktır. Ancak , daha basit model için parametreler parametre alanının sınırında olduğu için konservatif bir test (çok büyük p -değerleri) alacağınızı unutmayın . Ve gerçekten rastgele etkilerin dahil edilip edilmeyeceğinin seçimi, istatistiksel bir teste değil, teoriye (örneğin örnekleme planı) dayanmalıdır.