Üç değişken göz önüne alındığında y
ve x
sürekli pozitif olan ve z
kategorik olan iki aday modelim var:
fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) )
ve
fit.fe <- lm( y ~ 1 + x )
Hangi modelin daha uygun olduğunu belirlemek için bu modelleri karşılaştırmayı umuyorum. Bana öyle geliyor ki bir anlamda fit.fe
iç içe geçmiş fit.me
. Tipik olarak, bu genel senaryo tutulduğunda, bir ki kare testi yapılabilir. İçinde R
, bu testi aşağıdaki komutla yapabiliriz,
anova(fit.fe,fit.me)
Her iki model (oluşturulan rasgele-efektleri içeren zaman lmer
gelen lme4
paket), anova()
komut iyi çalışır. Sınır parametrelere sayesinde yine, hala olabilir, simülasyon yoluyla elde edilen Ki-Kare istatistik test etmek normalde tavsiye edilir kullanmak simülasyon prosedüründe istatistik.
Her iki model de yalnızca sabit efektler içerdiğinde , bu yaklaşım --- ve ilişkili anova()
komut --- iyi çalışır.
Bununla birlikte, bir model rastgele efektler içerdiğinde ve azaltılmış model , yukarıdaki senaryoda olduğu gibi yalnızca sabit efektler içerdiğinde , anova()
komut çalışmaz.
Daha spesifik olarak, aşağıdaki hatayı alıyorum:
> anova(fit.fe, fit.me)
Error: $ operator not defined for this S4 class
Yukarıdan Chi-Square yaklaşımını kullanmanın yanlış bir yanı var mı (simülasyonla)? Yoksa bu sadece anova()
farklı işlevler tarafından üretilen doğrusal modellerle nasıl başa çıkılacağını bilmeme sorunu mu?
Başka bir deyişle, modellerden türetilen Ki-Kare istatistiği manuel olarak oluşturmak uygun olur mu? Öyleyse, bu modelleri karşılaştırmak için uygun serbestlik dereceleri nelerdir? Benim hesabımla:
Sabit etkiler modelinde iki parametre (eğim ve kesişim) ve karışık efektler modelinde iki parametre (rastgele eğim ve rastgele kesişim için varyans parametreleri) tahmin ediyoruz. Tipik olarak, kesişim parametresi serbestlik hesaplama derecelerinde sayılmaz, bu nedenle ve ; rastgele etki parametreleri için varyans parametrelerinin serbestlik hesaplama derecelerine dahil edilmesi gerekip gerekmediğinden emin olmadığımı söyledikten sonra; sabit etki parametreleri için varyans tahminleri dikkate alınmaz , ancak bunun bilinmeyen rastgele değişkenler olarak kabul edilirken sabit etkiler için parametre tahminlerinin bilinmeyen sabitler olduğu varsayıldığına inanıyorum.karışık efektler için. Bu konuda bazı yardımları takdir ediyorum.
Son olarak, R
bu modelleri karşılaştırmak için daha uygun ( tabanlı) bir çözüm var mı?
lm()
ilegls()
gelennlme
paketin velmer()
ilelme()
(tekrarnlme
pakete), herşey yolunda çalışacaktır. Ancak , daha basit model için parametreler parametre alanının sınırında olduğu için konservatif bir test (çok büyük p -değerleri) alacağınızı unutmayın . Ve gerçekten rastgele etkilerin dahil edilip edilmeyeceğinin seçimi, istatistiksel bir teste değil, teoriye (örneğin örnekleme planı) dayanmalıdır.