Karışık efektler ve sabit efekt modellerinin karşılaştırılması (rastgele etkilerin önemini test etme)


10

Üç değişken göz önüne alındığında yve xsürekli pozitif olan ve zkategorik olan iki aday modelim var:

fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) )

ve

fit.fe <- lm( y ~ 1 + x )

Hangi modelin daha uygun olduğunu belirlemek için bu modelleri karşılaştırmayı umuyorum. Bana öyle geliyor ki bir anlamda fit.feiç içe geçmiş fit.me. Tipik olarak, bu genel senaryo tutulduğunda, bir ki kare testi yapılabilir. İçinde R, bu testi aşağıdaki komutla yapabiliriz,

anova(fit.fe,fit.me)

Her iki model (oluşturulan rasgele-efektleri içeren zaman lmergelen lme4paket), anova()komut iyi çalışır. Sınır parametrelere sayesinde yine, hala olabilir, simülasyon yoluyla elde edilen Ki-Kare istatistik test etmek normalde tavsiye edilir kullanmak simülasyon prosedüründe istatistik.

Her iki model de yalnızca sabit efektler içerdiğinde , bu yaklaşım --- ve ilişkili anova()komut --- iyi çalışır.

Bununla birlikte, bir model rastgele efektler içerdiğinde ve azaltılmış model , yukarıdaki senaryoda olduğu gibi yalnızca sabit efektler içerdiğinde , anova()komut çalışmaz.

Daha spesifik olarak, aşağıdaki hatayı alıyorum:

 > anova(fit.fe, fit.me)
 Error: $ operator not defined for this S4 class

Yukarıdan Chi-Square yaklaşımını kullanmanın yanlış bir yanı var mı (simülasyonla)? Yoksa bu sadece anova()farklı işlevler tarafından üretilen doğrusal modellerle nasıl başa çıkılacağını bilmeme sorunu mu?

Başka bir deyişle, modellerden türetilen Ki-Kare istatistiği manuel olarak oluşturmak uygun olur mu? Öyleyse, bu modelleri karşılaştırmak için uygun serbestlik dereceleri nelerdir? Benim hesabımla:

F=((SSEreducedSSEfull)/(pk))((SSEfull)/(np1))Fpk,np1

Sabit etkiler modelinde iki parametre (eğim ve kesişim) ve karışık efektler modelinde iki parametre (rastgele eğim ve rastgele kesişim için varyans parametreleri) tahmin ediyoruz. Tipik olarak, kesişim parametresi serbestlik hesaplama derecelerinde sayılmaz, bu nedenle ve ; rastgele etki parametreleri için varyans parametrelerinin serbestlik hesaplama derecelerine dahil edilmesi gerekip gerekmediğinden emin olmadığımı söyledikten sonra; sabit etki parametreleri için varyans tahminleri dikkate alınmaz , ancak bunun bilinmeyen rastgele değişkenler olarak kabul edilirken sabit etkiler için parametre tahminlerinin bilinmeyen sabitler olduğu varsayıldığına inanıyorum.k=1p=k+2=3karışık efektler için. Bu konuda bazı yardımları takdir ediyorum.

Son olarak, Rbu modelleri karşılaştırmak için daha uygun ( tabanlı) bir çözüm var mı?


4
Eğer değiştirirseniz lm()ile gls()gelen nlmepaketin ve lmer()ile lme()(tekrar nlmepakete), herşey yolunda çalışacaktır. Ancak , daha basit model için parametreler parametre alanının sınırında olduğu için konservatif bir test (çok büyük p -değerleri) alacağınızı unutmayın . Ve gerçekten rastgele etkilerin dahil edilip edilmeyeceğinin seçimi, istatistiksel bir teste değil, teoriye (örneğin örnekleme planı) dayanmalıdır.
Karl Ove Hufthammer

1
Modellerle ne yapmak istiyorsunuz? Bir model bazı amaçlar için daha iyi, diğer model diğer amaçlar için daha iyi olabilir. Tüm modeller yanlış, bu yüzden soru hangi modelin doğru değil, hangi sorunun sizin için daha yararlı olduğu.
Kodiologist

1
@Kodiologist Temel olarak, sabit etkiler için parametre tahminlerinin güvenilir olmasını sağlamak istiyorum. Gözlemlerin bağımsız olduğu varsayılırsa standart hataları güvenilir olmayabilir. Buna ek olarak, rastgele etkinin nasıl olduğu hakkında bazı açıklamalar yapmak iyi olurdu, ama sanırım bu çok da önemli değil.
user9171 14:15

2
@ user9171 Bir modelin parametre tahminlerindeki kararlılığı (güvenilirliği) kontrol etmenin iyi bir yolu, önyükleme kullanmaktır. İki modelin paylaştığı her parametre için grafik önyükleme dağılımları, parametre ve model başına bir grafik. Daha sıkı dağılımlar daha yüksek kararlılık anlamına gelir. Muhtemelen daha basit modelin daha kararlı tahminler verdiğini göreceksiniz, çünkü daha az parametre her parametrenin daha kesin tahminine izin verir.
Kodiologist

Yanıtlar:


6

Teknik olarak, sadece parametrelerin sırasını değiştirerek çalışmasını sağlayabilirsiniz:

> anova(fit.me, fit.fe) 

Sadece iyi çalışır. lmerÖnce oluşturulan bir nesneyi iletirseniz , anova.merModbunun yerine çağrılır anova.lm( lmernesnelerin nasıl işleneceğini bilmez ). Görmek:

?anova.merMod

Bununla birlikte, karma bir model veya sabit bir model seçmek, bir model seçim problemini değil, deneysel tasarımı dikkate alması gereken bir modelleme seçimidir. Daha fazla bilgi için @ BenBolker'ın https://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#testing-significance-of-random-effects bölümüne bakın :

Düşünün değil rastgele etkilerin öneminin test.


+1. Daha fazla tartışma ve referans içeren @BenBolker'ın SSS'sine bir bağlantı ekleme özgürlüğünü aldım.
amip
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.