Tahmin için rastgele efektler eklemeden neden karma efekt modelinden tahmin edesiniz?


10

Bu daha kavramsal bir soru, ama kullandığım Rzaman içindeki paketlerden bahsedeceğim R. Amaç, öngörme amacıyla doğrusal bir modele uymak ve daha sonra rasgele etkilerin bulunamayacağı yerlerde tahminler yapmak ise, karışık efektler modeli kullanmanın herhangi bir faydası var mı yoksa bunun yerine sabit efekt modeli mi kullanılmalı?

Örneğin, ağırlık ve boy ile ilgili başka bilgilerle ilgili verilerim varsa ve aşağıdaki modeli kullanarak lme4, öznenin bir faktör olduğu durumlardan seviyeleri (n=no.samples):

mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)

Daha sonra yeni boy ve yaş verilerini kullanarak modelden ağırlığı tahmin etmek istiyorum. Açıkçası, orijinal verilerdeki denek sapması modelde yakalanmaktadır, ancak bu bilgiyi tahminde kullanmak mümkün müdür? Diyelim ki bazı yeni boy ve yaş verilerim var ve ağırlığı tahmin etmek istiyorum, bunu şu şekilde yapabilirim:

predict(mod1,newdata=newdf) # newdf columns for height, age, subject

Bu kullanılır predict.merModve ben (yeni) konular için bir sütun dahil edebilir newdfveya set re.form =~0. İlk örnekte, modelin 'yeni' konu faktörleri ile ne yaptığı açık değildir ve ikinci örnekte modelde yakalanan özne sapması, tahmin için dikkate alınmayacak mı (ortalama üzerinden)?

Her iki durumda da, sabit etkili doğrusal modelin daha uygun olabileceği bana benziyor. Gerçekten, eğer anlayışım doğruysa, o zaman sabit bir etki modeli, tahminte rastgele etki kullanılmıyorsa, karma modelle aynı değerleri tahmin etmelidir. Durum böyle mi olmalı? İçinde Rdeğil, örneğin:

mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)

predict(mod1,newdata=newdf, re.form=~0) # newdf columns for height, age, subject

aşağıdakilere farklı sonuçlar verir:

mod2 <- lm(weight ~ height + age, data=df)

predict(mod2,newdata=newdf) # newdf columns for height, age




Evet, ama bu durumda neden karma efekt modeliyle uğraşıyorsunuz? Tahmindeki rastgele efektleri görmezden gelirseniz, sabit bir efekt modelinin size vermemesi ne olur?
tribalsoul

1
Daha iyi tahminler verebilir, çünkü hata yapısının daha iyi (daha doğru) bir modeline
sahipsiniz

Yanıtlar:


5

Basit düşünce deneyi: Doğumdan sonra 5 bebeğin ağırlığını ve boyunu ölçtünüz. Ve aynı bebeklerden iki yıl sonra tekrar ölçtün. Bu arada neredeyse her hafta bebeğinizin ağırlığını ve boyunu ölçtünüz ve sonuç olarak onun için 100 değer çifti oldu. Karışık efektler modeli kullanıyorsanız, sorun yoktur. Sabit bir etki modeli kullanırsanız, kızınızdan alınan ölçümlere, yalnızca ondan veri kullanırsanız neredeyse aynı modelin sığacağı bir noktaya gereksiz ağırlık koyarsınız. Bu nedenle, sadece tekrarlanan ölçümleri veya belirsizlik yapılarını doğru bir şekilde modellemek için değil, aynı zamanda tahmin için de önemlidir. Genel olarak, karışık etkiler modelinden ve sabit etkiler modelinden (ihlal edilen varsayımlarla) aynı tahminleri almazsınız.

ve newdf'ye (yeni) konular için bir sütun ekleyebilirim

Orijinal (eğitim) verilerinin bir parçası olmayan konuları tahmin edemezsiniz. Yine bir düşünce deneyi: yeni konu obez. Model, rastgele etki dağılımının üst ucunda olduğunu nasıl bilebilir?

modelde yakalanan özne sapması, tahmin için dikkate alınmayacak mı (ortalama üzerinden)

Seni doğru anlarsam evet. Model size popülasyon için beklenen değerin bir tahminini verir (bu tahminin hala orijinal konular üzerinde koşullu olduğunu unutmayın).


1
Açık açıklama ve örnek için teşekkür ederim, hepsi mantıklı. Ancak belirttiğiniz yer You can't predict for subjects which were not part of the original (training) data; re.form=~0Nüfusun beklenen değerini ayarlamak ve tahmin etmek tam da bunu yapmama izin vermiyor mu? Kabul edilirse, model tahminde herhangi bir konuya özgü bilgi kullanmamaktadır, ancak karışık bir etki modelinden gelen tahminin, konuya özgü varyasyonun olduğu eşdeğer bir sabit etki modelinden daha doğru olacağını söylemek doğru olur mu? gözardı?
tribalsoul

1
Sabit model, varsayımları ihlal edildiği için uygulanamaz. Bir bağımlılık yapısı içeren bir model kullanmalısınız. re.form=~0size yeni düzeyler için yapabileceğiniz en iyisi olan nüfus düzeyi tahmini verir.
Roland

glmmLasso Paketi R'de kullanırken de aynı soruyu sordum. Paketin yazarı Andreas Groll, glmmLasso prosedürünün yeni konular için tahminler yapmak için sadece sabit efektler ve bir sonraki zaman periyodunda mevcut konular için sabit + rastgele efektler kullandığını belirtti.
RobertF
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.