Karışık modellerde tekil uyum ile başa çıkmak


16

Diyelim ki bir modelimiz var

mod <- Y ~ X*Condition + (X*Condition|subject)

# Y = logit variable  
# X = continuous variable  
# Condition = values A and B, dummy coded; the design is repeated 
#             so all participants go through both Conditions  
# subject = random effects for different subjects 

summary(model)
Random effects:
 Groups  Name             Variance Std.Dev. Corr             
 subject (Intercept)      0.85052  0.9222                    
         X                0.08427  0.2903   -1.00            
         ConditionB       0.54367  0.7373   -0.37  0.37      
         X:ConditionB     0.14812  0.3849    0.26 -0.26 -0.56
Number of obs: 39401, groups:  subject, 219

Fixed effects:
                 Estimate Std. Error z value Pr(>|z|)    
(Intercept)       2.49686    0.06909   36.14  < 2e-16 ***
X                -1.03854    0.03812  -27.24  < 2e-16 ***
ConditionB       -0.19707    0.06382   -3.09  0.00202 ** 
X:ConditionB      0.22809    0.05356    4.26 2.06e-05 ***

Burada tekil bir uyum gözlemliyoruz, çünkü kesişim ve x rastgele etkiler arasındaki korelasyon -1'dir. Şimdi, bu yararlı bağlantıya göre , bu modelle başa çıkmanın bir yolu, yüksek dereceli rastgele efektleri (örneğin, X: ConditionB) kaldırmak ve tekillik testi yaparken bunun bir fark yaratıp yaratmadığını görmektir. Diğeri, blmetekillikten kaçınmak için Bayes yaklaşımını, örneğin paketi kullanmaktır.

Tercih edilen yöntem nedir ve neden?

Bunu soruyorum çünkü birinci veya ikinci olanı kullanmak farklı sonuçlara yol açıyor - ilk durumda, X: ConditionB rastgele etkisini kaldıracağım ve X ve X: ConditionB rastgele etkileri arasındaki korelasyonu tahmin edemeyeceğim. Öte yandan, kullanmak blmeX: ConditionB'yi korumama ve verilen korelasyonu tahmin etmeme izin veriyor. Bayesci yaklaşımı kullanarak her şeyi tahmin edebildiğimde, tekil uyarılar meydana geldiğinde, bayes dışı tahminleri bile kullanmam ve rastgele efektleri kaldırmamın bir neden göremiyorum.

Birisi bana tekil uyum başa çıkmak için her iki yöntemi kullanarak faydaları ve sorunları açıklayabilir misiniz?

Teşekkür ederim.


Bu düzeltme = -1 hakkında ne düşünüyorsunuz? Rastgele etkiler arasındaki korelasyon.
user158565

Yani her denek size biri Y koşulunda ve diğeri B koşulunda olmak üzere iki Y ölçümü verir mi? Bu doğruysa, sürekli değişken X'in değerinin A ve B koşulları arasındaki belirli bir konu için değişip değişmediğini de söyleyebilir misiniz?
Isabella Ghement

Koşul'u neden rastgele efektlere koydunuz? Gerekip gerekmediğini test ettiniz mi?
Dimitris Rizopoulos

@ user158565 evet ama saygınlığı gösterir ...
User33268

@IsabellaGhement Gerçekten. Evet öyle, x A ve B arasında verilen herhangi bir konu için değişir. Ayrıca, X üzerindeki Y regresyonunun her konu için farklı olduğunu varsaymak için teorik bir neden vardır
User33268

Yanıtlar:


21

Tekil bir uyum elde ettiğinizde, bu genellikle modelin fazla takıldığını gösterir - yani, rastgele efekt yapısı veriler tarafından desteklenemeyecek kadar karmaşıktır, bu da doğal olarak rastgele efektlerin en karmaşık kısmını kaldırma tavsiyesine yol açar yapı (genellikle rastgele eğimler). Bu yaklaşımın yararı, aşırı takılmamış daha cimri bir modele yol açmasıdır.

Ancak, bir şey yapmadan önce, sen isteyen için iyi bir nedenin var X, Conditionhepsi ilk etapta konuya göre değişir, ve bunların etkileşimi? Verilerin nasıl oluşturulduğu teorisi bunu gösteriyor mu?

Modele maksimum rasgele efekt yapısı ile lme4sığdırmak ve tekil bir uyum elde etmek istiyorsanız, aynı modeli Bayes çerçevesine sığdırmak, izleme çizimlerini ve çeşitli parametre tahminlerinin ne kadar iyi bir şekilde birleştiğini inceleyerek neden lme4 sorunların olduğunu size bildirebilir. . Bayesian yaklaşımını kullanmanın avantajı, bunu yaparak orijinal modelle ilgili bir sorunu ortaya çıkarabilmenizdir. maksimum rastgele efekt yapısının veriler tarafından desteklenmemesinin nedeni) veya lme4modele neden sığamayacağını ortaya çıkarabilir . Bilgilendirici öncelikler kullanılmadığı sürece bir Bayes modelinin iyi yakınsamadığı durumlarla karşılaştım - ki bu iyi olabilir veya olmayabilir.

Kısacası, her iki yaklaşımın da değeri vardır.

Bununla birlikte, her zaman ilk modelin en uygun rastgele etkiler yapısını belirlemek için uzman alan bilgisi tarafından cimri ve bilgili olduğu bir yerden başlayacağım. Gruplama değişkenleri belirtme nispeten kolaydır, ancak rastgele yamaçları genellikle yok olması dahil edilecek. Bunları yalnızca sağlam teorik anlamda anlamlıysa VE veriler tarafından destekleniyorsa dahil edin.

Düzenleme: Yorumlarda, maksimum rastgele etki yapısına uyacak sağlam teorik nedenler olduğu belirtilmektedir. Yani, eşdeğer Bayes modeli ile devam etmek nispeten kolay bir yolu çağrısı takas etmektir glmerile stan_glmergelen rstanarmpaketin - tak ve çalıştır olarak tasarlanmıştır. Varsayılan öncelikleri vardır, böylece bir modeli hızlıca takabilirsiniz. Pakette ayrıca yakınsamanın değerlendirilmesi için birçok araç bulunmaktadır. Tüm parametrelerin makul değerlere yakınlaştığını görürseniz, hepiniz iyisinizdir. Bununla birlikte, bir takım sorunlar olabilir - örneğin, sıfırda veya altında tahmin edilen bir sapma veya kaymaya devam eden bir tahmin. Mc-stan.org sitesi zengin bir bilgi ve kullanıcı forumuna sahiptir.


1
Evet, X'in Y üzerindeki gerilemesinin A ve B koşulu için deneklere göre farklı olması gerektiğini varsaymak için iyi teorik nedenlerim var. Regresyon işleme stilini ima ediyor. İz grafiklerini tekillik nedenleri için bir teşhis aracı olarak nasıl yorumlayacağınız hakkında biraz daha bilgi verebilir misiniz?
Kullanıcı33268

12

Bu ilginç cevaplar ve yorumlar ile çok ilginç bir konu! Bu henüz gündeme getirilmediğinden, her konu için çok az veriye sahip olduğumuzu belirtmek istedim (anladığım kadarıyla). Aslında, her bir öznenin her bir cevap değişkeni Y, kategorik değişken Koşul ve sürekli değişken X için sadece iki değeri vardır. Özellikle, Koşulun iki değerinin A ve B olduğunu biliyoruz.

Karışık etki modellemesi yerine iki aşamalı regresyon modelini takip edecek olsaydık, aşağıdaki oyuncak örneğinde gösterildiği gibi, belirli bir öznenin verilerine doğrusal bir regresyon modelini bile sığdıramıyorduk:

y <- c(4, 7)
condition <- c("A", "B")
condition <- factor(condition)
x <- c(0.2, 0.4)

m <- lm(y ~ condition*x)
summary(m)

Bu konuya özgü modelin çıktısı:

Call:
lm(formula = y ~ condition * x)

Residuals:
ALL 2 residuals are 0: no residual degrees of freedom!

Coefficients: (2 not defined because of singularities)
         Estimate Std. Error t value Pr(>|t|)
(Intercept)         4         NA      NA       NA
conditionB          3         NA      NA       NA
x                  NA         NA      NA       NA
conditionB:x       NA         NA      NA       NA

Residual standard error: NaN on 0 degrees of freedom
Multiple R-squared:      1,     Adjusted R-squared:    NaN 
F-statistic:   NaN on 1 and 0 DF,  p-value: NA

4 regresyon katsayısını ve sadece 2 gözlem kullanarak hata standart sapmasını tahmin etmeye çalıştığımız için model uyumunun tekilliklerden muzdarip olduğuna dikkat edin.

Tekillikler, bu konuyu her koşulda bir defadan çok iki kez gözlemlesek bile devam edecektir. Ancak, konuyu her koşulda 3 kez gözlemlersek, tekilliklerden kurtulabiliriz:

y <- c(4, 7, 3, 5, 1, 2)
condition <- c("A", "B", "A","B","A","B")
condition <- factor(condition)
x <- c(0.2, 0.4, 0.1, 0.3, 0.3, 0.5)

m2 <- lm(y ~ condition*x)
summary(m2)

Tekilliklerin kaybolduğu bu ikinci örnek için karşılık gelen R çıktısı:

>     summary(m2)

Call:
lm(formula = y ~ condition * x)

Residuals:
    1       2       3       4       5       6 
1.3333  2.3333 -0.6667 -1.1667 -0.6667 -1.1667 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)
(Intercept)     4.667      3.555   1.313    0.320
conditionB      6.000      7.601   0.789    0.513
x             -10.000     16.457  -0.608    0.605
conditionB:x   -5.000     23.274  -0.215    0.850

Residual standard error: 2.327 on 2 degrees of freedom
Multiple R-squared:  0.5357,    Adjusted R-squared:  -0.1607 
F-statistic: 0.7692 on 3 and 2 DF,  p-value: 0.6079

Tabii ki, karışık efektler modeli, her bir konu için ilgisiz, ayrı doğrusal regresyon modellerine uymaz - kesişmeleri ve / veya eğimleri tipik bir kesişme ve / veya eğim hakkında rastgele sapan "ilgili" modellere uyar, böylece rastgele sapmalar tipik kesişme ve / veya tipik eğim, ortalama sıfır ve bir miktar bilinmeyen standart sapma ile bir Normal dağılım izler.

Öyle olsa bile, sezgim karışık etkiler modelinin her konu için az sayıda gözlemle (sadece 2) mücadele ettiğini gösteriyor. Model rastgele eğimlerle ne kadar fazla yüklenirse, muhtemelen o kadar fazla mücadele eder. Şüpheliyim ki, her denek 2 yerine 6 gözlem (koşul başına 3) katkıda bulunursa, artık tüm rastgele eğimleri karşılamak için mücadele etmeyecektir.

Bana öyle geliyor ki, bu (?) Mevcut çalışma tasarımının karmaşık modelleme hırslarını desteklemediği bir durum olabilir - bu hırsları desteklemek için, her bir konu için (veya en azından bazıları için) her koşulda daha fazla gözlem gerekecektir. tabi?). Bu sadece benim sezgim, umarım başkaları yukarıdaki gözlemlerime kendi fikirlerini ekleyebilirler. Şimdiden teşekkür ederim!


Seni düzeltmem gerekiyor - her katılımcının hem A hem de B koşullarında hem X hem de Y için 30 gözlemi var!
Kullanıcı33268

2
Oh, bu ilk cevabınızda belirtilmedi, bu yüzden konu ve koşul başına kaç gözlem olduğunu gerçekten tahmin etmem imkansız olurdu. O zaman başka bir şey oluyor. X değişkeninizi standartlaştırmayı denediniz mi? Bu benim için uygun mu? Ayrıca, her denek için Durum = A ve Durum = B için Y'ye karşı X (veya standartlaştırılmış X) grafiklerine baktınız mı? Bu, olup bitenler hakkında ek ipuçları verebilir.
Isabella Ghement

X'i standardize etmedim çünkü reaksiyon süresi verisi ve regresyon katsayısının yorumlanması için önemlidir. Ancak, veriler merkezileştirildi. Bireysel arazilere bakacağım ve göreceğim ...
Kullanıcı33268

2
@ User33268 Partiye biraz geç kaldım, ancak yine de standartlaştırılmış katsayıları yorumlayabilirsiniz, sadece ölçekleme için kullanılan değerleri depolamanız ve modeli çalıştırdıktan sonra geri dönüştürmeniz gerekir.
Frans Rodenburg
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.