Rasgele eğimli karışık modelde sınıf içi korelasyon katsayısı


10

Katılımcılar ( ) ve öğeler ( ) için çapraz rastgele efektlerle m_plotdonatılmış aşağıdaki modele sahibim :lme4::lmerlfdncontent

Random effects:
 Groups   Name             Variance Std.Dev. Corr                                     
 lfdn     (Intercept)      172.173  13.121                                            
          role1             62.351   7.896    0.03                                    
          inference1        24.640   4.964    0.08 -0.30                              
          inference2        52.366   7.236   -0.05  0.17 -0.83                        
          inference3        21.295   4.615   -0.03  0.22  0.86 -0.77                  
 content  (Intercept)       23.872   4.886                                            
          role1              2.497   1.580   -1.00                                    
          inference1        18.929   4.351    0.52 -0.52                              
          inference2        14.716   3.836   -0.16  0.16 -0.08                        
          inference3        17.782   4.217   -0.17  0.17  0.25 -0.79                  
          role1:inference1   9.041   3.007    0.10 -0.10 -0.10 -0.21  0.16            
          role1:inference2   5.968   2.443   -0.60  0.60 -0.11  0.78 -0.48 -0.50      
          role1:inference3   4.420   2.102    0.30 -0.30  0.05 -0.97  0.71  0.37 -0.90
 Residual                  553.987  23.537                                            
Number of obs: 3480, groups:  lfdn, 435 content, 20

Katılımcılar ve öğeler için Sınıf içi Korelasyon Katsayılarını (ICC) bilmek istiyorum. Bu harika cevap sayesinde prensip olarak modelim için ICC'yi nasıl alacağımı biliyorum. Ancak, rastgele yamaçları dahil edip etmeyeceğinizden emin değilim:

vars <- lapply(summary(m_plot)$varcor, diag)
resid_var <- attr(summary(m_plot)$varcor, "sc")^2
total_var <- sum(sapply(vars, sum), resid_var)

# with random slopes
sapply(vars, sum)/total_var
##       lfdn    content 
## 0.33822396 0.09880349

# only random intercepts:
sapply(vars, function(x) x[1]) / total_var
##   lfdn.(Intercept) content.(Intercept) 
##         0.17496587          0.02425948 

Aynı katılımcıdan aynı soruya ilişkin iki yanıt arasındaki korelasyon için uygun önlem nedir?


1
Merlo et al 2005 "Sosyal epidemiyolojide çok düzeyli analiz üzerine kısa bir kavramsal eğitim: farklı insan gruplarındaki bağlamsal olayların araştırılması" yararlı bir referans olabilir.
N Brouwer

@Henrik bu soruya hiç cevap buldunuz mu? Ben de ilgileniyorum.
Patrick S. Forscher

2
@ PatrickS.Forscher Anladığım kadarıyla, ICC rastgele eğimlerle mantıklı değil. Bunu Jake Westfall'dan öğrendim.
Henrik

Şans eseri okuma ile ilgili bir bağlantınız var mı?
Patrick S. Forscher

1
@ PatrickS.Forscher Gördüğünüz gibi, Jake Westfall şimdi harika bir cevap verdi.
Henrik

Yanıtlar:


8

Temel olarak, rastgele eğimler modelinde kümeleme derecesini özetleyebilecek tek bir sayı veya tahmin yoktur.

Sınıf içi korelasyon (ICC) sadece rastgele-interferanslı modellerde varyansların basit bir oranı olarak yazılabilir. Nedenini görmek için, burada ICC ifadesinin türetilmesinin bir taslağını bulabilirsiniz .

Model denklemine rastgele eğimler attığınızda, aynı adımları izlemek bu makalenin 5. sayfasındaki ICC ifadesine yol açar . Gördüğünüz gibi, bu karmaşık ifade X tahmincisinin bir işlevidir. Daha sezgisel olarak rasgele eğimler olduğunda var (Y) 'nin neden X'e bağlı olduğunu görmek için , bu slaytların 30. sayfasına bakın ("Varyans neden x'e bağlıdır? ? ") .

ICC, öngörücülerin (x-değerleri) bir işlevi olduğundan, yalnızca belirli x-değerleri kümeleri için hesaplanabilir. Belki de ICC'yi x-değerlerinin ortak ortalaması olarak bildirmek gibi bir şey deneyebilirsiniz, ancak bu tahmin gözlemlerin çoğunluğu için açıkça yanlış olacaktır.

Söylediğim her şey hala sadece tek bir rastgele faktörün olduğu vakalara atıfta bulunuyor. Çoklu rastgele faktörlerle daha da karmaşık hale gelir. Örneğin, her sahadaki katılımcıların bir uyaran örneğine (yani 3 rastgele faktör: saha, katılımcı, uyaran) cevap verdiği çok alanlı bir projede, birçok farklı ICC hakkında soru sorabiliriz: İki yanıt arasında beklenen korelasyon nedir? farklı katılımcılardan aynı sitede, aynı uyaranda? Farklı sitelerde, aynı teşvikte ve farklı katılımcılarda ne dersiniz? Ve bunun gibi. @rvl, OP'nin bağlantılı olduğu cevapta bu komplikasyonlardan bahseder.

Gördüğünüz gibi, kümelenme derecesini tek bir değerle özetleyebileceğimiz tek durum, tek rastgele faktör rastgele kesişme durumudur. Bu, gerçek dünyadaki vakaların küçük bir oranı olduğundan, ICC'ler çoğu zaman bu kadar yararlı değildir. Bu yüzden genel tavsiyem onlar hakkında endişelenmemek bile. Bunun yerine, sadece varyans bileşenlerinin (tercihen standart sapma formunda) raporlanmasını öneririm.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.