Bir lmer modelden etkilerin tekrarlanabilirliğinin hesaplanması


28

Bu yazıda , karışık etki modellemesi ile bir ölçümün tekrarlanabilirliğini (diğer bir deyişle güvenilirlik, sınıf içi korelasyon) nasıl hesaplayacağımı anladım . R kodu şöyle olurdu:

#fit the model
fit = lmer(dv~(1|unit),data=my_data)

#obtain the variance estimates
vc = VarCorr(fit)
residual_var = attr(vc,'sc')^2
intercept_var = attr(vc$id,'stddev')[1]^2

#compute the unadjusted repeatability
R = intercept_var/(intercept_var+residual_var)

#compute n0, the repeatability adjustment
n = as.data.frame(table(my_data$unit))
    k = nrow(n)
    N = sum(n$Freq)
n0 = (N-(sum(n$Freq^2)/N))/(k-1)

#compute the adjusted repeatability
Rn = R/(R+(1-R)/n0)

Bu yaklaşımın, etkilerin güvenilirliğini hesaplamak için de kullanılabileceğine inanıyorum (örneğin, 2 seviyeli bir değişkenin toplam kontrast etkisi):

#make sure the effect variable has sum contrasts
contrasts(my_data$iv) = contr.sum

#fit the model
fit = lmer(dv~(iv|unit)+iv,data=my_data)

#obtain the variance estimates
vc = VarCorr(fit)
residual_var = attr(vc,'sc')^2
effect_var = attr(vc$id,'stddev')[2]^2

#compute the unadjusted repeatability
R = effect_var/(effect_var+residual_var)

#compute n0, the repeatability adjustment
n = as.data.frame(table(my_data$unit,my_data$iv))
k = nrow(n)
N = sum(n$Freq)
    n0 = (N-(sum(n$Freq^2)/N))/(k-1)

#compute the adjusted repeatability
Rn = R/(R+(1-R)/n0)

Üç soru:

  1. Bir etkinin tekrarlanabilirliğinin nokta tahminini elde etmek için yukarıdaki hesaplamalar bir anlam ifade ediyor mu?
  2. Tekrarlanabilirliği tahmin etmek istediğim birden fazla değişkenim olduğunda, hepsini aynı uygunluğa eklemek (örneğin lmer(dv~(iv1+iv2|unit)+iv1+iv2), her efekt için ayrı bir model oluşturmaktan daha yüksek tekrarlanabilirlik tahminleri veriyor gibi görünüyor. Birden fazla etkinin dahil edilmesi artık varyansı azaltma eğiliminde olacağından bu benim için hesaplama açısından mantıklı geliyor, ancak sonuçta ortaya çıkan tekrarlanabilirlik tahminlerinin geçerli olduğu konusunda olumlu değilim. Onlar mı?
  3. Yukarıda belirtilen yazı tekrarlanabilirlik tahminleri için güven aralıkları elde etmeme yardımcı olabilir, ancak söyleyebildiğim kadarıyla, confint(profile(fit))sadece kesişme ve etki farkları için aralıklar sağlar, buna ek olarak artık varyansın hesaplanması için zaman aralığına ihtiyaç duyacağım tekrarlanabilirlik aralığı, hayır?

Yanıtlar:


6

Sanırım en azından ayarlanmamış tekrarlanabilirlik tahminleri, yani klasik sınıf içi korelasyonlar (ICC'ler) ile ilgili sorularınıza cevap verebilirim . "Düzeltilmiş" tekrarlanabilirlik tahminlerine gelince, bağladığınız kağıdın üzerinden baktım ve uyguladığınız formülün kağıtta nerede bulunduğunu gerçekten görmedim mi? Matematiksel ifadeye dayanarak, ortalama puanların tekrarlanabilirliği gibi görünüyor (bireysel puanlar yerine). Ama bunun zaten sorunuzun kritik bir parçası olduğu açık değil, bu yüzden onu görmezden geleceğim.

(1.) Bir etkinin tekrarlanabilirliğinin nokta tahminini elde etmek için yukarıdaki hesaplamalar bir anlam ifade ediyor mu?

Evet, önerdiğiniz ifade anlamlıdır, ancak önerilen formülünüzde küçük bir değişiklik yapmanız gerekir. Aşağıda, önerilen tekrarlanabilirlik katsayınızı nasıl elde edebileceğinizi gösteriyorum. Umarım bu hem katsayının kavramsal anlamını açıklığa kavuşturur hem de neden onu hafifçe değiştirmenin istenebileceğini gösterir.

Başlamak için, ilk durumda ilk tekrarlanabilirlik katsayısını alalım ve ne anlama geldiğini ve nereden geldiğini açıklayalım. Bunu anlamak, daha karmaşık ikinci durumu anlamamıza yardımcı olacaktır.

Sadece rastgele yakalamalar

Bu durumda, karışık modeli inci yanıt grubu th burada rastgele kesişir mı varyans ve kalıntıları varyansı .ij

yij=β0+u0j+eij,
u0jσu02eijσe2

Şimdi, iki rasgele değişkenleri arasındaki korelasyon ve olarak tanımlanır xy

corr=cov(x,y)var(x)var(y).

ICC / tekrarlanabilirlik katsayısı ifadesi daha sonra iki rastgele değişkenin ve aynı grubundan çizilen iki gözlem olmasını sağlamaktan gelir , ve Bunu, yukarıda verilen tanımları ve varyansların / kovaryansların özelliklerini (burada ya da göstermeyeceğim bir işlem, siz veya başkaları benim yapmamı tercih etmezse) kullanarak basitleştirirseniz, ile bitirin. xyj

ICC=cov(β0+u0j+ei1j,β0+u0j+ei2j)var(β0+u0j+ei1j)var(β0+u0j+ei2j),
ICC=σu02σu02+σe2.
Bunun anlamı, ICC veya "düzeltilmemiş tekrarlanabilirlik katsayısı" nın, bu durumda, aynı kümeden (bu durumda sadece en büyük ortalama olan sabit etkilerden arındırılmış olan) bir çift gözlem arasında beklenen korelasyon olarak basit bir yorumu olduğu. ICC'nin de bu durumda bir varyans oranı olarak yorumlanabilmesi gerçeği tesadüfidir; Bu yorum genel olarak daha karmaşık ICC'ler için doğru değildir. Bir çeşit korelasyon olarak yorumlanması birincil olandır.

Rasgele kavramalar ve rastgele eğimler

Şimdi, ikinci durumda, "etkilerin güvenilirliği (yani bir değişkenin 2 seviyeli bir kontrast etkisi toplamı)" ile ne ifade edildiğini net bir şekilde açıklamamız gerekiyor.

İlk önce modeli hazırladık. Karışık modeli inci yanıt altında grup th kontrast kodlanmış belirleyici inci düzey isimli rastgele işaretlerin varyansa sahip olduğu rastgele yamaçların varyansı , rastgele engeller ve eğimler kovaryansı ve kalanlar varyansı var .ijkx

yijk=β0+β1xk+u0j+u1jxk+eijk,
σu02σu12σu01eijσe2

Peki bu model altında "bir etkinin tekrarlanabilirliği" nedir? Ben iyi bir aday tanımı aynı dahilinde hesaplanan fark puanlarının iki çift arasında beklenen ilişki olduğunu düşünüyorum küme ama gözlemlerin farklı çiftlerinde .ji

Dolayısıyla, söz konusu fark puanları çifti olacaktır ( kontrast kodlu olduğunu varsaydığımızı unutmayın; böylece ): ve x|x1|=|x2|=x

yi1jk2yi1jk1=(β0β0)+β1(xk2xk1)+(u0ju0j)+u1j(xk2xk1)+(ei1jk2ei1jk1)=2xβ1+2xu1j+ei1jk2ei1jk1
yi2jk2yi2jk1=2xβ1+2xu1j+ei2jk2ei2jk1.

Bunları korelasyon formülüne bize bu basitleştirir ICC'nin teknik olarak bir işlevi olduğuna dikkat edin ! Bununla birlikte, bu durumda yalnızca 2 olası değeri alabilir ve ICC bu değerlerin her ikisinde de aynıdır.

ICC=cov(2xβ1+2xu1j+ei1jk2ei1jk1,2xβ1+2xu1j+ei2jk2ei2jk1)var(2xβ1+2xu1j+ei1jk2ei1jk1)var(2xβ1+2xu1j+ei2jk2ei2jk1),
xx
ICC=2x2σu122x2σu12+σe2.
xx

Gördüğünüz gibi, bu, sorunuzda önerdiğiniz tekrarlanabilirlik katsayısına çok benzer, tek fark, ifade bir ICC veya "düzeltilmemiş tekrarlanabilirlik katsayısı" olarak yorumlanacaksa, rastgele eğim varyansının uygun şekilde ölçeklendirilmesi gerektiğidir. Yazdığınız ifade, belirleyicisinin kodlu olduğu özel durumda çalışır , ancak genel olarak değil.± 1x±12

(2.) Tekrarlanabilirliği tahmin etmek istediğim birden fazla değişkenim olduğunda, hepsini aynı uygunluğa eklemek (örneğin lmer(dv~(iv1+iv2|unit)+iv1+iv2), her efekt için ayrı bir model oluşturmaktan daha yüksek tekrarlanabilirlik tahminleri veriyor gibi görünüyor. Birden fazla etkinin dahil edilmesi artık varyansı azaltma eğiliminde olacağından bu benim için hesaplama açısından mantıklı geliyor, ancak sonuçta ortaya çıkan tekrarlanabilirlik tahminlerinin geçerli olduğu konusunda olumlu değilim. Onlar mı?

Kendi rastgele eğimlerine sahip çoklu tahmincilere sahip bir model için yukarıda sunulan benzer bir türev üzerinden çalışmanın, yukarıdaki tekrarlanabilirlik katsayısının yine de kavramsal olarak ilgilendiğimiz fark puanlarının şu anki olacağı ek komplikasyon dışında geçerli olacağını göstereceğine inanıyorum. biraz farklı bir tanımı var: yani, modeldeki diğer tahminciler için kontrol ettikten sonra düzeltilmiş araçlar arasındaki farkların beklenen korelasyonuyla ilgileniyoruz .

Eğer diğer belirleyiciler (örneğin olduğu gibi, bir dengeli denemesi), ben ICC / tekrarlanabilirlik katsayısı herhangi bir değişiklik yapmadan çalışması gerekir yukarıda özenli düşünürdüm ilgi ongorücüye diktir. Eğer ortogonal olmasalardı, bunu hesaba katmak için formülü değiştirmeniz gerekecektir, ki bu karmaşıklaşabilir, ancak umarım cevabım bunun nasıl görünebileceği hakkında bazı ipuçları vermiştir.


Haklısın Jake. Düzeltilmiş ICC, VII. Kısma aittir . Bağlantılı makalede EKRAN EDİLEN TEKRARLILIK VE MİRASLILIK . Yazarlar bireysel ölçümlerin tekrarlanabilirliği ile ölçüm araçlarının tekrarlanabilirliği arasında ayrım yapmak önemlidirR nRRn .
Gabra
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.