R lmer hile sayfası


160

Bu forumda, çeşitli hiyerarşik modelleri belirlemenin doğru yolu hakkında çok fazla tartışma var lmer.

Tüm bilgilerin bir yerde olmasının harika olacağını düşündüm. Başlamak için birkaç soru:

  1. Nasıl bir grubun diğerini içinde yuvalanmış farklı seviyelerini belirlemek için: öyle (1|group1:group2)ya (1+group1|group2)?
  2. Arasındaki fark nedir (~1 + ....)ve (1 | ...)ve (0 | ...)vb?
  3. Grup düzeyinde etkileşimler nasıl belirtilir?

11
Manuel ve üç vinyet lme4paketine edilebilir CRAN bulunan
Henry

4
CRAN materyallerine ek olarak, ders slaytları ve Doug'un yazdığı bir kitabın taslak bölümleri r- forge'dan temin edilebilecek lme4'le (G) LMM'ler ve R üzerine yazılmıştır
Gavin Simpson

Bates ve arkadaşları tarafından JSS kağıdının arXiv versiyonuna doğrudan bağlantı: lme4 kullanarak Lineer Karışık Etki Modellerinin Takılması (özellikle Bölüm 2.2 "Karışık model formüllerinin anlaşılması"). Ayrıca Ben Bolker SSS’nin ilgili bölümüne de bakınız .
amip

5
Muhtemelen, kullanılan dil lmergenel istatistiksel olarak ilgi alanına girmiştir ve bu nedenle yalnızca programlama meselesi değildir. Bu yüzden bu konuyu açık tutmak için oy kullanıyorum.
whuber

2
@whuber +1 Tamamen katılıyorum.
amip

Yanıtlar:


180

(~ 1 + ....) ve (1 | ...) ve (0 | ...) vs. arasındaki fark nedir?

Rasgele bir etki olarak değerlendirilen kategorik değişken V2 ile öngörülen V1 değişkenine ve doğrusal sabit bir etki olarak değerlendirilen sürekli değişken V3'e sahip olduğunuzu varsayalım. Lmer sözdizimini kullanarak, en basit model (M1):

V1 ~ (1|V2) + V3

Bu model tahmin edecektir:

P1: Global bir engelleme

P2: Rastgele efekt V2 için kesişir (yani, her V2 seviyesi için, bu seviyenin kesişiminin global kesişimden sapması)

P3: V3'ün etkisi (eğimi) için tek bir küresel tahmin

Bir sonraki en karmaşık model (M2):

V1 ~ (1|V2) + V3 + (0+V3|V2)

Bu model tüm parametreleri M1'den tahmin eder, ancak ek olarak tahmin edecektir:

P4: V3'ün her seviyesindeki V3'ün etkisi (daha spesifik olarak, belirli bir seviye içinde V3 etkisinin derecesinin V3'ün küresel etkisinden sapma derecesi), engellemedeki sapmalar ile V3 arasındaki seviyeler arasındaki sapma arasındaki korelasyonu zorlamak V2 .

Bu son kısıtlama, son en karmaşık modelde (M3) gevşetilir:

V1 ~ (1+V3|V2) + V3

M2'den gelen tüm parametrelerin kesişim sapmaları ile V3 arasındaki korelasyona izin verilirken V2 seviyelerindeki sapmaları etkilediği tahmin edilmektedir. Böylece, M3'te ek bir parametre tahmin edilir:

P5: Kesişme sapmaları ve V2 seviyelerinde V3 sapmaları arasındaki korelasyon

Genellikle M2 ve M3 gibi model çiftleri hesaplanır ve daha sonra sabit etkiler arasındaki korelasyon kanıtlarını değerlendirmek için karşılaştırılır (global müdahale dahil).

Şimdi başka bir sabit etki tahmincisi, V4 eklemeyi düşünün. Model:

V1 ~ (1+V3*V4|V2) + V3*V4

tahmin ediyorum:

P1: Global bir engelleme

P2: V3'ün etkisi için tek bir küresel tahmin

P3: V4'ün etkisi için tek bir küresel tahmin

P4: V3 ve V4 arasındaki etkileşim için tek bir küresel tahmin

P5: Her V2 seviyesindeki P1'den kesişimin sapmaları

P6: gelen V3 etkisinin sapmalar P2 V2 her düzeyde

P7: den V4 etkisinin Sapmalar P3 V2 her düzeyde

P8: gelen V3-by-V4 etkileşiminin Sapma P4 V2 her düzeyde

P9 V5 seviyeleri arasında P5 ve P6 arasındaki korelasyon

P10 V5 seviyeleri arasında P5 ve P7 arasındaki korelasyon

P11 P5 ve P8 arasındaki V2 seviyeleri arasındaki korelasyon

P12 V6 seviyeleri arasında P6 ve P7 arasındaki korelasyon

P13 P6 ve P8 arasındaki V2 seviyeleri arasındaki korelasyon

P14 arasındaki korelasyon P7 ve P8 V2 düzeyleri arasında

Phew , Çok fazla parametre var! Ve model tarafından tahmin edilen varyans parametrelerini listelemek için bile uğraşmadım. Dahası, sabit bir etki olarak modellemek istediğiniz 2'den fazla seviyeli bir kategorik değişkeniniz varsa, bu değişken için tek bir etki yerine, her zaman k-1 etkilerini tahmin edersiniz (burada k, düzeylerin sayısıdır) Böylece, model tarafından tahmin edilecek olan parametrelerin sayısı daha da arttırılabilir.


1
@ Mike Lawrence Cevabınız için teşekkürler! 3 seviyeli bir model o zaman nasıl tahmin edilir? bir gruplandırma faktörü diğerinin içinde nerede bulunur?

DBR, hangi seviyelerin olduğunu bildiğini sanmıyorum. Sonsuza dek bunu soruyordun. Deneme tasarımınızı gerçekten ayrıntılandıran ve "seviye" hakkındaki yorumunuzu gösteren bir soru oluşturun.
John

3
Bence DBR hiyerarşideki seviyelere atıfta bulunuyor. Açıkladığım şey, konular içinde iç içe geçmiş gözlemlerle birlikte 2 seviyeli bir hiyerarşik modeldir ve DBR, hem öğrencileri hem de okulları rastgele olarak modellemek istediğiniz okullardaki öğrencilerde test maddeleri olabilecek yaklaşık 3 seviyeli hiyerarşiyi sormaktadır. Etkileri, okullara yerleştirilmiş öğrencilerle birlikte. Bu gibi durumlarda, okul düzeyinde sapmaların önce hesaplandığını, sonra okuldan öğrenci sapmalarının olduğunu tahmin ediyorum.
Mike Lawrence,

2
Modellerin kurulumunu yaparken gördüğüm en iyi cevap. Patronumun R ile ne yaptığımı anlamalarını sağlamak için lmer ile kolay bir çerçeve oluşturmama yardım etti.
bfoste01

Diyelim ki bireysel düzeyde bir bağımsız değişken (X) ve grup düzeyinde bir bağımsız değişken (Z) var. Her ikisi de sürekli değişkendir. Model $$ Y_ {ij} = \ gamma_ {00} + \ gamma_ {10} X_ {ij} + \ gama_ {01} Z_ {j} + \ gama_ {11} X_ {ij} Z_ {j} + u_ {1j} X_ {ij} + u_ {0j} + e_ {ij} $$; sonra syntex kullanarak model , bireyin hangi gruba ait olduğunu belirten veri çerçevesindeki başka bir değişken nerede olacak?
Yij=γ00+γ10Xij+γ01Zj+γ11XijZj+u1jXij+u0j+eij
, where subscript i denotes ith individual and j denotes jth group . then using lmerY~X+Z+(1|group)+(0+X|Z)group
ABC

50

Genel numara, başka bir cevapta belirtildiği gibi , formülün formu izlemesidir dependent ~ independent | grouping. groupingEğer herhangi bir gruplama olmadan sabit faktörler içerebilir ve herhangi bir sabit faktör (kesişme tek model) için ek rasgele faktörler olabilir, genel olarak rasgele bir faktördür. Bir +faktörleri arasında, herhangi bir etkileşim gösterir *etkileşimini göstermektedir.

Rastgele faktörler için üç temel değişkeniniz vardır:

  1. Sadece rastgele faktör tarafından yakalanır: (1 | random.factor)
  2. Sadece rastgele faktör tarafından eğimler: (0 + fixed.factor | random.factor)
  3. Rastgele faktöre göre kavramlar ve eğimler: (1 + fixed.factor | random.factor)

Varyant 3'ün, aynı grupta, yani aynı zamanda hesaplanan eğim ve kesişme noktalarına sahip olduğuna dikkat edin. Eğim ve kesişmenin bağımsız olarak hesaplanmasını istiyorsak, yani ikisi arasında varsayılan bir korelasyon olmadan, dördüncü bir değişkene ihtiyacımız var:

  • Rastgele faktörü ile ayrı ayrı açıklık ve eğim,: (1 | random.factor) + (0 + fixed.factor | random.factor). Bunu yazmanın alternatif bir yolu da çift çubuk gösterimi kullanmaktır fixed.factor + (fixed.factor || random.factor).

Bir de var güzel özeti bakmak gerekir bu soruya başka bir cevap olarak.

Eğer matematiğe biraz kazmak üzereyseniz, Barr ve ark. (2013) lmersözdizimini, tableless markdown kısıtlamalarını karşılamak için burada uyarlanmış olan Tablo 1'lerinde oldukça iyi özetlemektedir . Bu makale psikodilbilimsel verilere değindi, bu yüzden iki rastgele etki Subjectve Item.

Modeller ve eşdeğer lme4formül sözdizimi:

    • Ysi=β0+β1Xi+esi
    • Yok (Karışık efektli bir model değil)
    • Ysi=β0+S0s+β1Xi+esi
    • Y ∼ X+(1∣Subject)
    • Ysi=β0+S0s+(β1+S1s)Xi+esi
    • Y ∼ X+(1 + X∣Subject)
    • Ysi=β0+S0s+I0i+(β1+S1s)Xi+esi
    • Y ∼ X+(1 + X∣Subject)+(1∣Item)
    • Ysi=β0+S0s+I0i+β1Xi+esi
    • Y ∼ X+(1∣Subject)+(1∣Item)
    • (4) olarak, ancak , bağımsız S0sS1s
    • Y ∼ X+(1∣Subject)+(0 + X∣ Subject)+(1∣Item)
    • Ysi=β0+I0i+(β1+S1s)Xi+esi
    • Y ∼ X+(0 + X∣Subject)+(1∣Item)

Referanslar:

Barr, Dale J, R. Levy, C. Scheepers ve HJ Tily (2013). Doğrulayıcı hipotez testi için rastgele etkiler yapısı: Maksimumda tutun . Bellek ve Dil Dergisi, 68: 255–278.


4
Güzel. Yuvalanmış '/' faktörleri ve çift çubuk notasyonu '||' ile ilgili bilgiler daha iyi olabilirdi.
skan

1
Peki ya: sembol?
eastafri

1
@eastafri R'nin (her yerde) her yerde yaptığı şeyin iki değişken arasındaki etkileşim anlamına gelir.
Livius

(6) 'da anladığım kadarıyla $ S_ {0s} $ ve $ S_ {1s} $ aralarında bir ilişki yok. Başka bir deyişle, rastgele değişkenler olarak, kovaryansları $ 0 $ dır. $ S_ {0s} $ ve $ S_ {1s} $ 'ın bağımsız olduğunu söylemek, daha güçlü bir ifadedir ve bu nedenle mutlaka doğru değildir. Yanılıyor muyum? S0s and S1s have no correlation between them. In other words, as random variables, their covariance is 0. To say that S0s and S1s are independent is a stronger statement and, hence, not necessarily true. Am I mistaken?
Muno

4

|Sembol karışık yöntemlerde bir gruplandırma faktörünü belirtmektedir.

Pinheiro & Bates’e göre:

... Formül aynı zamanda bir cevap ve mümkün olduğunda birincil değişkenleri belirtir . Olarak verilir

response ~ primary | grouping

burada responseyanıt primaryiçin bir ifade, birincil değişken groupingiçin bir ifadedir ve gruplandırma faktörü için bir ifadedir.

Karma yöntemler analizi yapmak için hangi yöntemi kullandığınıza bağlı olarak , analizde gruplamayı kullanabilmek için Rbir groupedDatanesne oluşturmanız gerekebilir (ayrıntılar için nlmepakete bakın, lme4buna gerek duymuyor). lmerVerilerinizi bilmediğim için model ifadelerinizi belirttiğiniz şekilde konuşamam . Ancak, (1|foo)model çizgisinde çoğul olmak, gördüğümden alışılmadık bir durum değil. Neyi modellemeye çalışıyorsun?

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.