Sabit bir efektin karma efektler modelindeki rastgele bir efektin düzeyleri arasında değişmesine ne zaman izin vermemeliyim *?


16

Öngörülen bir değişken (P), rastgele bir efekt (R) ve sabit bir etki (F) göz önüne alındığında, iki * karışık efekt modeli ( lme4 sözdizimi) sığabilir :

m1 = lmer( P ~ (1|R) + F )
m2 = lmer( P ~ (1+F|R) + F)

Anladığım kadarıyla, ikinci model, sabit etkinin rastgele etki seviyelerinde değişmesine izin veren modeldir.

Araştırmamda genellikle birden fazla insan katılımcı üzerinde gerçekleştirilen deneylerden elde edilen verileri analiz etmek için karışık efekt modelleri kullanıyorum. Katılımcıyı rastgele bir etki olarak ve deneysel manipülasyonları sabit etkiler olarak modellerim. Bence sabit etkilerin deneydeki performansı etkileme derecesinin katılımcılar arasında değişmesine izin vermek mantıklıdır. Ancak, sabit etkilerin rastgele bir etki düzeyine göre değişmesine izin vermem gereken durumları hayal etmekte sorun yaşıyorum, bu yüzden sorum şu:

Ne zaman sabit bir etkinin rastgele bir efektin seviyeleri arasında değişmesine izin verilmemelidir ?


Hala lme4 sözdizimini tam olarak anlamıyorum, bu yüzden cevabı görmeyi merak ediyorum. Ama şu farkla ilgili bir önsezim var: P, bir öğrencinin ödev yapmak için harcadığı zaman, R sınıf düzeyinde bir tedavi ve F öğrencidir. (Ayrıca sınıfın kendisi için rastgele bir etkiye sahip olmalıyız.) Eğer tüm öğrenciler farklı zamanlarda tüm tedaviler R'ye tabi tutulursa, F seviyeleri sınıflar arasında karşılaştırılabilir. Bir okulu bir kerede ölçersek, her sınıfta farklı öğrencilerimiz var, bu yüzden farklı sınıflardaki F seviyelerinin birbirleriyle hiçbir ilgisi yok.
Thomas Levine

Yanıtlar:


11

PijFijij

Yij=β0i+β1iFij

Bu bizim ilk düzey gerilememiz. İkinci düzey regresyon ilk regresyon katsayıları üzerinde yapılır:

β0i=γ00+u0iβ1i=γ01+u1i

bunu birinci düzey regresyonda değiştirdiğimizde

Yij=(γ0+u0i)+(γ01+u1i)Fij=γ0+u0i+u1iFij+γ01Fij

γuγu

Yazdığım model lmersözdizimine karşılık geliyor

P ~ (1+F|R) + F

β1i=γ01

Yij=γ0+u0i+γ01Fij

bu lmersözdizimine karşılık gelir

P ~ (1|R) + F

Şimdi soru, hata terimini ikinci seviye gerilemeden ne zaman hariç tutabiliriz? Kanonik cevap, ikinci düzeyde regresyondaki regresörlerin (burada herhangi birimiz yok, ancak bunları dahil edebiliriz, doğal olarak sabittir) emin olduğumuzda, sınıflar arasındaki katsayıların varyansını tam olarak açıklar.

Fiju1i

Not . Sadece cebirsel bir açıklama yaptım, ama bence bunu akılda tutmak, uygulamalı örneği düşünmek çok daha kolay.


İlk denklemin de bir hata terimi varsa:Yij=β0i+β1iFij+eij
Nikita Samoylov

evet, ama netlik için atladım bence.
mpiktas

10

"Sabit efekt" i, varyans bileşenini sıfır olan "rastgele efekt" olarak düşünebilirsiniz.

Dolayısıyla, sabit etkinin neden değişmesine izin vermeyeceğinize basit bir cevap, "yeterince büyük" bir varyans bileşeni için yetersiz kanıttır. Kanıt hem önceki bilgilerden hem de verilerden gelmelidir. Bu temel "occam'ın ustura" ilkesi ile uyumludur: modelinizi olması gerekenden daha karmaşık hale getirmeyin.

Doğrusal karışık modelleri şu şekilde düşünme eğilimindeyim, aşağıdaki gibi çoklu bir regresyon yazıyorum:

Y=Xβ+Zu+e

Yani modelin "sabit" kısmı, "rastgele" kısmı ve OLS tarzı artıktır. "Rasgele etki" varyans parametreleri ve için . Bu, standart sonuçları , yani:XβZueuN(0,D(θ))θeN(0,σ2I)(Zu+e)N(0,ZD(θ)ZT+σ2I)

YN(Xβ,ZD(θ)ZT+σ2I)

Bunu OLS regresyonuyla ( ) karşılaştırın ve şunu elde ederiz:Z=0

YN(Xβ,σ2I)

Dolayısıyla modelin "rastgele" kısmı, modeldeki parazit veya hata bileşeninin korelasyon yapısı hakkında önceden bilgi belirtmenin bir yolu olarak görülebilir . OLS temel olarak, bir durumda modelin sabit kısmından herhangi bir hatanın, modelin sabit kısmını kesin olarak bilsek bile, başka bir hatayı tahmin etmek için işe yaramaz olduğunu varsayar. Rastgele bir efekt eklemek temel olarak bazı hataların diğer hataları tahmin etmede yararlı olabileceğini düşündüğünüz anlamına gelir.


5

Bu çok iyi cevapları olan oldukça eski bir sorudur, ancak bence daha pragmatik bir bakış açısıyla yeni bir cevaptan faydalanabilir.

Ne zaman sabit bir etkinin rastgele bir efektin seviyeleri arasında değişmesine izin verilmemelidir?

Diğer cevaplarda daha önce açıklanan konulara değinmeyeceğim, bunun yerine şimdi ünlü olana değineceğim, ancak Barr ve arkadaşlarının (2013) sık sık "En fazla tut"

Barr, DJ, Levy, R., Scheepers, C. ve Tily, HJ, 2013. Doğrulayıcı hipotez testi için rasgele efekt yapısı: Maksimum tutun. Bellek ve dil dergisi, 68 (3), s.255-278.

Bu makalede yazarlar, tüm sabit etkilerin gruplama faktörlerinin düzeyleri arasında (rastgele kesişmeler) değişmesine izin verilmesi gerektiğini savunmaktadır. Onların argümanı oldukça zorlayıcı olduğunu - tarafından temelde o değil onları değişmesine izin, bu model üzerinde heybetli kısıtlamalar olduğunu. Bu diğer cevaplarda iyi tanımlanmıştır. Bununla birlikte, bu yaklaşımda Bates el al (2015) tarafından açıklanan potansiyel olarak ciddi problemler vardır:

Bates, D., Kliegl, R., Vasishth, S. ve Baayen, H., 2015. Cimri karışık modeller. arXiv ön baskı arXiv: 1506.04967

Burada, Bates'in lme4R'ye karışık modelleri takmak için paketin birincil yazarı olduğunu ve muhtemelen bu tür modeller için en yaygın olarak kullanılan paket olduğunu belirtmek gerekir . Bates ve diğerleri, gerçek dünyadaki birçok uygulamada, verilerin her bir kümede ilgili değişkenler için yetersiz sayıda gözlem bulunduğundan, maksimum rastgele etki yapısını desteklemeyeceğini unutmayın. Bu, yakınsamayan veya rastgele efektlerde tekil olan modellerde kendini gösterebilir. Bu sitedeki bu tür modellerle ilgili çok sayıda soru bunu kanıtlamaktadır. Ayrıca Barr ve arkadaşlarının makalelerinin temeli olarak "iyi davranmış" rastgele etkileri olan nispeten basit bir simülasyon kullandıklarını belirtmişlerdir. Bunun yerine Bates ve arkadaşları aşağıdaki yaklaşımı önermektedir:

(1) rastgele etki yapısının varyans-kovaryans matrisinin boyutsallığını belirlemek için PCA kullanmanızı, (2) başlangıçta korelasyon parametrelerini başlangıçta sıfıra sınırlamak, özellikle de maksimum bir modele uymaya yönelik ilk girişim birleşmediğinde, ve (3) anlamlı olmayan varyans bileşenlerini ve bunların ilişkili korelasyon parametrelerini modelden çıkarmak

Aynı makalede şunları da not ediyorlar:

Önemli olarak, yakınsama başarısızlığı, tahmin algoritmasının kusurlarından kaynaklanmaz, ancak veriler tarafından uygun şekilde desteklenemeyecek kadar karmaşık bir modele uymaya çalışmanın doğrudan bir sonucudur.

Ve:

anti-konservatif sonuçlara karşı korunmak için maksimum modeller gerekli değildir. Bu koruma, verilerin destekleyebileceği karmaşıklık hakkında gerçekçi beklentiler tarafından yönlendirilen kapsamlı modellerle tamamen sağlanır. İstatistiklerde, bilimin başka yerlerinde olduğu gibi, cimri bir erdemdir, bir mengene değildir.

Bates ve ark. (2015)

Daha uygulamalı bir bakış açısından, yapılması gereken diğer bir husus da, veri üretim sürecinin, verinin altında yatan biyolojik / fiziksel / kimyasal teorinin analisti rastgele etki yapısını belirlemeye yönlendirmesi gerekip gerekmediğidir.


“çoğu zaman her kümede yetersiz sayıda gözlem olduğu için” bunu açıklayabilir misiniz? Küme başına gereken minimum sayı 1? Bu bile kabul edilen cevabınız: stats.stackexchange.com/questions/388937/…
LuckyPal

@LuckyPal bağlandığınız soru rastgele kesişmelerle ilgili, bu rastgele eğimlerle ilgili. 1 örneklem büyüklüğü için eğimi nasıl tahmin edersiniz?
Robert Long

Alınan nokta. Teşekkürler! +1 Ama yeterli küme varsa, küme başına sadece bir gözlemle sabit bir eğimi tahmin edebiliriz, değil mi? Bu biraz garip görünüyor. Belki, örneklem büyüklüğü nedeniyle rastgele bir eğimle yakınsama problemleri olduğunda, eğimin tahmini - rastgele olsun ya da olmasın - genel olarak sorgulanabilir olabilir?
LuckyPal

@LuckyPal evet, sabit bir eğimin tahmini tüm kümeler arasındadır, bu yüzden bu genellikle bir sorun değildir. Küçük kümeler ile rastgele bir eğim tahmin etmenin yakınsama sorunlarına yol açabileceğini kabul ediyorum, ancak sabit bir eğimin tahminini etkilememesi gerekir.
Robert Long
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.