Karışık modellerde parametre kestirimi hakkında sezgi (varyans parametreleri ve koşullu modlar)


15

Rastgele efektlerin (BLUP'lar / koşullu modlar, örneğin özneler için) doğrusal bir karma efekt modelinin parametreleri olmadığını, bunun yerine tahmini varyans / kovaryans parametrelerinden türetilebileceğini birçok kez okudum. Örneğin, Reinhold Kliegl ve diğ. (2011) devlet:

Rastgele etkiler, deneklerin genel ortalama RT'den sapmaları ve deneklerin sabit etki parametrelerinden sapmalarıdır. Bağımsız ve normal olarak ortalama 0 ile dağıldıkları varsayılmaktadır. Bu rastgele etkilerin LMM'nin parametreleri olmadığını , sadece varyanslarının ve kovaryanslarının olduğunu bilmek önemlidir. [...] Konu verileri ile birlikte LMM parametreleri, her konu için rasgele efektlerin “tahminlerini” (koşullu modlar) oluşturmak için kullanılabilir.

Birisi rastgele etkilerin (co) varyans parametrelerinin rastgele etkileri gerçekten kullanmadan / tahmin etmeden nasıl tahmin edilebileceği sezgisel bir açıklama yapabilir mi?

Yanıtlar:


6

Biz bağımlılığını tahmin karma modeli, örneğin, bir rastgele kesişme modelinde doğrusal bir basit göz önünde ile ilgili x farklı kişilerde ve her konusu kendi rastgele kesişim olduğunu varsayalım: y = a + b x + c i + ε . Burada c i kesişim bir Gauss dağılımından c iN ( 0 , τ 2 ) geliyor olarak modellenmiştir ve rasgele gürültü de Gauss ϵ N ( 0 , σ 2yx

y=a+bx+ci+ϵ.
ci
ciN(0,τ2)
Gelensözdizimi bu model olarak yazılabilir olur.
ϵN(0,σ2).
lme4y ~ x + (1|subject)

Yukarıdakileri aşağıdaki gibi yeniden yazmak öğreticidir:

ycN(a+bx+c,σ2)cN(0,τ2)

Bu, aynı olasılık modelini belirtmenin daha resmi bir yoludur. Bu formülasyondan, rasgele etkilerinin "parametre" olmadığını doğrudan görebiliriz : gözlemlenmeyen rasgele değişkenlerdir. Peki c'nin değerlerini bilmeden varyans parametrelerini nasıl tahmin edebiliriz ?cic

Birinci denklem yukarıda anlatılan Not koşullu dağılımını verilen c . Biz dağılımını biliyorsanız c ve y | c , o zaman halledebiliriz koşulsuz dağılımını y üzerinde entegre ederek c . Bunu toplam olasılık yasası olarak biliyor olabilirsiniz . Her iki dağılım Gauss ise, sonuçta ortaya çıkan koşulsuz dağıtım da Gauss'tur.yccycyc

Bu durumda koşulsuz dağılım basitçe , ancak gözlemlerimiz denek başına birden fazla ölçüm olduğu için onlardan örnek değildir. Devam etmek için , tüm gözlemlerin tüm n boyutlu vektörü y'nin dağılımını düşünmemiz gerekir : yN ( a + b x , Σ ) burada Σ = σ 2 I n + τ 2 IN(a+bx,σ2+τ2)ny

yN(a+bx,Σ)
oluşan bir blok-köşegen matris σ 2 ve τ 2 . Sen sezgi istedin, bu yüzden matematikten kaçınmak istiyorum. Önemli olan, bu denkleminartık c olmamasıdır! Bubir gerçek gözlemlenen verilere uyan şeydir ve bir söylüyor yüzden c ı modelin parametreleri değildir.Σ=σ2In+τ2IN1Mσ2τ2cci

, b , τ 2 ve σ 2 parametreleri uygun olduğunda, her i için c i'nin koşullu dağılımı hesaplanabilir . Karma model çıktısında gördüğünüz, bu dağılımların modları, yani koşullu modlardır.abτ2σ2cii


1
yN(a+bx,σ2I)
yN(a+bx,Σ)
Sextus Empiricus

ccc

Bence entegrasyon adımını alamıyorum. @Martijn Weterings'in biraz işaret ettiği gibi (R kodu) bir örnek veya referans bu harika olurdu!
statmerkur

Cevabımı kabul ettiğin için bana ödül verdiğin için teşekkürler @statmerkur, ama belirsiz kalması çok kötü. Bir örnek düşünmeye çalışacağım. Cevabı güncellediğimde size ping atacağım.
amip: Reinstate Monica

@statmerkur Bu soruya bir cevapta, karışık efektler modelinin manuel olarak hesaplandığını gösteriyorum (olasılık fonksiyonunu yazma anlamında manuel, optimizasyon hala R'deki
Sextus Empiricus

0

Sabit efektleri kullanarak rastgele etkilere dayanmadan varyans ve kovaryans parametrelerini kolayca tahmin edebilirsiniz ( sabit efektlerle rastgele efektlerin tartışılması için buraya bakın ; bu terimlerin farklı tanımlarının bulunduğunu unutmayın).

Sabit etkiler, her grup için (veya her zaman periyodu veya rastgele efekt olarak kullanmayı düşündüğünüz her şey için bir (ikili) gösterge değişkeni eklenerek kolayca türetilebilir; bu, iç dönüşümle eşdeğerdir ). Bu, sabit etkileri (bir parametre olarak görülebilir) kolayca tahmin etmenizi sağlar.

Sabit etkiler varsayımı, sabit etkilerin dağılımı hakkında bir varsayım yapmanızı gerektirmez, sabit etkilerin varyansını kolayca tahmin edebilirsiniz (her gruptaki gözlem sayısı azsa bu son derece gürültü olsa da; rasgele etkilere kıyasla çok daha büyük varyans masraflarının yanlılığı, çünkü bu gösterge değişkenlerini ekleyerek her grup için bir serbestlik derecesi kaybedersiniz). Farklı sabit efekt grupları arasındaki veya sabit efektler ile diğer ortak değişkenler arasındaki kovaryansları da tahmin edebilirsiniz. Örneğin , daha iyi futbolcuların daha iyi takımlar için giderek daha fazla oynayıp oynamadıklarını tahmin etmek için Alman Bundesliga'daki Rekabetçi Denge ve Assortative Eşleştirme adlı bir makalede yaptık .

Rastgele etkiler, kovaryans hakkında önceden bir varsayım gerektirir. Klasik rastgele efekt modellerinde, rastgele etkilerin bir hata gibi olduğunu ve diğer ortak değişkenlerden bağımsız olduğunu varsayarsınız (böylece bunları göz ardı edebilir ve OLS kullanabilirsiniz ve varsayımlar varsa diğer parametre için verimsiz tahminler olsa da tutarlı olabilirsiniz. rasgele etkiler modelinin doğru olduğunu gösterir).

Daha fazla teknik bilgiye buradan ulaşabilirsiniz . Andrew Gelman aynı zamanda onun güzel kitap bu konuda daha fazla sezgisel bir sürü iş vardır regresyon ve düzeyli / hiyerarşik modeller kullanılarak Veri analizi


1
Rastgele efektlerin (co) varyans parametrelerine atıfta bulunuyorum (bakınız düzenlemem).
statmerkur

2
Bunun soruyu cevapladığını sanmıyorum.
amip: Reinstate Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.