Karışık modellerden tahminler yaparken belirsizliği rastgele etkilere dahil etmek neden zordur?


10

Birkaç konu vardır R-sig-ME kullanıyorsanız tahminler için güven aralıkları edinme konusunda lme4ve nlmeÖrneğin R. içinde burada ve burada Dougals Bates, hem paketlerin yazarlardan biri tarafından bazı açıklamalar dahil olmak üzere 2010 yılında. Ona kelimesi kelimesine alıntı yapmaktan çekinmeyin, çünkü bağlamdan çıkarılma korkusu, ama yine de yaptığı bir yorum

"Parametreleri ve rastgele değişkenleri tahminlerinizde birleştiriyorsunuz ve bu tahminlerin değişkenliğini değerlendirmenin ne anlama geleceğinden emin değilim. Bayesli bir anlam ifade edebilir, ancak kafamı bulamıyorum. " https://stat.ethz.ch/pipermail/r-sig-mixed-models/2010q1/003447.html

Bayesian glmm paketinin MCMCglmmtahminler için güvenilir aralıklar üretebileceğini biliyorum .

Son zamanlarda, lme4github'ın geliştirme versiyonuna bir predictyöntem verildi , ancak aşağıdaki yorum eşlik ediyor:

"@note Varyans parametrelerinde belirsizliği içeren etkili bir yöntem tanımlamak zor olduğundan, standart tahmin hatalarını hesaplama seçeneği yoktur; bu görev için \ code {\ link {bootMer}} öneririz." https://github.com/lme4/lme4/blob/master/R/predict.R

Öyleyse, sık modellerde karışık modellerden tahminler yaparken belirsizliği rastgele etkilere dahil etmek neden zordur?

Yanıtlar:


4

Tahmin yöntemi yorum hakkında emin değilim ama birincil bir konu, kendi başına varyans ölçüleri değil, kolayca yorumlanabilir varyans ölçümleri üretmek ile ilgilidir. Bates ilk alıntıda bunu yapıp yapamayacağınızı, ne anlama geldiğini yorumlamıyor.

İki seviyeli tekrarlanan ölçüm tasarımının basit bir çok seviyeli modelini alın. Diyelim ki her satırın konu olduğu aşağıdaki veriler var:

resim açıklamasını buraya girin

Gelen lmerbir model olarak ifade edilebilir:

y ~ x + (1|subject)

Sabit bir efekt olarak x'den y değerini tahmin ediyorsunuz (A ve B arasındaki fark); ve kesişme rastgele bir etki **. Grafiğe dikkatlice bakın ve her özne için x efektinde değişkenlik olsa da (her satırın eğimi), özneler arasındaki değişkenliğe (her satırın yüksekliği) kıyasla nispeten küçük olduğunu unutmayın.

Model bu iki değişkenlik kümesini ayrıştırır ve her biri anlamlıdır. Çizgilerin yüksekliğini tahmin etmek için rastgele efektleri kullanabilir ve eğimleri tahmin etmek için x'in sabit efektlerini kullanabilirsiniz. Hatta bu iki komiteyi bireysel y değerlerimiz için de kullanabilirsiniz. Ancak yapamayacağınız şey , eğimlerin ve çizgilerin yüksekliklerinin değişkenliğini bir araya getirdiğinizde modelinizle ilgili anlamlı bir şey söylemek . Eğimlerinizin değişkenliği ve çizgilerin yükseklikleri hakkında ayrı ayrı konuşmanız gerekir. Bu , modelin bir özelliği , bir yükümlülük değil.

X'in etkisinde nispeten kolayca tahmin edilebilen bir değişkenliğe sahip olacaksınız. Bunun etrafındaki güven aralığı hakkında bir şeyler söyleyebilirsiniz. Ancak, bu güven aralığının herhangi bir y değerinin tahminiyle küçük bir ilişkisi olacağına dikkat edin, çünkü y değeri, sadece etkinin değişkenliğinden farklı bir efekt ve konu varyansı kombinasyonundan etkilenir.

Bates alıntıladığınız gibi bir şeyler yazdığında, bunun bile yaklaşmayacağı çok daha karmaşık çok seviyeli tasarımlar düşündüğünü hayal ediyorum. Ancak bu basit örneği göz önünde bulundursanız bile, tüm varyans ölçümlerini bir araya getirerek ne tür bir gerçek anlamın çıkarılabileceğini merak ediyorsunuz.

** Kesinliğin sadelik için sabit etkisini görmezden geldim ve sadece rastgele bir etki olarak değerlendirdim. Sadece rastgele ve sabit bir kesişme ile daha basit bir modelden benzer sonuçlar çıkarabilirsiniz, ancak iletmenin daha zor olacağını düşünüyorum. Bu durumda, yine, sabit etki ve rastgele etki bir nedenden dolayı ayrıştırılır ve farklı şeyler ifade eder ve değişkenliklerini öngörülen değerler için tekrar bir araya getirmek, değişkenliğin modele göre çok az anlam ifade etmesine neden olur.


Söylediğimi duyduğum şey, bunun konu varyansına hata olarak mı davranmak yoksa ayrı olarak bölümlemek mi ve yokmuş gibi davranmak isteyip istemediğimizden emin olmama konusunda aynı eski testere geliyor. Bu doğru mu?
russellpierce

O eski testereyi hiç duymadım. Konu varyansı yokmuş gibi davranmanız gerektiğini hiç duymadım. Ama sanırım bu özel örnekle ilgili. Model varyansı ayrıştırır. Modelleme sürecinin bu özelliği modeli nasıl anlayabileceğinizdir. Varyansı tekrar birleştirirseniz, modelin amacını ilk etapta yenersiniz. Denek sapmasını göz ardı etmiyorum, sadece öznenin rastgele etkisi ayrıdır. Blouin & Riopelle (2005) 'i okumak ve varyansı birleştirdiğinizde SE'nin anlamının nasıl değiştiğini görmek isteyebilirsiniz.
John

Belki bir şey eksikim, ama bu ileri geri insanlar, Konularda / Tekrarlanan Ölçümler ANOVA için hangi etki büyüklüğünün en iyi kullanıldığına ve bu güven aralıklarının en iyi nasıl çizildiğine benziyor ... bana işaret ettiğin şeyi oku, artık eksik olduğum her şeyi kaçırmayacağım. :) Teşekkürler.
russellpierce

Dediğim gibi, onlar ilişkilidir. Bir ileri geri olduğunu bilmiyordum, referans görmek isterdim. Gerçek şu ki, bahsettiğiniz iki CI ve efekt farklı şeyler ifade ediyor. Yani, ne demek istediğini ileteni kullanıyorsun. Ve onları mantıklı göstermelisiniz. [Tekrarlanan ölçüm tasarımında özne varyansı içeren bir CI'nın bir ortalamaya yerleştirilmesinin ve tekrarlanan ölçümler etkisi hakkında bir şey söylemek için kullanılmasının mantıklı olduğunu iddia etmek zor (bazılarına rağmen).]
John

Literatürde hiçbir şey görmedim, sadece gayri resmi el sıkma ve gözden geçiren du jour'un ne düşüneceğini tahmin etme girişimleri.
russellpierce

1

Uzun zamandır, (genellikle doğrusal olmayan) karışık efekt modelleri için sabit ve rastgele etkilerde bazı temel farklar olduğu düşünülmektedir. Bu inanç örneğin Bates tarafından aşağıdaki yanıtta belirtilmiştir

https://stat.ethz.ch/pipermail/r-sig-mixed-models/2010q1/003447.html

L(x,u)g(x,u)Pg(t)g

Pg(t)=maxx,u{L(x,u) | g(x,u)=t}\eqno(1)

Kimsenin bununla tartışmayacağına inanıyorum. Şimdi diyelim ki için önceden olasılık dağılımımız . Sonra için profil olasılığının hala mantıklı olduğunu iddia ediyorum , ancak (1) 'i önceden ekleyerek değiştirmeliyiz.p(u)g

Pg(t)=maxx,u{L(x,u)p(u) | g(x,u)=t}\eqno(2)
Not bu yana olan bir parametredir önceden rastgele etki olarak adlandırılanla tamamen aynıdır. Öyleyse neden birçok insan rastgele etki parametrelerinin bir şekilde farklı olduğunu düşünüyor? Bence fark, onlar için parametre tahmininin olağan uygulamasından geliyor. Rastgele etkileri `` farklı '' yapan şey, birçok modelde birçoğunun olmasıdır. Sonuç olarak, sabit etkiler (veya diğer parametreler) için yararlı tahminler elde etmek için rastgele etkileri farklı bir şekilde ele almak gerekir. Yaptığımız şey onları modelin dışına entegre etmektir. Yukarıdaki modelde genel olarak olabilirlik oluşturacak ŞimdiuF(x)
F(x)=L(x,u)p(u)du
uGittiler. Yani eğer elimizde varsa, bazı fonksiyonları için profil olasılığı hakkında konuşmak mantıklı görünmemektedir .F(x)g(x,u)

Yani fonksiyonu hakkında bilgi almak için biz parametresini üzerinde entegre olmamalıdır . Ancak birçok rastgele etki parametresinin olduğu durumda ne olur. Sonra `` en '' üzerine entegre etmemiz gerektiğini iddia ediyorum, ancak hepsini kesinleştireceğim bir anlamda değil. motive etmek için rastgele efekt . fonksiyonunun sadece bağlı olduğu ve aslında en basit fonksiyon olan . Rasgele etkiler üzerinde entegre olsun g(x,u)unu=(u1,u2,...,un1,un)g(x,u)ung(x,u)=unu1,u2,...,un1

F(x,un)=L(x,u1,...,un)p(u1,...,un))du1du2...dun1\eqno(4)
daha önce olduğu gibi profil olasılığını Rasgele fonksiyon için anlamlı olması için nasıl genelleştirilir . Nedir? O de bildirim içinde ile aynıdır basit bir durum için, bu not için, bkz , ile aynıdır
Pg(t)=maxx,un{F(x,un)|un=t}\eqno(3)
(3)g(x,u)F(x,un)(4)
F(x,s)=limϵ01ϵ{(x,un)|sϵ/2<g(x,un)<s+ϵ/2}L(x,u1,...,un)p(u1,...,un))du1du2...dun\eqno(5)
g(x,u)=un(5)
F(x,s)=limϵ01ϵ{(x,un)|sϵ/2<un<s+ϵ/2}F(x,un)dun\eqno(6)

Genel bir fonksiyonu için ile tanımlanan fonksiyonunu oluşturur ve profil olasılığını hesaplarız g(x,u)F(x,s)(5)

Pg(s)=maxx,u{F(x,s)|g(x,u)=s}\eqno(3)

Bu profil olasılığı iyi tanımlanmış bir kavramdır ve kendi başına durmaktadır. Bununla birlikte, pratikte yararlı olmak için, kişinin değerini en azından yaklaşık olarak hesaplayabilmesi gerekir. Birçok model için fonksiyonunun Laplace yaklaşımının bir varyantı kullanılarak yeterince iyi tahmin edilebileceğine inanıyorum. Tanımlama ile H ve parametrelerine göre fonksiyonunun kütüğünün kendir olsun .F(x,s)x^(s),u^(s)

x^(s),u^(s)=maxx,u{L(x,u)p(u) | g(x,u)=s}
L(x,u)p(u)xu

Düzeyi kümeleri olan , bir boyutsal altmanifoldları vardır boyutlu uzayda sabit etkiler ve rasgele etkileri. Bir form , bunların hepsi da doğrusallaştırıldığı bu manifold üzerine entegre etmemiz gerekir. Bu, biraz temel diferansiyel geometri içerir. Varsayalım ki Yeniden parametrelendirerek ve olduğunu varsayabiliriz . O zaman haritayı düşünün gm+n1n+mmnndu1du2dunx^(s),u^(s)gxn(x^(s),u^(s))0x^(s)=0u^(s)=0

(x1,x2,,xm1,u1,u2,,un)(x1,x2,,xm1,i=1m1gxixii=1nguiuigxm,u1,u2,,un)
burada için kullanılan kısmi derivatvie ifade göre maksimum noktasında değerlendirilir. Bu, boyutlu boşluğun, seviye kümesinin teğet boşluğuna doğrusal bir haritasıdır . İstenilen integrali hesaplamak için kullanabiliriz. Önce 1 formun geri çekilmesi basitçe kendileridir.gxigxim+n1gdui

Hessian'ın geri çekilmesi, kuadratik formdur

Ti,j=Hi+m,j+m+guigujgxm2Hm,m\rm for 1<=i,j<=n

Böylece integral , Cholesky ayrışması yoluyla hesaplanan belirleyicisinin logaritmasını içeren olağan formül olan Laplace yaklaşımı yoluyla hesaplanabilir (veya yaklaşık olarak) . İntegralin Laplace yaklaşımının değeri buradabelirleyicidir. hala gibi seviye kümesinin genişliği ile ilgilenmemiz gerekiyor. İlk sipariş için bunun burada , kısmi türevlerinin vektörüdür T

L(x^(s),u^(s))|T|12
||gϵ0ϵ/g(x^(s),u^(s))g(x^(s),u^(s)))g g L ( X ( ler ) , U ( s ) ) | - T | 1(gx1,gx2,,gxm,gu1,gu2,,gun) böylece düzey kümesindeki olasılık değeri verilir : Bu, profil olasılığını hesaplamak için kullanılacak doğru yaklaşımdır.g
L(x^(s),u^(s))|T|12g(x^(s),u^(s))
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.