“Karışık model” in üç biçimini yorumlama


19

Beni karışık modellerle harekete geçiren bir ayrım var ve merak ediyorum, biraz netlik kazanıp kazanamayacağımı merak ediyorum. Diyelim ki karışık bir sayım verisi modeliniz var. Sabit bir etki (A) ve zaman (T) için başka bir değişken olarak, "Site" değişkeni olarak gruplandırıldığını bildiğiniz bir değişken var.

Anladığım kadarıyla:

glmer(counts ~ A + T, data=data, family="Poisson") sabit bir etki modelidir.

glmer(counts ~ (A + T | Site), data=data, family="Poisson") rastgele bir etki modelidir.

Benim sorum şu gibi bir şey olduğunda:

glmer(counts ~ A + T + (T | Site), data=data, family="Poisson")T nedir? Rastgele bir etki mi? Sabit bir etki mi? Aslında T'yi her iki yere koyarak ne başarıyor?

Ne zaman bir şey olmalı , sadece modelin formülünün gelişigüzel etkileri bölümünde görünür?

Yanıtlar:


22

Bu, bu üç modelin her biri için model formülü yazarak daha açık hale gelebilir. nin her modeldeki sitesinde kişisinin gözlemi olmasına izin verin ve modelinizdeki değişkenlere atıfta bulunmak için benzer şekilde tanımlayın . i j A i j , T i jYijijAij,Tij

glmer(counts ~ A + T, data=data, family="Poisson") model

log(E(Yij))=β0+β1Aij+β2Tij

ki bu sadece sıradan bir poisson regresyon modelidir.

glmer(counts ~ (A + T|Site), data=data, family="Poisson") model

log(E(Yij))=α0+ηj0+ηj1Aij+ηj2Tij

burada , sitesinden kişiler tarafından yapılan her bir gözlem tarafından paylaşılan rastgele efektlerdir . Bu rastgele efektlerin belirttiğiniz modelde serbestçe ilişkilendirilmesine izin verilir (yani üzerinde hiçbir kısıtlama yapılmaz ). Bağımsızlık empoze etmek için, bunları farklı parantezlerin içine yerleştirmelisiniz, örneğin bunu yapmalısınız. Bu model, un tüm siteler için , ancak her sitenin rastgele bir ofseti ( ) olduğunu ve her iki ile rastgele doğrusal bir ilişkisi olduğunu .j Σ log ( E ( Y i j ) ) α 0 η j 0 A i j , T i jηj=(ηj0,ηj1,ηj2)N(0,Σ)jΣ(A-1|Site) + (T-1|Site) + (1|Site)log(E(Yij))α0ηj0Aij,Tij

glmer(counts ~ A + T + (T|Site), data=data, family="Poisson") model

log(E(Yij))=(θ0+γj0)+θ1Aij+(θ2+γj1)Tij

Şimdi , sabit efektleri tarafından verilen ile bazı "ortalama" bir ilişkiye sahip ama bu ilişki her site için farklıdır ve bu farklılıklar rasgele efektlerle yakalanır . Yani, taban çizgisi rastgele kaydırılır ve iki değişkenin eğimleri rastgele kaydırılır ve aynı sitedeki herkes aynı rastgele kaydırmayı paylaşır. A i j , T i j θ 0 , θ 1 , θ 2 γ j 0 , γ j 1 , γ j 2log(E(Yij))Aij,Tijθ0,θ1,θ2γj0,γj1,γj2

T nedir? Rastgele bir etki mi? Sabit bir etki mi? Aslında T'yi her iki yere koyarak ne başarıyor?

T γ j 1 T günlüğü ( E ( Y i j ) )T biri. Rastgele bir etki değildir - Siterastgele bir etkidir. yukarıdaki modelde - tarafından verilen rasgele etkiye bağlı olarak farklı sabit bir etkisi vardır . Bu rastgele efekti ve arasındaki ilişkide siteler arasında heterojenliğe izin vermektir .TSiteγj1Tlog(E(Yij))

Model formülünün rastgele efektler bölümünde ne zaman bir şey görünmelidir?

Bu, uygulama bağlamında mantıklı olan bir konudur.

Kesişim ile ilgili olarak - sabit kesmeyi birçok nedenden dolayı orada tutmalısınız (bkz. Örneğin burada ); re: rasgele kesişme, , bu öncelikle aynı yerde yapılan gözlemler arasında korelasyona neden olur. Böyle bir korelasyonun olması mantıklı değilse, rastgele etki dışlanmalıdır.γj0

Rastgele eğimler ile ilgili olarak, yalnızca rastgele eğimleri olan ve sabit eğimleri olmayan bir model, her site için ve her site için ortak değişkenleriniz arasında bir ilişki olduğu inancını yansıtır. , ancak bu etkileri tüm siteler üzerinde ortalamalandırırsanız, bir ilişki yoktur. Örneğin, eğer rastgele bir eğiminiz varsa, ancak sabit bir eğiminiz yoksa, bu, ortalama olarak, zamanın hiçbir etkisi olmadığını (örn. Verilerde seküler eğilimler yok) ama her birinin zamanla rastgele bir yönde ilerlediğini, bu mantıklı olabilir. Yine, uygulamaya bağlıdır. Tgünlük(E(Ybenj))TSite

Bunun gerçekleşip gerçekleşmediğini görmek için modeli rastgele efektlerle veya rastgele bir şekilde sığdırabileceğinizi unutmayın - sabit modelde hiçbir etki değil, sonraki modelde önemli rastgele etkiler görmelisiniz. Bunun gibi kararların, model seçiminden ziyade uygulamanın anlaşılmasına dayanarak daha iyi verildiği konusunda sizi uyarmalıyım.


2
(+1): her model için model formülünü yazmak aslında R-notasyonlarını daha şeffaf hale getirmenin en iyi yoludur; aferin!
ocram

@Macro Yukarıdaki denklemler hakkında bir soru (onlar için teşekkürler btw) - ayrıca normal hata terimleri var mı? Eğer öyleyse, o terimin aboneliği nedir?
Fomite

2
Merhaba - GLM yazmanın bir yolu, burada yaptığım gibi (veya 'bağlı' bir sürüm) için bir model olarak. Model doğru bir şekilde belirtilirse, beklenen değer için herhangi bir hata terimi yoktur. GLMs biz belirterek ediyoruz, sorunuzu yanıtlamak için dağıtım bölgesinin . Doğrusal bir modeldeki "artık" rasgeleliği, normal olarak dağıtılmış bir hata terimi ile kendini gösterir. Ancak, doğrusal olmayan GLM'lerde (örneğin, poisson, lojistik), bir poisson oranının veya bir bernoulli çalışmasının başarılı bir probunun bilinmesi, hatasız bir gerçekleşmeyi tahmin etmenize izin vermediğinden, “yerleşik” bir rastgelelik vardır. Bu yardımcı olur umarım. Y i j | XE(Ybenj|X)Ybenj|X
Makro

11

Sen unutmamalıdır Tmodelinizin rastgele etkiler açısından ilgilendirmez ama sabit bir etkidir. Rastgele etkiler sonra görünür yalnızca etkilerdir |bir de lmerformül!

Bu şartname Bunun içinde bulabilirsiniz ne olduğunun net daha kapsamlı bir tartışma llmer sss soru .

Bu sorulardan modeliniz aşağıdakileri sağlamalıdır (sabit etkiniz için T):

  • Küresel bir eğim
  • Her seviye için toplam eğimden sapmayı belirten rastgele eğimler terimi Site
  • Rasgele eğimler arasındaki korelasyon.

@ Mark999 tarafından söylendiği gibi, bu gerçekten ortak bir özelliktir. Tekrarlanan ölçüm tasarımlarında, genellikle tekrarlanan tüm ölçümler (özneler içinde) faktörleri için rastgele eğimler ve korelasyonlar olmasını istersiniz.

Bazı örnekler için aşağıdaki makaleye bakın (ki burada her zaman alıntı yapmaya meyilliyim):

Judd, CM, Westfall, J. ve Kenny, DA (2012). Uyaranları sosyal psikolojide rastgele bir faktör olarak tedavi etmek: Yaygın fakat büyük ölçüde göz ardı edilen bir soruna yeni ve kapsamlı bir çözüm. Kişilik ve Sosyal Psikoloji Dergisi , 103 (1), 54-69. doi: 10,1037 / a0028347


2
Ekolojiden benzer bir referans: Schielzeth, Holger ve Wolfgang Forstmeier. 2009. “Destek Ötesinde Sonuçlar: Karışık Modellerde Aşırı Güven Tahminleri.” Davranışsal Ekoloji 20 (2) (1 Mart): 416–420. DOI: 10,1093 / beheco / arn145. beheco.oxfordjournals.org/content/20/2/416 .
Ben Bolker

1

Bir şey sadece parametresiyle özellikle ilgilenmediğinizde, ancak bağımlı verileri önlemek için dahil etmeniz gerektiğinde, rastgele bölümde görünmelidir. Örneğin, çocuklar sınıflara yuvalanmışsa, genellikle çocukları yalnızca rastgele bir efekt olarak istersiniz.


1
Belki sizi yanlış anlıyorum, ama aynı değişken için sabit ve rastgele efektlere sahip olmanın, sadece rastgele bir etkiye sahip bir değişkenden daha yaygın olduğunu düşünürdüm. Aynı değişken için sabit ve rastgele efektlere sahip olmak Pinheiro ve Bates kitabında nadir değildir.
mark999

2
Anladığım kadarıyla @MichaelChernick, aynı değişken için sabit bir etkiye ve rastgele bir etkiye sahipseniz, o zaman sabit etki popülasyondaki genel etki olurken, rastgele etki her konu için değişkenin farklı bir etkiye izin verir. Pinheiro ve Bates'de birkaç örnek var.
mark999

2
@PeterFlom, re: "Eğer çocuklar sınıflarda yuvalanmışlarsa, genellikle çocukları sadece rastgele bir efekt olarak istersiniz." Sanırım sınıfın rastgele etki olduğunu kastediyorsun. Verilerde daha fazla iç içe yerleştirme olmadıkça (örn. Çocuklar üzerinde tekrarlanan ölçümler), çocuk düzeyinde rastgele etkiler tanımlanmamıştır.
Makro

1
@macro Evet, demek istediğim bu, üzgünüm. Terminoloji çok kafa karıştırıcı oluyor! Gelman'ın 'sabit' ve 'rastgele' terimlerinden kaçınmasının nedeni bu olabilir
Peter Flom - Monica'yı eski durumuna getirin

2
@Michael, sana katılıyorum. Bu tür hiyerarşik modellerde, rastgele etkiler bir gruplama değişkeni tarafından tanımlanır ('gruplama' değişkeninin sürekli olarak değiştiği, uzamsal olarak dizine alınmış veri setleri gibi diğer çok değişkenli modellerin aksine). OP'nin sorusunda Site, değil Tveya Abaşka bir şey rastgele etki olarak adlandırılacaktır . Bunu bu şekilde düşünmek, Siteetkisinin açıkça hem sabit hem de rastgele olamazdı, çünkü ikisi birbirinden tanımlanmayacaktı. Bir değişken için hem sabit hem de rastgele katsayılara sahip olabilirsiniz, ancak bu farklı bir soru.
Makro
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.