Genelleştirilmiş tahmin denklemleri ve karma etki modellerini ne zaman kullanmalı?


63

Uzun süredir karma etkiler modellerini bir süredir boylamsal verilerle kullanıyorum. AR ilişkilerine lmer'de sığabilmeyi diliyorum (bunu doğru yapamayacağımı düşünüyorum?) Ama bunun çok önemli olduğunu düşünmüyorum, bu yüzden fazla endişelenmiyorum.

Genelleştirilmiş tahmin denklemlerine (GEE) rastladım ve ME modellerinden çok daha fazla esneklik sunuyor gibi görünüyorlar.

Genel bir soru sorma riski altında, farklı görevler için hangisinin daha iyi olduğu konusunda herhangi bir tavsiye var mı? Onları karşılaştıran bazı makaleler gördüm ve formda olma eğilimindeler:

“Bu çok özelleşmiş alanda, X için GEE kullanmayın, Y için ME modellerini kullanmayın”.

Daha genel bir tavsiye bulamadım. Biri beni aydınlatabilir mi?

Teşekkür ederim!


1
“çok daha fazla esneklik sunuyor gibi görünüyorlar”… GEE'ler marjinal bir dağılıma uymak için kullanıldığından, yaklaşımlarında farklılıklar gösteriyorlar, GLMM kullanırken sıklıkla ilgilenilen koşullu yaklaşımın aksine.
chl


glmmPQLAR korelasyon yapılarına da sığabileceğini unutmayın
Tom Wenseleers

AR İlişkisi Nedir?
göre istatistiklerin

@incodeveritas Otoregressive kovaryans yapısı
Tommyixi

Yanıtlar:


56

Bir değişkenin nüfusun ortalama etkilerini bireysel etkilerle ortaya çıkarmak için GEE kullanın. Bu iki şey yalnızca doğrusal modellerde eşdeğerdir, ancak doğrusal değildir (örneğin lojistik). Rastgele etki, örneğin, bir lojistik model alır, bu görmek için gözlenmesine inci konu th ', ;jiYij

log(pij1pij)=μ+ηi

burada ve konusu için rastgele bir etkidir .ηiN(0,σ2)ipij=P(Yij=1|ηi)

Bu veriler üzerinde rastgele etki modeli kullandıysanız, o zaman bir tahmin alacağı ortalama sıfır normalde dağıtılmış pertürbasyon bireysel spesifik olarak, her bireye uygulanmış olmaları gerçeğine dayanır.μ

Bu verilerde GEE kullanıyorsanız, popülasyon ortalaması günlük oranlarını tahmin edersiniz. Bu durumda olur

ν=log(Eη(11+eμηi)1Eη(11+eμηi))

νμ . Örneğin, ve , . Rastgele etkilerin dönüştürülmüş (veya bağlantılı ) ölçekte ortalama sıfıra sahip olmasına rağmen, etkileri verilerin orijinal ölçeğinde sıfır anlamına gelmez. Bir karma efektler lojistik regresyon modelinden bazı verileri simüle etmeye çalışın ve popülasyon seviyesi ortalamasını müdahalenin ters logit ile karşılaştırmayı deneyin ve bunların bu örnekte olduğu gibi eşit olmadığını göreceksiniz. Katsayıların yorumlanmasındaki bu fark, GEE ve rastgele etki modelleri arasındaki temel farktır .μ=1σ2=1ν.83

Düzenleme: Genel olarak, öngörücü olmayan karma efektler modeli şu şekilde yazılabilir:

ψ(E(Yij|ηi))=μ+ηi

burada bir link işlevidir. Her ne zamanψ

ψ(Eη(ψ1(E(Yij|ηi))))Eη(E(Yij|ηi))

Nüfus ortalama katsayıları (GEE) ile bireysel spesifik katsayılar (rastgele etki modelleri) arasında bir fark olacaktır. Diğer bir deyişle, ortalamalar verileri dönüştürerek, dönüştürülen ölçeğe rasgele efektleri ekleyerek ve sonra geri dönüştürerek değişmektedir. Doğrusal modelde (yani, ) eşitliğin tutulduğunu ve eşdeğer olduklarını unutmayın.ψ(x)=x

Düzenleme 2: Bir GEE modeli tarafından üretilen "sağlam" sandviç tipi standart hataların, modelde belirtilen korelasyon yapısı olmasa bile geçerli asimptotik güven aralıkları sağladığına (örneğin, zamanın% 95'ini kapsıyorsa) dikkat etmek gerekir. doğru.

Düzenleme 3: Eğer ilginiz verilerdeki ilişkilendirme yapısını anlamaksa, GEE ilişkilerinin tahminleri açıkça yetersizdir (ve bazen tutarsızdır). Bunun için bir referans gördüm ama şu anda yerleştiremiyorum.


3
(+1) 2. düzenleme hakkında, model tabanlı varyans tahmin edicilerinin az sayıda kümeyle daha iyi çalışacağını eklerdim (ya da bir Jacknife tahmincisi kullanabiliriz). Bir referans olarak, her zaman çok güzel ders notları içeren gbi.agrsci.dk/statistics/courses/phd07/material/Day10’a işaret ederim (GEE ile GLMM yaklaşımlarının karşılaştırılması dahil olmak üzere stat. .
chl

Vay, ne güzel bir cevap. Çok teşekkürler. Aradığım şey tamamen buydu. Ve link için de chl sayesinde. İkinize de +10 internets.
Chris Beeley,

GEE'ler ayrıca üst seviye etkilerin sıkıntı parametreleri olduğunu varsaymıyor mu? Bana öyle geliyor ki, başka bir önemli ayrım - biri bu etkilerle ilgilenirse, GEE size vermeyecekti. Alternatif olarak, eğer bu dağıtım varsayımlarını yapma konusunda rahat değilseniz, belki GEE tercih edilir.
robin.datadrivers

@Chl'nin sağladığı bağlantı öldü: / (altı yıl sonra beklenir, değil mi?)
Guilherme Marthe

@GuilhermeMarthe İyi yakala! Ne yazık ki, başka bir iplikteki aynı maddeye bağlıyım . İki seçenek görüyorum: geepack R paketine (aynı iki yazar tarafından geliştirilen) referans verin veya şimdilik WayBack Makinesi'ni kullanın .
chl

10

Aklımdaki GEE, Bayesian modelleme kullanmıyorken ve tam bir olasılık çözümü bulunmadığında çok yararlı. Ayrıca, GEE yeterince kesin olabilmesi için daha büyük örneklem büyüklükleri gerektirebilir ve rastgele olmayan uzunlamasına verilere karşı çok sağlam değildir. GEE tamamen rastgele kayıp olduğunu varsayarken, olasılık yöntemleri (örneğin karışık etki modelleri veya genelleştirilmiş en küçük kareler) sadece rastgele eksik olduğunu varsaymaktadır.


1

Fitzmaurice, Laird ve Ware, Uygulamalı Boyuna Analiz , John Wiley & Sons, 2011, 2. baskı, 11-16. Bölümlerde ayrıntılı bir tartışma ve somut örnekler bulabilirsiniz .

Örneklere göre, web sitesinde veri kümelerini ve SAS / Stata / R programlarını bulabilirsiniz .


2
Bu kitabın ana noktalarını özetler misiniz?
chl

2
Macro'nun zaten yaptığını söyleyebilirim ;-) Kitapta, Frank Harrell'ın eklediği daha uzun ve daha detaylı tartışmaları, bazı analitik, sayısal ve grafiksel örnekleri ve bazı noktaları bulabilirsiniz. Gelman'ın bloguna da bakabilirsiniz .
Sergio,
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.