GLM ve GEE arasındaki fark nedir?


9

Eş değişkenler olarak özne ve zaman içeren bir ikili yanıt değişkeni ile birden fazla zaman noktasındaki ölçümler arasındaki korelasyonu dikkate alan benzer GEE modeli arasındaki bir GLM modeli (lojistik regresyon) arasındaki fark nedir?

GLM'im şöyle görünüyor:

Y(binary) ~ A + B1X1(subject id) + B2X2(time) 
              + B3X3(interesting continuous covariate)

logit bağlantı fonksiyonu ile.

İki modelde zamanın nasıl ve neden farklı şekilde ele alındığının ve yorumlama için ne anlama geleceğinin basit (sosyal bilimciye yönelik) bir açıklamasını arıyorum.


6
Ben ilgili sorulara bu yanıtları bulundu ( genelleştirilmiş tahmin denklemler ve glmM arasındaki fark nedir? , Karışık etkiler modellere göre genelleştirilmiş tahmin denklemleri ne zaman kullanılır? ) Çok kapsamlı, bunlar GLM hakkında olduğu halde rastgele etkilerle GEE vs.
chl

1
Konu kimliğini sürekli bir ortak değişken olarak gerçekten eklemek istiyor musunuz? Yanıt değişkeninin kimliğin artan veya azalan bir işlevi olması garip görünüyor.
konuk

Nüfus ortalamasının etkileri ile özneye özgü etkiler.
Will

işte ikisi arasındaki farkları tartışan bir makalenin bağlantısı. aje.oxfordjournals.org/content/147/7/694.full.pdf+html
Will

1
@Chl'nin yukarıdaki bağlantılara bağladığı sorulara ek olarak, bu soru şu fikirleri de tartışıyor: Genelleştirilmiş doğrusal modeller ile SPSS'deki genelleştirilmiş doğrusal karışık modeller arasındaki fark .
gung - Monica'yı eski durumuna getirin

Yanıtlar:


12

Orada daha iyi ve daha ayrıntılı bir cevap olabilir, ama size basit, hızlı düşünceler verebilirim. Bazı konulardan birden fazla zaman noktasında toplanan verilere uyması için Genelleştirilmiş Doğrusal Model (örn., Tipik bir lojistik regresyon) kullanmaktan söz ettiğiniz anlaşılıyor. İlk bakışta, bu yaklaşımla ilgili iki göze çarpan sorun görüyorum.

İlk olarak, bu model, ortak değişkenler göz önüne alındığında verilerinizin bağımsız olduğunu varsayar (yani, her konu için kukla bir kod muhasebeleştirdikten sonra, bireysel bir kesme terimine benzer ve herkes için eşit olan doğrusal bir zaman eğilimi). Bunun gerçek olması pek olası değildir. Bunun yerine, neredeyse kesin olarak otokorelasyonlar olacaktır, örneğin, zaman içinde aynı kişiden daha yakın olan iki gözlem, zamandan sonra bile zaman içinde birbirinden ayrı iki gözlemden daha benzer olacaktır . (Bir subject ID x timeetkileşimi (yani herkes için benzersiz bir zaman eğilimi) de dahil ettiyseniz bağımsız olabilirler , ancak bu bir sonraki sorunu daha da kötüleştirecektir.)

İkincisi, her katılımcı için bir parametre tahmin eden çok sayıda serbestlik derecesini yakacaksınız. İlgilendiğiniz parametreleri doğru bir şekilde tahmin etmeye çalışacağınız nispeten az serbestlik dereceniz kaldı (elbette, bu kişi başına kaç ölçümünüz olduğuna bağlıdır).

İronik olarak, ilk sorun güven aralıklarınızın çok dar olduğu, ikincisi ise CI'lerinizin serbestlik derecelerinizin çoğunu boşa harcamamanızdan çok daha geniş olacağı anlamına gelir. Ancak, bu ikisinin birbirini dengelemesine güvenmem. Değer için, parametre tahminlerinizin tarafsız olacağına inanıyorum (her ne kadar burada yanlış olsa da).

Genelleştirilmiş Tahmin Denklemlerinin kullanılması bu durumda uygundur. Eğer Gee kullanarak bir model sığacak yaparken (örneğin AR (1) gibi) bir korelasyonel yapıyı belirtmek ve veri şartına bağımsız olduğunu oldukça makul olabilir hem sizin ortak değişkenler ve belirttiğiniz korelasyon matrisinin. Buna ek olarak, GEE popülasyon ortalama ilişkisini tahmin eder, bu nedenle her katılımcı için bir derece özgürlük yakmanıza gerek yoktur - özünde onlar üzerinde ortalama.

Yoruma gelince, bildiğim kadarıyla, her iki durumda da aynı olurdu: diğer faktörlerin sabit kaldığı göz önüne alındığında, X3'teki tek bir birim değişiklik, 'başarı' log oranlarındaki bir B3 değişikliği ile ilişkilidir. .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.