Bu iki regresyon modeli arasındaki temel fark nedir?


10

Diyelim ki anlamlı korelasyona sahip iki değişkenli bir yanıtım var. Bu sonuçları modellemenin iki yolunu karşılaştırmaya çalışıyorum. Tek yönlü iki sonuç arasındaki fark modellemek için: bir başka yolu ise ya da bunları model: ( y i j = β 0 + zaman + X ' β )

(yi2yi1=β0+Xβ)
glsgee
(yij=β0+time+Xβ)

İşte bir foo örneği:

#create foo data frame

require(mvtnorm)
require(reshape)
set.seed(123456)
sigma <- matrix(c(4,2,2,3), ncol=2)
y <- rmvnorm(n=500, mean=c(1,2), sigma=sigma)
cor(y)
x1<-rnorm(500)
x2<-rbinom(500,1,0.4)
df.wide<-data.frame(id=seq(1,500,1),y1=y[,1],y2=y[,2],x1,x2)
df.long<-reshape(df.wide,idvar="id",varying=list(2:3),v.names="y",direction="long")
df.long<-df.long[order(df.long$id),]
    df.wide$diff_y<-df.wide$y2-df.wide$y1


#regressions
fit1<-lm(diff_y~x1+x2,data=df.wide)
fit2<-lm(y~time+x1+x2,data=df.long)
fit3<-gls(y~time+x1+x2,data=df.long, correlation = corAR1(form = ~ 1 | time))

fit1fit2fit2fit3p


7
Fit1 ve fit3 arasındaki farka bazen Rab'bin paradoksu denir. Bazı tartışmalar (tahminlerin neden modeller arasında değişmediğine dair) ve bir Paul Allison makalesine yapılan başvurular için, bkz . Stats.stackexchange.com/a/15759/1036 . Başka bir referansHolland, Paul & Donald Rubin. 1983. On Lord’s Paradox. In Principles of modern psychological measurement: A festchrift for Frederic M. Lord edited by Wainer, Howard & Samuel Messick pgs:3-25. Lawrence Erlbaum Associates. Hillsdale, NJ.
Andy W

Yanıtlar:


1

İlk olarak, cevabımda tartışma için dördüncü bir model sunacağım:

uygun1,5 <- lm (y_2 ~ x_1 + x_2 + y_1)

Bölüm 0
fit1 ve fit1.5 arasındaki fark en iyi şekilde kısıtlanmış bir fark ile optimal bir fark arasındaki fark olarak özetlenir.

y2=b0+b1·x+b2·y1
b2
y2b2·y1=b0+b1·x
y

b2=1

y2y1=b0+b1·x

xy1y2t


y=b0+b1·x+b2·t
t=0y1t=1y2
y1=b0+b1·xy2=b0+b1·x+b2
y2y1=b2b2b2y

Bölüm 2
Peki fit2 ve fit3 modelleri arasındaki fark nedir ... aslında, çok az. Fit3 modeli, hata terimleriyle korelasyonu açıklar, ancak bu sadece tahmin sürecini değiştirir ve bu nedenle iki model çıktısı arasındaki farklar minimum olacaktır (fit3'ün otoregresif faktörü tahmin etmesinin ötesinde).

Bölüm 2.5
Ve bu tartışmaya bir model daha ekleyeceğim

fit4 <- lmer (y ~ süre + x1 + x2 + (1 | id), veri = df.uzun)

y

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.