Çoklu doğrusal regresyonda, tahmin edilen noktaların bir grafiği neden düz bir çizgide yer almıyor?


16

Y ve X1, X2 arasındaki ilişkileri tanımlamak için çoklu doğrusal regresyon kullanıyorum.

Teoriden, çoklu regresyonun Y ile X'in her biri (Y ve X1, Y ve X2) arasında doğrusal ilişkiler olduğunu varsaydım. X'in herhangi bir dönüşümünü kullanmıyorum.

Böylece modeli R = 0.45 ve tüm anlamlı X ile aldım (P <0.05). Sonra Y'yi X1'e karşı çizdim. Modelin tahminleri olan kırmızı renkli dairelerin neden bir çizgi oluşturmadığını anlamıyorum. Daha önce söylediğim gibi, her bir Y ve X çiftinin bir çizgi ile takılmasını bekledim.

resim açıklamasını buraya girin

Çizim python ile şu şekilde oluşturulur:

fig, ax = plt.subplots()
plt.plot(x['var1'], ypred, 'o', validation['var1'], validation['y'], 'ro');
ax.set_title('blue: true,   red: OLS')
ax.set_xlabel('X')
ax.set_ylabel('Y')
plt.show()

1
Arsa / analiz için kullandığınız kodu kaydedebilir misiniz? Kırmızı ve mavi çizgiler birbirlerinin tiz seslerine benziyor. Bu nedenle, bu çizimin arkasındaki kod sorununuzu daha iyi yanıtlamanıza yardımcı olabilir.
Dawny33

Yalnızca (i) diğer öngörücüsünün değerinin, tahmin edilen her nokta için aynı olduğu varsayılırsa (ve farklı değerlerini varsaymayı denerseniz farklı bir satır alırsanız) veya (ii) Eğer gerçek veriler için tahminler, ancak "kısmi out" kullanırsanız varyasyonlar (yani telafi) bir şeydir ki, kısmi regresyon arsa veya katma değişkenler arsa içindir. Bu arsayu tam olarak nasıl inşa ettiğinizi bilmeden, @ dawny33'in söylediği gibi, sorunun ne olduğunu bilmek mümkün değildirx2x2x2
Silverfish

@Silverfish'in yorumunun doğru olduğunu düşünüyorum; üç boyutta bir düzlemi temsil eder . Eğer iki boyuta azaltır, o zaman 'proje' üç boyutlu olarak düzlem ( ), örneğin içine düzlemi, bu sadece bir satır olacak dik olan düzlemi. P P ( y , x 1 ) P ( y , x 1 )y=β0+β1x1+β2x2PP(y,x1)P(y,x1)

@ Dawny33: gönderildi.
Klausos

@f coppens: Teşekkürler. Öyleyse neden literatürde çoklu doğrusal regresyon modelinin Y ile X'in her biri (Y ve X1, Y ve X2) arasında doğrusal ilişkiler üstlendiği söyleniyor?
Klausos

Yanıtlar:


33

Diyelim ki çoklu regresyon denkleminiz

y^=2x1+5x2+3

burada Y anlamına gelen "tahmin y ".y^y

Şimdi sadece olan noktaları ele alalım . Eğer çizmek Sonra y karşı x 1 , bu noktaların denklemini tatmin edecek:x2=1y^x1

y^=2x1+5(1)+3=2x1+8

Bu nedenle, eğim 2 çizgisinde ve -kesit 8 ile uzanmalıdırlar.y

Şimdi olan noktaları ele alalım . Eğer çizmek zaman y karşı x 1 , daha sonra bu noktalar tatmin:x2=2y^x1

y^=2x1+5(2)+3=2x1+13

Yani bu bir eğim 2 çizgisi ve -intercept 13 ile . Kendiniz için x 2 = 3 ise başka bir eğim 2 çizgisi ve y- intercept 18 olduğunu doğrulayabilirsiniz.yx2=3y

Farklı değerlerine sahip noktaların farklı çizgiler üzerinde, ancak hepsi aynı gradyanda olacağını görüyoruz : orijinal regresyon denklemindeki 2 x 1 katsayısının anlamı , ceteris paribus yani diğer tahmincileri sabit tutan, bir birim artış x 1 artar tahmin edilen ortalama tepki y arasında kesişim anlamı ise, iki birim tarafından, 3 regresyon denklemi iken bu x 1 = 0 ve x 2 = 0 sonra tahmin edilen ortalama tepki 3x22x1x1y^3x1=0x2=03. Ancak tüm puanlarınız aynı değerine sahip değildir , yani farklı bir kesişme çizgisine sahip oldukları anlamına gelir - çizgi, x 2 = 0 olan noktalar için yalnızca kesme 3'e sahip olur . Dolayısıyla, tek bir satır görmek yerine (yalnızca x 2'nin belirli değerleri varsa, örneğin x 2 her zaman tamsayı ise) bir dizi diyagonal "çizgi" görebilirsiniz. Burada, aşağıdaki verileri inceleyin y = 2 x 1 + 5 x 2 + 3 .x23x2=0x2x2y^=2x1+5x2+3

Satırlar eklenmeden önce

Burada algılanabilir "çizgiler" var. Şimdi kırmızı daireler olarak, x 2 = 2'yi altın üçgenler ve x 2 = 3'ü mavi kareler olarak renklendirirsem , bunların hepsi eğim 2 ve y- konseptleri olmak üzere üç ayrı çizgi üzerinde olduklarını görürüz. 8, 13 ve 18 yukarıda hesaplandığı gibidir. Eğer Tabii ki, x 2 değerlerini tam sayı alma yoluna giden değildi, ya da durum regresyon dahil edilen diğer tahmini değişkenler tarafından karışıktı, daha sonra çapraz çizilme az belirgin olacaktır, ama yine de her noktayı tahmin bu durumda olacağını ayrı bir hatta yatıyorx2=1x2=2x2=3yx2grafikte gösterilmeyen diğer öngörücülerin değerlerine dayalı olarak .

Satırlar eklendikten sonra

yx1x2y^=2x1+5x2+3yx1x2yx1- eksen sağınızı gösterir.

3d çizim

yy

y^x1x2x2y^x1x2yx1 x2yx1

R grafikleri için kod

library(scatterplot3d)

data.df <- data.frame(
  x1 = c(0,2,4,5,8, 1,3,4,7,8, 0,3,5,6,7),
  x2 = c(1,1,1,1,1, 2,2,2,2,2, 3,3,3,3,3)
)

data.df$yhat <- with(data.df, 2*x1 + 5*x2 + 3)

data1.df <- data.df[data.df$x2==1,]
data2.df <- data.df[data.df$x2==2,]
data3.df <- data.df[data.df$x2==3,]

#Before lines added    
mar.default <- c(5,4,4,2) + 0.1
par(mar = mar.default + c(0, 1, 0, 0)) 
plot(data.df[c("x1","yhat")], main=expression("Predicted y against "*x[1]),
     xlab=expression(x[1]), ylab=expression(hat(y)))

#After lines added
plot(data.df[c("x1","yhat")], main=expression("Predicted y against "*x[1]),
     xlab=expression(x[1]), ylab=expression(hat(y)), pch=".")
points(data1.df[c("x1","yhat")], pch=19, col="red")
abline(lm(yhat ~ x1, data=data1.df), col="red")
points(data2.df[c("x1","yhat")], pch=17, col="gold")
abline(lm(yhat ~ x1, data=data2.df), col="gold")
points(data3.df[c("x1","yhat")], pch=15, col="blue")
abline(lm(yhat ~ x1, data=data3.df), col="blue")

#3d plot
myPlot <- scatterplot3d(data.df, pch=".", xlab=expression(x[1]),
                        ylab=expression(x[2]), zlab=expression(hat(y)),
                        main=expression("Predicted y against "*x[1]*" and "*x[2]))
myPlot$plane3d(Intercept=3, x.coef=2, y.coef=5, col="darkgrey")
myPlot$points3d(data1.df, pch=19, col="red")
myPlot$points3d(data2.df, pch=17, col="gold")
myPlot$points3d(data3.df, pch=15, col="blue")
print(myPlot)

Sadece küçük bir soru: Düzlem diyerek, biraz eğriliği olabilen bir uçak mı demek istediniz?
Klausos

"Düz" bir düzlem anlamına gelir. Daha sonra açıklamak için bir resim ekleyeceğim.
Silverfish

2
Bu soruyu sadece bu harika
arsalara
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.