Doğrusal regresyonda, neden yalnızca etkileşim terimleriyle ilgiliysek kuadratik terimleri eklemeliyiz?


10

için doğrusal bir regresyon modeliyle ilgilendiğimi varsayalım , çünkü iki ortak değişken arasındaki etkileşimin Y üzerinde bir etkisi olup olmadığını görmek istiyorum.

Yi=β0+β1x1+β2x2+β3x1x2

Bir profesörün ders notlarında (kiminle temasa geçmediğim) şunu belirtir: Etkileşim koşullarını dahil ederken, ikinci derece koşullarını eklemelisiniz. yani regresyona dahil edilmelidir.

Yi=β0+β1x1+β2x2+β3x1x2+β4x12+β5x22

Neden sadece etkileşimlerle ilgilendiğimizde neden ikinci derece terimleri içermelidir?


7
Modeli varsa , bu içermelidir ve . Ancak ve isteğe bağlıdır. x1x2x1x2x12x22
user158565

6
Profesörünüzün görüşü olağandışı görünüyor. Uzmanlaşmış bir arka plan veya deneyimlerden kaynaklanabilir, çünkü “gerekir” kesinlikle evrensel bir gereklilik değildir. Sen bulabilirsiniz stats.stackexchange.com/questions/11009 bazı ilgi olması.
whuber

@ user158565 merhaba! Neden dahil etmemiz gerektiğini sorabilir miyimx1 ve x2? Aslında bunu düşünmedim, ama şimdi siz söylediniz ..!
fool126

@whuber merhaba! Bağlantı için teşekkürler! Ana etkiyi dahil etmenin mantıklı olduğunu düşünüyorum, ancak bunu ikinci dereceden terimleri dahil etmekle genişletmekte zorlanıyorum. // user158565 Sanırım yukarıdaki bağlantı bunu yanıtladı, teşekkür ederim!
fool126

Lütfen verilere bir bağlantı gönderir misiniz?
James Phillips

Yanıtlar:


8

Çıkarım amacına bağlıdır. Örneğin, nedensel bir bağlamda (veya daha genel olarak, etkileşim katsayısını yorumlamak istiyorsanız) bir etkileşim olup olmadığı konusunda çıkarım yapmak istiyorsanız, profesörünüzden gelen bu öneri mantıklıdır ve aslında fonksiyonel formun SEVİL etkileşimi hakkında yanlış çıkarımlara yol açabilir .

İşte aralarında etkileşim terimi bulunmayan basit bir örnek x1 ve x2 yapısal denkleminde y, ancak, ikinci dereceden terimini x1, yanlış sonuca varacaksınız x1 Ile etkileşim kurar x2 aslında değil.

set.seed(10)
n <- 1e3
x1 <- rnorm(n)
x2 <- x1 + rnorm(n)
y <- x1 + x2 + x1^2 + rnorm(n)
summary(lm(y ~ x1 + x2 + x1:x2))

Call:
lm(formula = y ~ x1 + x2 + x1:x2)

Residuals:
    Min      1Q  Median      3Q     Max 
-3.7781 -0.8326 -0.0806  0.7598  7.7929 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  0.30116    0.04813   6.257 5.81e-10 ***
x1           1.03142    0.05888  17.519  < 2e-16 ***
x2           1.01806    0.03971  25.638  < 2e-16 ***
x1:x2        0.63939    0.02390  26.757  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.308 on 996 degrees of freedom
Multiple R-squared:  0.7935,    Adjusted R-squared:  0.7929 
F-statistic:  1276 on 3 and 996 DF,  p-value: < 2.2e-16

Bu, basitçe atlanan değişken önyargı durumu olarak yorumlanabilir ve burada x12atlanan değişkendir. Geri dönüp kareli terimi regresyonunuza dahil ederseniz, görünen etkileşim kaybolur.

summary(lm(y ~ x1 + x2 + x1:x2 + I(x1^2)))   

Call:
lm(formula = y ~ x1 + x2 + x1:x2 + I(x1^2))

Residuals:
    Min      1Q  Median      3Q     Max 
-3.4574 -0.7073  0.0228  0.6723  3.7135 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -0.0419958  0.0398423  -1.054    0.292    
x1           1.0296642  0.0458586  22.453   <2e-16 ***
x2           1.0017625  0.0309367  32.381   <2e-16 ***
I(x1^2)      1.0196002  0.0400940  25.430   <2e-16 ***
x1:x2       -0.0006889  0.0313045  -0.022    0.982    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.019 on 995 degrees of freedom
Multiple R-squared:  0.8748,    Adjusted R-squared:  0.8743 
F-statistic:  1739 on 4 and 995 DF,  p-value: < 2.2e-16

Tabii ki, bu akıl yürütme sadece ikinci dereceden terimler için değil, genel olarak fonksiyonel formun yanlış tanımlanması için de geçerlidir. Buradaki amaç, etkileşimi değerlendirmek için koşullu beklenti işlevini uygun şekilde modellemektir. Kendinizi doğrusal regresyon ile modelleme ile sınırlıyorsanız, bu doğrusal olmayan terimleri manuel olarak eklemeniz gerekir. Ancak bir alternatif, örneğin çekirdek sırt regresyonu gibi daha esnek regresyon modellemesi kullanmaktır .


Sonuç olarak, @CarlosCinelli, sonuç olarak, fonksiyonel formun potansiyel yanlış tanımlamasını hesaba katmak için - ve regresyonun hangi terimlerin önemli olduğunu belirlemesine izin vermeniz gerektiğini mi söylüyorsunuz?
fool126

3
@KevinC ana soru şudur: Etkileşim terimini yorumlamak ister misiniz? Bunu yaparsanız, fonksiyonel formun yanlış tanımlanması gerçek bir konudur. İkinci dereceden terimler eklemek, doğrusal olmamaları yakalamanın basit bir yoludur, ancak genel sorun, koşullu beklenti işlevini uygun bir şekilde modellemektir.
Carlos Cinelli

1
Lütfen rm(list=ls())burada yayınlanan koda eklemeyin ! Eğer insanlar kodu kopyalayıp yapıştırıp çalıştırırlarsa, bir sürpriz alabilirler ... Şimdilik kaldırdım.
kjetil b halvorsen

3

Cevabınızda listelediğiniz iki model , etkisinin nasıl olduğunu netleştirmek için yeniden ifade edilebilir .X1 bağlı olduğu varsayılır X2 (veya başka bir şekilde) her modelde.

İlk model şu şekilde yeniden ifade edilebilir:

Y=β0+(β1+β3X2)X1+β2X2+ϵ,

ki bu, bu modelde, X1 üzerinde doğrusal bir etkiye sahip olduğu varsayılmaktadır. Y (etkisini kontrol etmek X2) ancak bu doğrusal etkinin büyüklüğü - eğim katsayısı tarafından yakalanır X1 - bir fonksiyonu olarak doğrusal olarak değişir X2. Örneğin,X1 üzerinde Y değerleri olarak büyüklüğü artabilir X2 artırmak.

İkinci model şu şekilde yeniden ifade edilebilir:

Y=β0+(β1+β3X2)X1+β4X12+β2X2+β5X22+ϵ,

ki bu, bu modelde, X1 üzerinde Y (etkisini kontrol etmek X2) doğrusal olmaktan ziyade ikinci dereceden olduğu varsayılır. Bu ikinci dereceden etki,X1 ve X12modelinde. KatsayısıX12 bağımsız olduğu varsayılır X2, katsayısı X1 doğrusal olarak bağımlı olduğu varsayılır X2.

Her iki modeli kullanmak, etkisinin doğası hakkında tamamen farklı varsayımlar yaptığınızı ima eder. X1 üzerinde Y (etkisini kontrol etmek X2).

Genellikle insanlar ilk modele uyar. Daha sonra bu modeldeki kalıntılarıX1 ve X2Dönüşlerde. Kalıntılar, kalıntılarda kuadratik bir patern ortaya koyarsa,X1 ve / veya X2, model buna göre genişletilebilir, böylece X12 ve / veya X22 (ve muhtemelen etkileşimleri).

Tutarlılık için kullandığınız gösterimi basitleştirdiğimi ve her iki modelde de hata terimini açık hale getirdiğimi unutmayın.


2
Merhaba @IsabellaGhement, açıklamanız için teşekkür ederiz. Özetle, etkileşim terimlerini dahil edersek ikinci dereceden terimler eklememiz gerektiğinden hiçbir "kural" yoktur. Günün sonunda, modelimiz hakkında yaptığımız varsayımlara ve analizimizin sonuçlarına (yani artık arsalar) geri dönüyor. Bu doğru mu? Tekrar teşekkürler :)!
fool126

2
Doğru, Kevin! Hiçbir "kural" yoktur, çünkü her veri kümesi farklıdır ve farklı soruları cevaplamak içindir. Bu nedenle, bu veri kümesine uyduğumuz her modelin, model sonuçlarına güvenmemiz için veriler tarafından desteklenmesi gereken farklı varsayımlar içerdiğinin farkında olmamız önemlidir. Model diyagnostik grafikleri (örn. Artıkların grafiği ile uygun değerlerin grafiği) verilerin model varsayımlarını ne ölçüde desteklediğini doğrulamamıza yardımcı olur.
Isabella Ghement

1
@KevinC: Harika! Size de iyi tatiller, Kevin! Gh🎈
Isabella Ghement
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.