Değişken düzen doğrusal regresyonda önemli midir?


9

İki değişken ( ve ) arasındaki etkileşimi araştırıyorum . Bu değişkenler arasında ile büyük oranda doğrusal korelasyon vardır . Sorunun doğasından nedensellik hakkında hiçbir şey söyleyemem ( veya başka bir yöne neden olup olmadığı ). Aykırı değerleri tespit etmek için regresyon çizgisinden sapmaları incelemek istiyorum. Bunu yapmak için ben de bir doğrusal regresyon inşa edebilirsiniz bir fonksiyonu olarak x_2 veya tersi. Değişken düzen seçimim sonuçlarımı etkileyebilir mi?x1x2r>0.9x1x2x1x2


Aykırı arayışı, öncelikle hem karşı bağımlı değişken gerileme gerektiğini x1 ve x2 ve farklı örneğine bakmak.
schenectady

Aykırı değerleri bulmak araştırmanızın gözü önünde mi? Eğer öyleyse, o zaman ilk ikisi karşı bağımlı değişken gerileme gerektiğini x1 ve x2 ve sonra testler Aykırı gerçekleştirin. Olası bir nedensellik bulursanız, tasarlanmış bir deney yapmayı düşünmelisiniz. Denemenizin amacı iki bağımsız değişkeniniz arasında bir ilişki bulmaksa, toplanan verilerin gerçekleşmesine bakmak hile yapmayacaktır.
schenectady

Aykırı değerlerle ne demek istediğinizi net değil. Verilerinizde aykırı değerler varsa, bunlar regresyon çizgisinin hesaplanmasını etkiler. Neden ikisi de aykırı Aradığınız ve eşzamanlı? x1x2
DQdlM

@schenectady Yorumlarda LaTeX için $$ kullanın, lütfen.

Yanıtlar:


3

Şüphesiz (aslında, verileriniz üzerindeki varsayımlarla ilgili bile önemlidir - sadece ortak değişken verilen sonucun dağılımı hakkında varsayımlar yaparsınız). Bu ışık altında, "ters tahmin varyansı" gibi bir terime bakabilirsiniz. Her iki durumda da, doğrusal regresyon nedensellik hakkında hiçbir şey söylemez! En iyi ihtimalle, dikkatli tasarımla nedensellik hakkında bir şeyler söyleyebilirsiniz.


3

Vakayı simetrik hale getirmek için iki değişken ( ) ile ortalama değerleri arasındaki fark azaltılabilir .Δx


3

Standart regresyon, noktalar ve çizgi arasındaki dikey mesafeyi en aza indirir, bu nedenle 2 değişkenin değiştirilmesi artık yatay mesafeyi en aza indirir (aynı dağılım grafiği verildiğinde). Başka bir seçenek (birkaç isim ile gider) dikey mesafeyi en aza indirmektir, bu prensip bileşenleri kullanılarak yapılabilir.

Farklılıkları gösteren bazı R kodları şunlardır:

library(MASS)

tmp <- mvrnorm(100, c(0,0), rbind( c(1,.9),c(.9,1)) )

plot(tmp, asp=1)

fit1 <- lm(tmp[,1] ~ tmp[,2])  # horizontal residuals
segments( tmp[,1], tmp[,2], fitted(fit1),tmp[,2], col='blue' )
o <- order(tmp[,2])
lines( fitted(fit1)[o], tmp[o,2], col='blue' )

fit2 <- lm(tmp[,2] ~ tmp[,1])  # vertical residuals
segments( tmp[,1], tmp[,2], tmp[,1], fitted(fit2), col='green' )
o <- order(tmp[,1])
lines( tmp[o,1], fitted(fit2)[o], col='green' )

fit3 <- prcomp(tmp)
b <- -fit3$rotation[1,2]/fit3$rotation[2,2]
a <- fit3$center[2] - b*fit3$center[1]
abline(a,b, col='red')
segments(tmp[,1], tmp[,2], tmp[,1]-fit3$x[,2]*fit3$rotation[1,2], tmp[,2]-fit3$x[,2]*fit3$rotation[2,2], col='red')

legend('bottomright', legend=c('Horizontal','Vertical','Perpendicular'), lty=1, col=c('blue','green','red'))

Aykırı değerleri aramak için sadece temel bileşenler analizinin sonuçlarını çizebilirsiniz.

Ayrıca şunlara da bakmak isteyebilirsiniz:

Bland ve Altman (1986), İki Klinik Ölçüm Yöntemi Arasındaki Anlaşmayı Değerlendirmede İstatistiksel Yöntemler. Lancet, s 307-310


0

X1 ve x2 değişkenleriniz birbiriyle uyumludur. Çok doğrusallık varlığında, parametre tahminleriniz hala tarafsızdır, ancak varyansları büyüktür, yani, parametre tahminlerinin önemine dair çıkarımınız geçerli değildir ve tahmininizin büyük güven aralıkları olacaktır.

Parametre tahminlerinin yorumlanması da zordur. Doğrusal regresyon çerçevesinde, x1 üzerindeki parametre tahmini, modeldeki diğer tüm dışsal değişkenlerin sabit tutulduğu göz önüne alındığında, x1'deki birim değişiklik için Y'deki değişikliktir. Sizin durumunuzda, x1 ve x2 yüksek derecede ilişkilidir ve x1 değiştiğinde x2 sabitini tutamazsınız.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.