Korelasyon katsayısının regresyon eğiminden farkı nedir?

69

Korelasyon katsayısının bir regresyon eğimi (beta) ile aynı olmasını beklerdim, ancak ikisini karşılaştırdıklarında farklılardı. Nasıl farklılaşıyorlar - hangi farklı bilgileri veriyorlar?

regression correlation

— luciano
kaynak

3

normalize edilirlerse, aynıdırlar. ama birimleri değiştirince ne olacağını bir düşün ...

— nicolas

En üstteki puanlamanın bu Q'ya cevap verdiğini düşünüyorum (ve belki de benim A 'yla korelasyon katsayısının, eğer x ve x' e gerileme yaparsak elde ettiğimiz iki eğimin geometrik ortalamasının mutlak değeri olarak görülebildiğini gösteriyorum. y) sırasıyla) burada da ilgilidir

— statmerkur

82

Y_{i} = α + β X_{i} + ε_{i}

$Y_i = \alpha + \beta X_i + \varepsilon_i$

\hat{β} = c o r (Y_{i}, X_{i}) \cdot \frac{S D (Y_{i})}{S D (X_{i})}

$\hat {\beta} = {\rm cor}(Y_i, X_i) \cdot \frac{ {\rm SD}(Y_i) }{ {\rm SD}(X_i) }$

S D (Y_{i}) = S D (X_{i})

${\rm SD}(Y_i) = {\rm SD}(X_i)$

$X_i$ $Y_i$

$\pm 1$
$Y_i$ $X_i$ $\hat \beta$ $Y_i$ $X_i$

— Makro
kaynak

Bu cevabın bir sonucu olarak, y'ye x'e karşı gerileme işleminin y'ye x'e karşı gerileme tersinin olmadığına dikkat edin!

— aginensky

23

$\beta_1$ $r$

— dediklerinin - Monica Reinstate
kaynak

14

Korelasyon katsayısı ölçer "gerginlik" iki değişken arasındaki doğrusal ilişkinin ve dahil, -1 ve 1 arasında sınırlanmaktadır. Sıfıra yakın korelasyonlar değişkenler arasında doğrusal bir ilişki göstermezken, -1 veya + 1'e yakın korelasyonlar güçlü doğrusal ilişkiyi gösterir. Sezgisel olarak, bir dağılım grafiğine en uygun çizgiyi çizmeniz ne kadar kolay olursa, o kadar korelasyonlu olurlar.

$-\infty$ $+\infty$

Dolayısıyla korelasyon katsayısı ve regresyon eğimi aynı işarete (+ veya -) sahip olmalıdır, ancak neredeyse hiçbir zaman aynı değere sahip olmayacaktır.

Basit olması için, bu cevap basit doğrusal regresyon varsaymaktadır.

— Underminer
kaynak

- inf, inf

$-\inf, \inf$

1

Pearson korelasyon katsayısı, girdi değişkenlerinin boyutuna ve ölçeğine bakılmaksızın, boyutsuzdur ve -1 ile 1 arasında ölçeklenir.

(Örneğin), bir kütleyi gram veya kilogram cinsinden girerseniz, değerinde bir fark , oysa bu, gradyan / eğim için muazzam bir fark yaratacaktır (boyutlandırılmış ve buna göre ölçeklendirilmiş ... aynı şekilde, ölçek, herhangi bir şekilde ayarlanmışsa, bunun yerine pound veya pound kullanılması da dahil olmak üzere, için bir fark yaratmayacaktır ). $r$ $r$

Basit bir gösteri (Python'u kullandığınız için özür dileriz!):

import numpy as np
x = [10, 20, 30, 40]
y = [3, 5, 10, 11]
np.corrcoef(x,y)[0][1]
x = [1, 2, 3, 4]
np.corrcoef(x,y)[0][1]

eğim 10 kat arttırılsa bile olduğunu göstermektedir . $r = 0.969363$

İtiraf etmeliyim ki, -1 ile 1 arasında ölçeklendirilir (payerin asla paydadan daha büyük bir mutlak değeri olamayacağı durumlarda). $r$

@Macro yukarıda ayrıntılı olarak belirtildiği gibi, eğim , bu nedenle Pearson'un eğimle ilgili olduğunu , ancak yalnızca göre ayarlandığında standart sapmalara (bu, boyutları ve ölçekleri etkili bir şekilde geri yükler!). $b = r(\frac{\sigma_{y}}{\sigma_{x}})$ $r$

İlk başta, formülün gevşek bir şekilde yerleştirilmiş bir çizginin (düşük ) daha düşük bir eğimde sonuçlandığını öne sürdüğünü garip hissettim; sonra bir örnek ve bir gradyan verildiğinde, "gevşekliği" değiştirerek azalmasına neden olduğunu fark ettim, ancak bu orantılı bir artışla dengeleniyor . $r$ $r$ $\sigma_{y}$

Aşağıdaki tabloda dört veri kümesi çizilmiştir: $x,y$

sonuçları (çok gradyan , , , ) ... dikkat $y=3x$ $b=3$ $r=1$ $\sigma_{x}=2.89$ $\sigma_{y}=8.66$ $\frac{\sigma_{y}}{\sigma_{x}}=3$
bir rasgele sayı ile aynı, ancak çeşitli , , biz hesaplayabilir olan, $r = 0.2447$ $\sigma_{x}=2.89$ $\sigma_{y}=34.69$ $b= 2.94$
$y=15x$ (yani ve , , ) $b=15$ $r=1$ $\sigma_{x}=0.58$ $\sigma_{y}=8.66$
(2) ile aynıdır, ancak azaltılmış aralık yani (ve yine de , , ) $x$ $b= 14.70$ $r = 0.2447$ $\sigma_{x}=0.58$ $\sigma_{y}=34.69$

O varyans etkiler görülebilir mutlaka etkilemeden , ve ölçüm birimleri, böylece ölçek etkileyebilir ve etkilemeden $r$ $b$ $b$ $r$

— James
kaynak