Korelasyon katsayısının regresyon eğiminden farkı nedir?


69

Korelasyon katsayısının bir regresyon eğimi (beta) ile aynı olmasını beklerdim, ancak ikisini karşılaştırdıklarında farklılardı. Nasıl farklılaşıyorlar - hangi farklı bilgileri veriyorlar?


3
normalize edilirlerse, aynıdırlar. ama birimleri değiştirince ne olacağını bir düşün ...
nicolas

En üstteki puanlamanın bu Q'ya cevap verdiğini düşünüyorum (ve belki de benim A 'yla korelasyon katsayısının, eğer x ve x' e gerileme yaparsak elde ettiğimiz iki eğimin geometrik ortalamasının mutlak değeri olarak görülebildiğini gösteriyorum. y) sırasıyla) burada da ilgilidir
statmerkur

Yanıtlar:


82

Yi=α+βXi+εi
β^=cor(Yi,Xi)SD(Yi)SD(Xi)
SD(Yi)=SD(Xi)

XiYi

  • ±1

  • YiXiβ^YiXi


Bu cevabın bir sonucu olarak, y'ye x'e karşı gerileme işleminin y'ye x'e karşı gerileme tersinin olmadığına dikkat edin!
aginensky


14

Korelasyon katsayısı ölçer "gerginlik" iki değişken arasındaki doğrusal ilişkinin ve dahil, -1 ve 1 arasında sınırlanmaktadır. Sıfıra yakın korelasyonlar değişkenler arasında doğrusal bir ilişki göstermezken, -1 veya + 1'e yakın korelasyonlar güçlü doğrusal ilişkiyi gösterir. Sezgisel olarak, bir dağılım grafiğine en uygun çizgiyi çizmeniz ne kadar kolay olursa, o kadar korelasyonlu olurlar.

+

Dolayısıyla korelasyon katsayısı ve regresyon eğimi aynı işarete (+ veya -) sahip olmalıdır, ancak neredeyse hiçbir zaman aynı değere sahip olmayacaktır.

Basit olması için, bu cevap basit doğrusal regresyon varsaymaktadır.


inf,inf

1

Pearson korelasyon katsayısı, girdi değişkenlerinin boyutuna ve ölçeğine bakılmaksızın, boyutsuzdur ve -1 ile 1 arasında ölçeklenir.

(Örneğin), bir kütleyi gram veya kilogram cinsinden girerseniz, değerinde bir fark , oysa bu, gradyan / eğim için muazzam bir fark yaratacaktır (boyutlandırılmış ve buna göre ölçeklendirilmiş ... aynı şekilde, ölçek, herhangi bir şekilde ayarlanmışsa, bunun yerine pound veya pound kullanılması da dahil olmak üzere, için bir fark yaratmayacaktır ).rr

Basit bir gösteri (Python'u kullandığınız için özür dileriz!):

import numpy as np
x = [10, 20, 30, 40]
y = [3, 5, 10, 11]
np.corrcoef(x,y)[0][1]
x = [1, 2, 3, 4]
np.corrcoef(x,y)[0][1]

eğim 10 kat arttırılsa bile olduğunu göstermektedir .r=0.969363

İtiraf etmeliyim ki, -1 ile 1 arasında ölçeklendirilir (payerin asla paydadan daha büyük bir mutlak değeri olamayacağı durumlarda).r

@Macro yukarıda ayrıntılı olarak belirtildiği gibi, eğim , bu nedenle Pearson'un eğimle ilgili olduğunu , ancak yalnızca göre ayarlandığında standart sapmalara (bu, boyutları ve ölçekleri etkili bir şekilde geri yükler!).b=r(σyσx)r

İlk başta, formülün gevşek bir şekilde yerleştirilmiş bir çizginin (düşük ) daha düşük bir eğimde sonuçlandığını öne sürdüğünü garip hissettim; sonra bir örnek ve bir gradyan verildiğinde, "gevşekliği" değiştirerek azalmasına neden olduğunu fark ettim, ancak bu orantılı bir artışla dengeleniyor .rrσy

Aşağıdaki tabloda dört veri kümesi çizilmiştir:x,y

  1. sonuçları (çok gradyan , , , ) ... dikkaty=3xb=3r=1σx=2.89σy=8.66σyσx=3
  2. bir rasgele sayı ile aynı, ancak çeşitli , , biz hesaplayabilir olan,r=0.2447σx=2.89σy=34.69b=2.94
  3. y=15x (yani ve , , )b=15r=1σx=0.58σy=8.66
  4. (2) ile aynıdır, ancak azaltılmış aralık yani (ve yine de , , ) xb=14.70r=0.2447σx=0.58σy=34.69korelasyon ve gradyan

O varyans etkiler görülebilir mutlaka etkilemeden , ve ölçüm birimleri, böylece ölçek etkileyebilir ve etkilemedenrbbr

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.