Korelasyon katsayısının bir regresyon eğimi (beta) ile aynı olmasını beklerdim, ancak ikisini karşılaştırdıklarında farklılardı. Nasıl farklılaşıyorlar - hangi farklı bilgileri veriyorlar?
Korelasyon katsayısının bir regresyon eğimi (beta) ile aynı olmasını beklerdim, ancak ikisini karşılaştırdıklarında farklılardı. Nasıl farklılaşıyorlar - hangi farklı bilgileri veriyorlar?
Yanıtlar:
Korelasyon katsayısı ölçer "gerginlik" iki değişken arasındaki doğrusal ilişkinin ve dahil, -1 ve 1 arasında sınırlanmaktadır. Sıfıra yakın korelasyonlar değişkenler arasında doğrusal bir ilişki göstermezken, -1 veya + 1'e yakın korelasyonlar güçlü doğrusal ilişkiyi gösterir. Sezgisel olarak, bir dağılım grafiğine en uygun çizgiyi çizmeniz ne kadar kolay olursa, o kadar korelasyonlu olurlar.
Dolayısıyla korelasyon katsayısı ve regresyon eğimi aynı işarete (+ veya -) sahip olmalıdır, ancak neredeyse hiçbir zaman aynı değere sahip olmayacaktır.
Basit olması için, bu cevap basit doğrusal regresyon varsaymaktadır.
Pearson korelasyon katsayısı, girdi değişkenlerinin boyutuna ve ölçeğine bakılmaksızın, boyutsuzdur ve -1 ile 1 arasında ölçeklenir.
(Örneğin), bir kütleyi gram veya kilogram cinsinden girerseniz, değerinde bir fark , oysa bu, gradyan / eğim için muazzam bir fark yaratacaktır (boyutlandırılmış ve buna göre ölçeklendirilmiş ... aynı şekilde, ölçek, herhangi bir şekilde ayarlanmışsa, bunun yerine pound veya pound kullanılması da dahil olmak üzere, için bir fark yaratmayacaktır ).
Basit bir gösteri (Python'u kullandığınız için özür dileriz!):
import numpy as np
x = [10, 20, 30, 40]
y = [3, 5, 10, 11]
np.corrcoef(x,y)[0][1]
x = [1, 2, 3, 4]
np.corrcoef(x,y)[0][1]
eğim 10 kat arttırılsa bile olduğunu göstermektedir .
İtiraf etmeliyim ki, -1 ile 1 arasında ölçeklendirilir (payerin asla paydadan daha büyük bir mutlak değeri olamayacağı durumlarda).
@Macro yukarıda ayrıntılı olarak belirtildiği gibi, eğim , bu nedenle Pearson'un eğimle ilgili olduğunu , ancak yalnızca göre ayarlandığında standart sapmalara (bu, boyutları ve ölçekleri etkili bir şekilde geri yükler!).
İlk başta, formülün gevşek bir şekilde yerleştirilmiş bir çizginin (düşük ) daha düşük bir eğimde sonuçlandığını öne sürdüğünü garip hissettim; sonra bir örnek ve bir gradyan verildiğinde, "gevşekliği" değiştirerek azalmasına neden olduğunu fark ettim, ancak bu orantılı bir artışla dengeleniyor .
Aşağıdaki tabloda dört veri kümesi çizilmiştir:
O varyans etkiler görülebilir mutlaka etkilemeden , ve ölçüm birimleri, böylece ölçek etkileyebilir ve etkilemeden