Korelasyon ve basit doğrusal regresyon arasındaki fark nedir?


Yanıtlar:


114

Arasındaki korelasyon arasındaki fark nedir ve ve tahmin lineer regresyon den ?Y Y XXYYX

İlk olarak, bazı benzerlikler :

  • standardize edilmiş regresyon katsayısı, Pearson'un korelasyon katsayısı ile aynıdır.
  • Pearson korelasyon katsayısının karesi basit doğrusal regresyonda aynıdırR2
  • Ne basit doğrusal regresyon ne de korelasyon nedensellik sorularına doğrudan cevap vermez. Bu nokta önemlidir, çünkü basit regresyonun sihirli bir şekilde neden olduğu çıkarımına izin verebileceğini düşünen insanlarla tanıştım .YXY

İkincisi, bazı farklılıklar :

  • Regresyon denklemi (yani ) , değerlerine dayanarak ile ilgili tahminlerde bulunmak için kullanılabilir.Y Xa+bXYX
  • Korelasyon tipik olarak doğrusal ilişkiyi ifade ederken, polinom ya da gerçekten doğrusal olmayan ilişkiler gibi diğer bağımlılık biçimlerini ifade edebilir.
  • Korelasyon tipik olarak Pearson korelasyon katsayısına karşılık gelirken, Spearman's gibi başka korelasyon türleri de vardır.

Merhaba Jeromy, açıklaman için teşekkür ederim, ama burada hala bir sorum var: Peki ya tahmin yapmam gerekmiyorsa ve sadece iki değişkenin ne kadar yakın ve hangi yönde / güçte olduğunu bilmek istersem? Bu iki tekniği kullanarak hala farklı var mı?
yue86231

3
@ yue86231 Sonra bir korelasyon ölçüsü daha uygun olurdu gibi geliyor.
Jeromy Anglim

5
(1) benzerlikler için bu hipotez standart test eklemek için faydalı olabilir, örneğin tarafından gerçekleştirilen olarak "korelasyon = 0" ya da, (herhangi bir gerileme için) eşdeğer olarak, "eğim = 0", lmve cor.testiçinde R, aynı p-değerleri verecek.
whuber

3
@Whuber'dan gelen önerinin eklenmesi gerektiğine katılıyorum, ancak çok temel bir düzeyde , regresyon eğimi ve korelasyon katsayısının işaretinin eşit olduğuna işaret etmeye değeceğini düşünüyorum . Bu muhtemelen çoğu insanın korelasyon ile “en iyi uyum” çizgisi arasındaki ilişki hakkında öğrendiği ilk şeylerden biri (henüz buna “regresyon” demese bile) ama bunun kayda değer olduğunu düşünüyorum. Farklılıklara göre, X ile Y arasında aynı cevap korelasyonunu almanız ya da bunun tersi, ancak X üzerindeki Y'nin regresyonunun Y'deki X'inkinden farklı olması gerçeği de belirtilmeye değer olabilir.
Silverfish,

36

Graphpad.com web sitesinde yayınladığım bir cevap :

Korelasyon ve doğrusal regresyon aynı değildir. Bu farklılıkları göz önünde bulundurun:

  • Korelasyon, iki değişkenin ilişkili olduğu dereceyi belirler. Korelasyon verilerde bir çizgiye uymuyor.
  • Korelasyonla sebep ve sonuç hakkında düşünmeniz gerekmez. İki değişkenin birbirleriyle ne kadar iyi ilişki kurduğunu sadece siz belirlersiniz. Regresyonda, regresyon çizgisi Y'yi X'ten en iyi tahmin yolu olarak belirlendiğinden, sebep ve sonuç hakkında düşünmeniz gerekir.
  • Korelasyonla, iki değişkenden hangisinin "X" ve hangisini "Y" olarak adlandırdığınız önemli değildir. İkisini değiştirirseniz aynı korelasyon katsayısını elde edersiniz. Doğrusal regresyonda, hangi değişkeni "X" olarak adlandırdığınızı ve hangisini "Y" olarak adlandırdığınızı görmek çok önemlidir, çünkü ikisini değiştirirseniz farklı bir en uygun çizgi elde edersiniz. X'ten Y'yi en iyi tahmin eden çizgi, X'ten Y'yi öngören çizgi ile aynı değildir (dağılmayan mükemmel bir veriye sahip değilseniz).
  • Her iki değişkeni de ölçerken korelasyon neredeyse her zaman kullanılır. Bir değişken deneysel olarak manipüle ettiğiniz bir şey olduğunda nadiren uygundur. Doğrusal regresyonda, X değişkeni genellikle deneysel olarak manipüle ettiğiniz bir şeydir (zaman, konsantrasyon ...) ve Y değişkeni ölçtüğünüz bir şeydir.

13
“Y'yi X'ten en iyi tahmin etmenin” neden ve sonuç ile ilgisi yoktur: X, Y'nin ya da tam tersinin nedeni olabilir. Biri nedenlerden etkilere (kesinti) veya etkilerden nedenlere (kaçırılma) neden olabilir.
Neil G

4
"İkisini değiştirirseniz farklı bir en uygun çizgi elde edersiniz" biraz yanıltıcıdır; standartlaştırılmış eğimler her iki durumda da aynı olacaktır.
xenocyon

26

Tek öngörücü doğrusal regresyon durumunda, standartlaştırılmış eğim korelasyon katsayısı ile aynı değere sahiptir. Doğrusal regresyonun avantajı, ilişkinin, tahmin değişkeninin herhangi bir özel değeri verilen öngörülen değişken üzerindeki puanı (iki değişken arasındaki ilişkiyi temel alarak) tahmin edebileceğiniz şekilde tanımlanabilmesidir. Bilhassa bir bilgi parçasında doğrusal regresyon size bir korelasyonun kesişme olmadığını, kestirici 0 olduğunda öngörülen değişken üzerindeki değeri verdiğini gösterir.

Kısacası - hesaplamalı olarak aynı sonuçları üretirler, ancak basit doğrusal regresyonda yorumlayabilen daha fazla eleman vardır. İki değişken arasındaki ilişkinin büyüklüğünü basitçe tanımlamakla ilgileniyorsanız, korelasyon kullanın - sonuçlarınızı belirli değerler açısından tahmin etmek veya açıklamakla ilgileniyorsanız, muhtemelen regresyon yapmak istersiniz.


“Özellikle tek bir bilgi parçası, doğrusal bir regresyon, bir korelasyonun kesişme olmadığını gösterir” ... Çok fazla fark!
SIslam

Buna bakıldığında, regresyonun bir engelleme sağladığı doğrudur, çünkü birçok istatistik paketinin bunu yapması varsayılandır. Bir müdahale olmadan bir regresyonu kolayca hesaplayabilir.
russellpierce

Evet, herhangi bir kesinti olmadan bir regresyon kolayca hesaplanabilir ancak nadiren anlamlı olur: stats.stackexchange.com/questions/102709/…
kjetil b halvorsen 10:17

@kjetilbhalvorsen Standart bir eğim takarken tanımladığım durum hariç. Standart bir regresyon denkleminde kesişme terimi her zaman 0'dır. Neden? Hem IV hem de DV'ler ünite puanlarına standardize edilmiş olduklarından - bunun sonucu olarak kesişme tanımsal olarak 0'dır. (IV ve DV'yi standartlaştırmaya eşdeğer). Hem IV hem de DV, 0'a standartlaştırıldığında, kesişme tanımı 0'dır.
russellpierce 13:17

11

Korelasyon analizi sadece görmezden gelen ve değişken olan iki değişken arasındaki ilişkiyi ölçmektedir. Fakat regresyonun uygulanmasından önce, hangi değişkenin diğer değişken üzerindeki etkisini kontrol etmek zorunda kalırsınız.


9

Şimdiye kadar verilen cevapların tümü önemli görüşler sağlar, ancak birinin parametrelerini diğerine dönüştürebileceğiniz unutulmamalıdır:

Regresyon:y=mx+b

Regresyon parametreleri ile korelasyon, kovaryans, varyans, standart sapma ve ortalamalar arasındaki bağlantı: b= ˉ y -m ˉ x

m=Cov(y,x)Var(x)=Cor(y,x)Sd(y)Sd(x)
b=y¯mx¯

Böylece parametrelerini ölçekleyerek ve değiştirerek her ikisini de birbirine dönüştürebilirsiniz.

R'deki bir örnek:

y <- c(4.17, 5.58, 5.18, 6.11, 4.50, 4.61, 5.17, 4.53, 5.33, 5.14)
x <- c(4.81, 4.17, 4.41, 3.59, 5.87, 3.83, 6.03, 4.89, 4.32, 4.69)
lm(y ~ x)
## 
## Call:
## lm(formula = y ~ x)
## 
## Coefficients:
## (Intercept)            x  
##      6.5992      -0.3362
(m <- cov(y, x) / var(x)) # slope of regression
## [1] -0.3362361
cor(y, x) * sd(y) / sd(x) # the same with correlation
## [1] -0.3362361
mean(y) - m*mean(x)       # intercept
## [1] 6.599196

3

Korelasyondan sadece iki değişken arasındaki doğrusal ilişkiyi tanımlayan bir dizin alabiliriz; regresyonda ikiden fazla değişken arasındaki ilişkiyi tahmin edebilir ve hangi değişkenlerin x sonuç değişkenini y tahmin edebileceğini belirlemek için kullanabiliriz .


3

Altman DG'den alıntı, "Tıbbi araştırmalar için pratik istatistikler" Chapman & Hall, 1991, sayfa 321: "Korelasyon, bir veri setini, gerçek verilerle doğrudan ilişkisi olmayan tek bir sayıya indirger. Regresyon, çok daha faydalı bir yöntemdir. Elde edilen ölçümle açıkça ilişkili olan sonuçlar İlişkinin gücü açıktır ve belirsizlik güven aralıklarından veya tahmin aralıklarından açıkça görülebilir "


3
Altman ile sempati duymama rağmen - regresyon metotları çoğu zaman korelasyondan daha uygundur - bu teklif samanlıklı bir tartışma ortaya koyuyor. OLS regresyonunda üretilen bilgi, bir korelasyon hesaplamasına giren (birinci ve ikinci iki değişkenli anlar ve bunların standart hataları) gelen bilgilerin sağladığı ile eşdeğerdir ve korelasyon katsayısı, regresyon eğimi ile aynı bilgiyi sağlar. İki yaklaşım, varsaydıkları temel veri modellerinde ve yorumlarında biraz farklılık gösterir, ancak Altman'ın iddia ettiği şekilde değildir.
whuber

1

Regresyon analizi, iki değişken arasındaki ilişkinin etkisinin nedenini inceleyen bir tekniktir. oysaki korelasyon analizi, iki değişken arasındaki ilişkiyi nicel olarak inceleyen bir tekniktir.


6
CV'ye Hoşgeldiniz! Zaten bu sorunun çok fazla cevabı olduğu göz önüne alındığında, onlara bir göz atmak ister misiniz ve sizinkilerin yeni bir şey ekleyip eklemediğini görmek ister misiniz? Söyleyecek daha çok şeyiniz varsa, bunu yapmak için düzenleyebilirsiniz.
Scortchi

0

Korelasyon, ilişkinin gücünün bir endeksidir (sadece bir sayı). Regresyon, belirli bir fonksiyonel ilişkinin yeterliliğinin bir analizidir (bir modelin parametrelerinin tahmini ve önemlerinin istatistiksel testi). Korelasyonun boyutu, regresyonun tahminlerinin ne kadar doğru olacağı ile ilgilidir.


1
Hayır değil. Korelasyon bize sınırlı bir ilişki verir, ancak tahminlerin ne kadar doğru olabileceği ile ilgili değildir. R2 bunu verir.
SmallChess

-3

Korelasyon, iki ve daha sonra ilişki derecesi arasında bir ilişki olup olmadığını belirleyen bir istatistikte bir terimdir. Menzili -1 ile +1 arasındadır. Regresyon ortalamaya geri dönmek demektir. Regresyondan bir değişkeni bağımlı ve diğerini bağımsız tutarak değeri tahmin ediyoruz, ancak hangi değişkeni önceden tahmin etmek istediğimizi netleştirmelidir.


6
Merhaba, @shakir ve Cross Validated'e hoş geldiniz! Muhtemelen bunun eski bir soru olduğunu farkettiniz (2010'dan itibaren) ve ona zaten verilen yedi (!) Cevap var. Yeni cevabınızın daha önce ele alınmamış olan tartışma için önemli bir şey eklediğinden emin olmak iyi bir fikirdir. Şu anda durumdan emin değilim.
amip
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.