Korelasyon ve kovaryans arasındaki farkı nasıl açıklarsınız?


109

Bu soruyu takiben kovaryansı yalnızca ortalamayı anlayan birine nasıl açıklarsınız? kovaryansı meseleye açıklamak konusunu ele alan aklımda da benzer bir soru ortaya çıktı.

Bir istatistik kofitine kovaryans ve korelasyon arasındaki farkı nasıl açıklar ? Her ikisinin de, diğer bir değişkene bağlı bir değişkendeki değişimi ifade ettiği görülüyor.

Belirtilen soruya benzer şekilde, formül eksikliği tercih edilir.

Yanıtlar:


109

Kovaryanslarla ilgili problem, karşılaştırması zor olmalarıdır: (sırasıyla) metre ve kilogram cinsinden ifade edilen bir dizi yükseklik ve ağırlığın kovaryansını hesapladığınızda, diğer birimlerde yaptığınız zamandan farklı bir kovaryans elde edersiniz ( bu da zaten metrik sistemle veya onsuz aynı şeyi yapan insanlar için bir sorun yaratıyor!), ama aynı zamanda, (örneğin) boy ve kilonun 'parmaklarınızın ve parmaklarınızın uzunluğundan' daha fazla 'covary' olup olmadığını söylemek zor olacaktır. basitçe, 'ölçek' kovaryansının hesaplandığı için farklıdır.

Bunun çözümü kovaryansı “normalleştirmek” dir: kovaryansı, her iki kovaryanttaki çeşitliliği ve ölçeği temsil eden bir şeyle bölüp, -1 ile 1 arasında bir değere sahip olduğu bir değerle sonuçlanır: korelasyon. Orijinal değişkenleriniz hangi birimde olursa olsun, daima aynı sonucu elde edersiniz ve bu aynı zamanda, belli bir dereceye kadar, iki değişkenin ikiden daha fazla birbiriyle ilişkili olup olmadığını, sadece korelasyonlarını karşılaştırarak karşılaştırabilmenizi sağlar.

Not: Yukarıdakiler, okuyucunun zaten kovaryans kavramını anladığını varsayar.


2
+1 Son cümlede "kovaryans" yerine "korelasyon" yazmayı mı demek istediniz?
whuber

Kovaryansları farklı birimlerle karşılaştıramayacağınıza emin misiniz? Birimler kovaryansla çarpılır - vecm ise s, . Ve sonra sadece birim dönüşüm faktörü ile sonucuyla çarpabilirsiniz. cov(X,Y)=z cmscov(cars$speed,cars$dist) == cov(cars$speed/5,cars$dist/7)*(7*5)
R'da

3
@ naught101 Asıl mesele şu ki, eğer ve başka bir şey olmadığını söylersem, yüksek oranda yordap yormadığına dair hiçbir fikriniz olmazdı , oysa ki Eğer söylendi biraz daha yorumlanabilir şey olurdu. Cov(X,Y)=1010XYCor(X,Y)=.9
adam

@guy: Bu birimler olmadan kovaryans olur : PI, önemli olanın kovaryansları farklı varyanslara sahip iki veri setinden kolayca karşılaştıramayacağınız olduğunu düşünüyorum. Örneğin, B = 2 * A ilişkisine sahipseniz ve iki veri setine, {A1, B1} ve {A2, B2} ilişkisine sahipseniz, A1'in 0.5 varyansına ve A2'nin 2 varyansına sahip olması durumunda, , ilişki tamamen aynı olsa bile çok daha büyük olacaktır . cov(A2,B2)cov(A1,B1)
naught101

3
Bu yüzden basit terimlerle birleştirme> kovaryans
Karl Morrison,

58

Bu tür soruların gereksinimleri beni biraz tuhaf hissettiriyor. İşte matematiksel bir kavram / formül, ancak bunun hakkında tamamen matematiksel sembollerden yoksun bir bağlamda konuşmak istiyorum. Ayrıca, formülleri anlamak için gerekli olan asıl cebirin, yüksek öğrenimden önce çoğu kişiye öğretilmesi gerektiğini (matris cebirinin anlaşılması gerekmediği, sadece basit cebirin yeterli olacağı) belirtilmesi gerektiğini düşünüyorum.

Dolayısıyla, ilk başta formülü tamamen görmezden gelmek ve bazı sihirli ve sezgisel analojilerde konuşmak yerine, formüle bakıp, bileşenleri tek tek küçük adımlarla açıklamaya çalışalım. Formüllere bakarken kovaryans ve korelasyon arasındaki fark netleşmelidir. Analojiler ve sezgisel özellikler açısından konuşurken, iki basit göreceli kavramı ve bunların birçok durumda farklılıklarını engelleyeceğinden şüpheliyim.

Öyleyse, örnek kovaryansı için bir formülle başlayalım (bunlar wikipedia'dan yeni aldım ve benimsedim);

1n1i=1n(xix¯)(yiy¯)

Herkesi hızlandırmak için, formüldeki tüm öğeleri ve işlemleri açıkça tanımlayalım.

  • xi ve , aynı gözlemin iki ayrı niteliğinin ölçümleridir.yi
  • x¯ ve , her bir özelliğin aracıdır (veya ortalamasıdır).y¯
  • İçin , sadece bu biz tarafından nihai sonucu bölmek demektir Diyelim .1n1n1
  • i=1n bazıları için yabancı bir sembol olabilir, bu yüzden bu işlemi açıklamakta fayda var. Bu sadece tüm toplamıdır gözlemler ayırmak, ve gözlem toplam sayısını temsil eder.in

Bu noktada, konuya değinmek için elementlere ve operasyonlara bir yüz vermek için basit bir örnek verebilirim. Örneğin, her bir sıranın bir gözleme karşılık geldiği bir tablo hazırlayalım (ve ve uygun şekilde etiketlendi). Biri bu örnekleri daha belirgin hale getirebilir (örneğin, yaşı ve ağırlığı temsil ettiği söylenebilir), ancak buradaki tartışmamız için önemli olmamalıdır.xyxy

x y
---
2 5
4 8
9 3
5 6
0 8

Bu noktada, formüldeki toplam işlemin tam olarak anlaşılmadığını düşünüyorsanız, daha basit bir bağlamda tekrar tanıtabilirsiniz. Sadece şunu bu örnekteki ifadeyle aynıdır;i=1n(xi)

  x
 --
  2
  4
  9
  5
+ 0
 --
 20

Şimdi bu karışıklık giderilmeli ve formülün ikinci kısmına , . Şimdi, insanların zaten ne anlama geldiğini bildiğini varsayarak, ve nin ne anlama geldiğini ve postta daha önce kendi yorumlarımın ikiyüzlü olduğunu söyleyeyim; basit sezgisel tarama (ör: dağılımın ortası). Kişi daha sonra bu işlemi bir seferde bir işlem yapabilir. Bildirimi(xix¯)(yiy¯)x¯y¯(xix¯)sadece her bir gözlem arasındaki sapma / mesafeyi ve bu özelliğe ilişkin tüm gözlemlerin ortalamasını incelemektir. Dolayısıyla bir gözlem ortalamadan daha uzak olduğunda, bu işleme daha yüksek bir değer verilecektir. Daha sonra verilen örnek tabloya geri dönebilir ve sadece gözlemlerin vektöründeki işlemi gösterebilir .x

x x_bar (x - x_bar)
2 4     -2
4 4      0
9 4      5
5 4      1
0 4     -4

İşlem, vektörü için aynıdır , ancak sadece takviye için bu işlemi de sunabilirsiniz.y

y y_bar (y - y_bar)
5  6     -1
8  6      2
3  6     -3
6  6      0
8  6      2

Şimdi, ve belirsiz olmamalıdır ve bir sonraki işleme geçebiliriz, bu sonuçları bir araya , . Gung yorumlarda da belirtildiği gibi, bu genellikle çapraz ürün olarak adlandırılır (eğer biri istatistik için temel matris cebiri ekliyorsa geri getirmenin faydalı bir örneğidir).(xix¯)(yiy¯)(xix¯)(yiy¯)

Çarpma sırasında ne olacağına dikkat edin, eğer iki gözlem ortalamanın üzerinde bir mesafe ise, ortaya çıkan gözlem daha büyük bir pozitif değere sahip olacaktır (her iki gözlem de ortalamanın altında büyük bir mesafe ise, aynıdır, iki negatifle pozitif eşittir). Ayrıca, bir gözlem ortalamanın üstünde ve diğeri ortalamanın oldukça altındaysa, sonuç değerinin büyük (mutlak terimlerle) ve negatif (pozitif bir negatif zaman negatif bir sayıya eşit olacaktır) olacağını unutmayın. Son olarak, bir değer her iki gözlem için ortalamanın çok yakınında olduğunda, iki değeri çarpmanın küçük bir sayıya neden olacağını unutmayın. Yine bu işlemi bir tabloda sunabiliriz.

(x - x_bar) (y - y_bar)  (x - x_bar)*(y - y_bar)
-2             -1                2
 0              2                0  
 5             -3              -15 
 1              0                0
-4              2               -8

Şimdi, eğer odada herhangi bir istatistikçi varsa, bu noktada beklentisiyle kaynatılmalıdır. Bir kovaryansın ne olduğuna ve nasıl hesaplandığına dair bütün ayrı unsurları görebiliriz. Şimdi tek yapmamız gereken, önceki tablodaki nihai sonucu toplamak, ve işte bölmek , kovaryans artık mistik olmamalı (hepsi sadece bir Yunan sembolünü tanımlayarak).n1

(x - x_bar)*(y - y_bar)
-----------------------
   2
   0
 -15
   0
+ -8
-----
 -21

-21/(5-1) = -5.25

Bu noktada 5'in nereden geldiğini pekiştirmek isteyebilirsiniz, ancak bu tabloya tekrar bakmak ve gözlem sayısını saymak kadar basit olmalıdır (örnek ile popülasyon arasındaki farkı başka bir zamana bırakalım).

Şimdi, kendi içinde kovaryans bize fazla bir şey anlatmıyor (olabilir, ancak bu noktada izleyicilere sihirli, tanımsız referanslara başvurmadan ilginç örneklere girmeye gerek yok). İyi bir senaryoda, kovaryansın ne olduğunu niçin umursayacağımızı gerçekten satmanız gerekmeyecek, diğer durumlarda, izleyicinizin esir olduğunu ve sözünüzü alacağını ummanız gerekebilir. Ancak, kovaryansın ne olduğu ve korelasyonun ne olduğu arasındaki farkı geliştirmeye devam edersek, sadece korelasyon formülüne başvurabiliriz. Yunan sembol fobi önlemek için belki sadece söylemek korelasyon temsil etmek için kullanılan yaygın bir semboldür.ρ

ρ=Cov(x,y)Var(x)Var(y)

Yine, tekrarlamak için, önceki formüldeki pay basitçe tanımladığımız kovaryanstır ve payda, her bir bireysel serinin varyansının ürününün kareköküdür . Eğer varyansın kendisini tanımlamanız gerekirse, sadece varyansın bir serinin kendisiyle kovaryansı ile aynı şey olduğunu söyleyebilirsiniz (örn. ). Ve kovaryansla birlikte ortaya koyduğunuz tüm aynı kavramlar geçerlidir (yani bir seri, ortalamadan çok farklı yollara sahipse, yüksek bir varyansa sahip olacaktır). Belki de burada bir dizinin de olumsuz bir farkı olamayacağına dikkat edin (bu daha önce sunulan matematikten mantıksal olarak uymalıdır).Cov(x,x)=Var(x)

Bu yüzden tanıttığımız tek yeni bileşen paydasındadır . Bu yüzden, her bir dizinin varyanslarının çarpımından hesapladığımız kovaryansı bölüştürüyoruz. Neden bölünmenin daima -1 ile 1 arasında bir değere neden olacağı üzerine bir tedaviye girebilir , ancak Cauchy-Schwarz eşitsizliğinin gündemden çıkarılması gerektiğinden şüpheleniyorum. bu tartışma. Bu yüzden yine, ben ikiyüzlü ve bazılarına başvuruyorum, bunun için söz veriyorum , ancak bu noktada korelasyon katsayısını kullanmamızın nedenlerini ortaya koyabiliriz. Daha sonra bu matematik derslerini Peter Flom'un yanıtı gibi diğer ifadelerde verilen buluşsal bulgular ile ilişkilendirebilir.Var(x)Var(y)Var(x)Var(y)diğer sorulardan birine. Bu, kavramı nedensel ifadeler açısından tanıtmakla eleştirilirken, bu dersin bir noktada gündemde olması gerekir.

Bazı durumlarda bu tedavi düzeyinin uygun olmadığını anlıyorum. Senato yürütme özeti ister . Bu durumda, insanların diğer örneklerde kullandıkları basit sezgisel bulguları geri döndürebilirsiniz, ancak Roma bir günde inşa edilmedi. Ve yönetici özeti isteyen senatoya, eğer çok az zamanınız varsa, belki de benim için söz vermelisiniz ve analojilerin ve madde işaretlerinin formalitelerine uymalısınız.


4
Sorunun bir şekilde bu forumun amacı dışında olduğu fikrine tamamen katılıyorum. Kovaryansın en açık olandır. Bir açıklama önerebilir. Sadece beklenti kavramını kullanır. Formülün kullanılmaması, tamamlanmamış ve potansiyel olarak yanıltıcı versiyonlara yol açmaktadır. Bu da okuyucuyu yeni bir durumda kovaryans / korelasyonu hesaplayacak adama sağlayamaz. Masumiyetle savaşmanın en iyi yolu değil.
cov(X,Y)=E[(XE[X])(YE[Y])]
Xi'an

14
+1, bu oldukça iyi. Bununla birlikte, kavramsal tanıtımlarda o kadar eleştirel olmazdım. İnsanlara bir formül göstermenin onları kaybetme ihtimalinin yüksek olduğu için matematik kaygısı ile yeterince çalıştım. Genellikle sezgi 1 w / hız onları kalk ve sonra basitçe & iyice (Burada ne kadar) matematik yürümeye sonra . Bu şekilde, matematiğin zaten bildiklerini neyi temsil ettiğini öğreniyorlar ve zihinsel olarak ayrılırlarsa, hala büyük fikirleri öğrendiler. Teğetsel bir nokta olarak, Excel'de matematikte çalışıyorum ve bunun için çok iyi buluyorum.
gung

2
Bir kaç nitpicks (üzgünüm): Üst denkleminizde, bölüyorsunuz , ancak daha sonra (doğru olarak) ilişkili madde imlecinde bölünmeyi tartışıyor ; Ben belirtebilir "çapraz ürünü" olarak adlandırılır; Örnek kovaryans hakkında konuştuğunuz için, korelasyona girdiğinizde, ile ilgili şeyleri atlayabilir ve sadece ; son olarak, korelasyon, kovaryanstan , burada görülen varyanslara değil , örneğin SD'lere göre ölçeklendirilerek hesaplanır . , N - 1 ( X ı - ˉ X ) ( Y ı - ˉ y ) ρ rNN1(xix¯)(yiy¯)ρr
gung

Teşekkürler @gung, ilk formüldeki yazım hatasını değiştirdim ve sonra korelasyon için çarpılmış varyansların karekökünü kullandım (standart sapmayı tanımlamak yerine). Rho sembolünü başka bir sembolle karşılaştırırken, hiçbir şekilde güçlü hissetmiyorum. Eğer öğretiyor olsaydım ve bir ders kitabım olsaydı, büyük olasılıkla sadece metne uymak isterdim. Umarım bir Yunan sembolü daha fazla kaosa neden olmaz!
Andy W

1
Eğer cevabını 100 kere yükseltebilirsem, yapardım. Ne korkunç berrak bir açıklama!
Julian A.

10

Korelasyon (r) değişkenlerinizin (x & y) kovaryansıdır (x & y), standart sapmalarının her birinin ( ) bölünmesi (veya başka bir deyişle ayarlaması ).Var[x]Var[y]

Yani, korelasyon basitçe bir kovaryansın temsilidir, bu nedenle sonuç, -1'e (mükemmel tersine korelasyonlu) bir +1 (tamamen pozitif korelasyona) arasında uzanmalıdır, sıfıra yakın bir değerin iki değişkenin ilişkili olmadığı anlamına geldiğine dikkat edin.

Kovaryans sınırsızdır ve diğer kovaryanslarla karşılaştırıldığında bağlamdan yoksundur. Kovaryansları bir korelasyon içine normalleştirmek / ayarlamak / standartlaştırmak suretiyle veri kümeleri daha kolay bir şekilde karşılaştırılabilir.

Tahmin edebileceğiniz gibi, bir istatistiğin (kovaryans gibi) normalleştirilmesi / standartlaştırılması için farklı yollar vardır. Korelasyon ve kovaryans arasındaki ilişkinin matematiksel formülü, istatistikçilerin kullandıkları sözleşmeyi yansıtmaktadır (yani, standart sapmalarına göre ayarlama):

r=cov(x,y)Var[x]Var[y]

5

Merkezleme ve standartlaştırma fikrini biliyorsanız, x-xbar x'i ortalamaktır. Aynısı y için de geçerlidir. Böylece kovaryans basitçe verileri merkez alır. Bununla birlikte, korelasyon sadece verileri merkezlemekle kalmaz, aynı zamanda standart sapmayı kullanarak ölçeklendirir (standardize). Çarpma ve toplama, iki vektörün nokta çarpımıdır ve bu iki vektörün birbiriyle ne kadar paralel olduğunu gösterir (bir vektörün diğerine yansıması). (N-1) bölünmesi veya beklenen değeri alarak gözlem sayısı için ölçeklendirme yapmaktır. Düşünceler?



-3

Korelasyon, pozitif veya negatif korelasyon olup olmamasına ve boyutsuz olmasına bağlı olarak -1 ile +1 arasında ölçeklenir. Bununla birlikte, kovaryans, iki bağımsız değişken durumunda sıfırdan, iki veri kümesinin eşit olduğu durumda Var (X) 'a kadar değişir. COV birimleri (X, Y), Y birimlerinin X katıdır.


6
Kovaryans negatif olabilir, bu yüzden 0'da sınırlandırılmamıştır. Ayrıca, son cümle ile ne kastettiğinizi netleştirmiyorsunuz, The units of COV(X,Y) are the units of X times the units of Y.ayrıntılandırmak ister misiniz?
Andy W

@AndyW, üniteler kısmı tanımdan net değil mi? . Beklenti operatörü, X / Y değerlerinin sadece ağırlıklı bir ortalamasıdır ve birimler geçer. Cov(X,Y)=E[(XE[X])(YE[Y])]
naught101

1
@ naught101, Birimler geçiyor mu? Nagaraj'a yaptığım ilk yorum daha fazla açıklığa kavuşmaktı, zikrettiğim gibi belirsiz ifadeler kimseye yardımcı olmaz. Öyleyse neden kovaryansı "x birimleriyle çarpılan x birimleri" olarak yorumlayamıyoruz, çünkü bu değil. Potansiyel olarak daha doğru bir ifade (örnek kovaryansı için), " ortalama sapmaların ürünlerinin ortalaması " olacaktır. devam ...
Andy W

1
Şimdi, ortalama sapmalar kesinlikle orijinal birimlerle aynı değildir ve kovaryans için ortaya çıkan istatistik sadece orijinal özelliklerin ortalamasına ve varyansına bağlı değildir. Kovaryans, kendi başına, orijinal niteliklerin varyansını bilmeden size hiçbir şey söylemez.
Andy,
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.