Kovaryansı yalnızca ortalamayı anlayan birine nasıl açıklarsınız?


207

... varyans hakkındaki bilgilerini sezgisel bir şekilde (sezgisel olarak "anlamak" ) veya şunu söyleyerek artırabileceğimi farz edersek : Bu, veri değerlerinin 'ortalamadan' ortalama uzaklığıdır - ve varyans kare cinsindendir. birimleri, birimleri aynı tutmak için karekökü alırız ve buna standart sapma denir.

Diyelim ki, bu çok şey ifade edildi ve (umarım) 'alıcı' tarafından anlaşıldı. Şimdi, kovaryans nedir ve herhangi bir matematiksel terim / formül kullanmadan basit İngilizce dilinde nasıl açıklanır? (Yani, sezgisel açıklama.;)

Lütfen dikkat: Konseptin arkasındaki formülleri ve matematiği biliyorum. Aynı şeyi matematiği eklemeden modayı kolay bir şekilde anlatabilmek istiyorum; yani, 'kovaryans' ne anlama geliyor?


1
@ Xi'an - 'Nasıl' basit doğrusal regresyon ile tam olarak tanımlarsınız ? Gerçekten bilmek isterdim ...
Doktora

3
Zaten iki değişkeninizin bir dağılım grafiğine sahip olduğunuzu varsayarsak, x ve y, (0,0) 'daki orijinli, x = mean (x) (dikey) ve y = mean (x) (yatay)' da iki çizgi çizin: bu yeni koordinat sistemini kullanarak (başlangıç ​​noktası (ortalama (x), ortalama (y)), sağ üst ve alt sol kadranda bir "+" işareti, diğer iki kadranda bir "-" işareti koyun; Eğer temelde kovaryans, işareti var @Peter söylediklerini . tartışıldığı üzere, x- ve (SD tarafından) y-birimlerini daha yorumlanabilir özet yol Ölçekleme ardından gelen iplik .
chl

1
@chl - Lütfen bunu bir cevap olarak gönderebilir ve belki de tasvir etmek için grafikler kullanabilir misiniz?
Doktora

Bu web sitesinde, soyut açıklamalardan daha çok görüntüleri tercih ederken bana yardımcı olacak video buldum. Videolu web sitesi Özellikle bu resim :! [Buraya resim açıklamasını girin ] ( i.stack.imgur.com/xGZFv.png )
Karl Morrison

Yanıtlar:


375

Bazen alışılmadık veya farklı bir yaklaşımla "bilgiyi artırabiliriz". Bu cevabın anaokullarına açık olmasını ve biraz eğlenmesini istiyorum, böylece herkes boya kalemlerini çıkarsın!

Eşleştirilmiş verileri göz önüne alındığında , dağılım grafiklerini çizin. (Genç öğrenciler, bunu üretmeleri için bir öğretmene ihtiyaç duyabilirler. :-) Bu her bir nokta çifti , bir dikdörtgeni belirler: bu, kenarları paralel olan en küçük dikdörtgendir. Bu noktaları içeren eksenler. Böylece noktalar sağ üst ve alt sol köşelerde ("pozitif" bir ilişki) veya sağ üst ve alt sağ köşelerde ("negatif" bir ilişkidir).(x,y)(xi,yi)(xj,yj)

Mümkün olan tüm dikdörtgenleri çizin. Pozitif dikdörtgenleri kırmızı (örneğin) ve negatif dikdörtgenleri "kırmızı karşıtı" (mavi) yaparak bunları şeffaf şekilde renklendirin. Bu şekilde, dikdörtgenlerin çakıştığı her yerde, renkleri aynı olduklarında (mavi ve mavi veya kırmızı ve kırmızı) artar ya da farklı olduklarında iptal olurlar.

Olumlu ve olumsuz dikdörtgenler

( Bu pozitif (kırmızı) ve negatif (mavi) dikdörtgenin resminde, üst üste binmenin beyaz olması gerekir; ne yazık ki, bu yazılım gerçek bir "kırmızı karşıtı" bir renge sahip değil. Örtüşme gri arsa, ancak bütün net kırmızı miktarı doğru. )

Şimdi kovaryansın açıklaması için hazırız.

Kovaryans, arsadaki net kırmızı miktardır (maviyi negatif değerler olarak kabul eder).

İşte verilen kovaryanslarla dağılımlardan çizilen, en olumsuzdan (en mavi) en olumluya (en kırmızıya) verilen 32 binormal noktaya sahip örnekler.

Kovaryans arazileri, 2019 güncellendi

Bunları karşılaştırmak için ortak eksenlere çizilirler. Dikdörtgenler, onları görmenize yardımcı olmak için hafifçe özetlenmiştir. Bu, orijinal belgenin güncellenmiş (2019) bir sürümüdür: örtüşen dikdörtgenlerde kırmızı ve mavi renkleri uygun şekilde iptal eden bir yazılım kullanır.

Kovaryansın bazı özelliklerini çıkaralım. Bu özelliklerin anlaşılması, dikdörtgenlerin birkaçını çizmiş olan herkes için erişilebilir olacaktır. :-)

  • Bilinearity. Kırmızı miktarı arsanın boyutuna bağlı olduğundan, kovaryans, x eksenindeki skala ve y eksenindeki skala ile doğru orantılıdır.

  • Korelasyon, ilişki. Noktalar yukarı doğru eğimli bir çizgiye yaklaştıkça kovaryans artar ve noktalar aşağı doğru eğimli bir çizgiye yaklaştığında noktalar azalır. Bunun nedeni, eski durumda, dikdörtgenlerin çoğunun pozitif olması ve ikinci durumda, çoğunun negatif olmasıdır.

  • Doğrusal ilişkilerle ilişki. Doğrusal olmayan dernekler, pozitif ve negatif dikdörtgenlerin karışımlarını oluşturabildiğinden, öngörülemeyen (ve çok kullanışlı olmayan) kovaryanslara neden olurlar. Lineer dernekler, önceki iki karakterizasyon ile tamamen yorumlanabilir.

  • Aykırı değerlere duyarlılık. Geometrik bir outlier (kütleden uzak duran bir nokta), diğer tüm noktalarla birlikte birçok büyük dikdörtgen yaratacaktır. Tek başına, genel resimde net bir pozitif veya negatif kırmızı miktarı oluşturabilir.

Bu arada, bu kovaryans tanımı normalden yalnızca evrensel bir orantı sabiti (veri kümesi boyutundan bağımsız olarak) farklılık gösterir. Matematiksel olarak eğimli, burada verilen formülün her zamanki kovaryansın iki katı olduğunu gösteren cebirsel gösterimi gerçekleştirmekte hiçbir sıkıntı yaşamaz.


92
+1 Vay. Bu bile, ne olduğunu bildiklerini düşünenlere kovaryansı açıklamak için bile çalışır.
Aaron

7
+1 Yanıtınızı okumaktan gerçekten zevk alıyorum. Bazı dikdörtgenler çizeceğim ve oğluma onları
boyayalım

18
Şimdi, eğer tüm tanıtım istatistiki kavramlar öğrencilere bu kadar açık bir şekilde
sunulabilseydi

4
Bu güzel. Ve çok çok net.
Benjamin Mako Tepesi

4
@fcoppens Gerçekten, önerdiğiniz gibi ilerleyen geleneksel bir açıklama var. Bunu düşündüm çünkü gereksiz bir fikre sahip olmak istemedim - yani centroid inşa etmek . Bu açıklama, bir kutu boya kalemi ile beş yaşındaki çocuğa erişilmez olur. Sonunda çıkardığım sonuçlardan bazıları da hemen olmayacaktı. Örneğin, kovaryansın belirli aykırı değerlere karşı duyarlı olduğu artık çok açık değildir. (x¯,y¯)
whuber

61

Benim yorumumdan bahsetmek için, kovaryansı iki değişken arasındaki (ortalama) eş varyasyonun bir ölçütü olarak kullandım, ve diyelim .xy

Temel formülü hatırlamakta fayda vardır (açıklanması basit, giriş dersinin matematiksel beklentileri hakkında konuşmaya gerek yoktur):

cov(x,y)=1ni=1n(xix¯)(yiy¯)

Böylece, her bir gözlemin kovaryansa olumlu veya olumsuz yönde katkıda bulunabileceğini açıkça görüyoruz ki bağlı olarak, ve . Burada büyüklükten bahsetmediğimi, sadece gözlemin katkısının işareti olduğuna dikkat edin.(xi,yi)x¯y¯

Bu, aşağıdaki diyagramlarda gösterdiğim şey. Yapay veriler doğrusal bir model kullanılarak üretildi (sol, ; sağ, , burada sıfır ortalama ve olan bir gauss dağılımından çekildi , ve aralığında bir düzgün dağılımdan .y=1.2x+εy=0.1x+εεSD=2x[0,20]

görüntü tanımını buraya girin

Dikey ve yatay çubuklar , sırasıyla ve ortalamasını temsil eder . Bu, kökenden “bireysel gözlemlere bakmak” yerine, den yapabileceğimiz anlamına gelir . Bu sadece x ve y eksenindeki bir çeviriye karşılık gelir. Bu yeni koordinat sisteminde, sağ üst ya da sol alt kadranda bulunan her gözlem kovaryansa olumlu katkıda bulunurken, diğer iki kadranda bulunan gözlemler buna olumsuz katkıda bulunur. İlk durumda (solda), kovaryans 30.11'e eşittir ve dört çeyrekte dağılım aşağıda verilmiştir:xy(0,0)(x¯,y¯)

   +  -
+ 30  2
-  0 28

Açıkça, ortalamalarının üstünde olduğunda, karşılık gelen (wrt. ). 2 boyutlu puan bulutunun şeklindeki göze çarpma, değerleri arttıkça yükselme eğilimindedir. (Ancak kovaryans ve regresyon çizgisinin eğimi arasında açık bir ilişki olduğu gerçeğini de kullanabileceğimizi unutmayın, yani .)xiyiy¯xyb=Cov(x,y)/Var(x)

İkinci durumda (sağ, aynı ), kovaryans eşittir ve kadranlar arasındaki dağılım aşağıda gösterildiği gibi daha "homojendir":xi

   +  -
+ 18 14
- 12 16

Başka bir deyişle, ve 'nin aynı yönde artan bir vaka sayısı vardır . onların araçları.xiyi

Kovaryansı veya ölçeklendirerek azaltabileceğimizi unutmayın . Sol panelde, (veya ) kovaryansı on kat (3.01) azalır. Ölçüm birimleri ve ve yayılımı (araçlarına göre) kovaryansın değerini mutlak terimlerle yorumlamayı zorlaştırdığından, genellikle her iki değişkeni de standart sapmalarına göre ölçeklendirir ve korelasyon katsayısını elde ederiz. Bu, dağılım grafiğimizi olarak yeniden ortalamanın yanı sıray ( x / 10 , y ) ( x , y / 10 ) x y ( x , y ) ( ˉ x , ˉ y ) x yxy(x/10,y)(x,y/10)xy(x,y)(x¯,y¯)ayrıca x ve y birimini standart sapma cinsinden ölçeklendiriyoruz, bu da ve arasındaki lineer değişkenliğin daha yorumlanabilir bir ölçüsünü oluşturuyor .xy


28

Kovaryans, bir değişken diğerinin yükseldiğinde ne kadar yükseldiğinin bir ölçüsüdür.


1
Her zaman 'aynı' yönde mi? Ayrıca, ters ilişkiler için de geçerli midir (yani biri artar, diğeri artar)?
Doktora

4
@ nupul Peki, "yukarı" nın karşıtı "aşağı" dır ve "pozitif" in karşıtı "negatiftir". Bir cümle cevap vermeye çalıştım. Seninkiler çok daha tamamlandı. “İki değişkenin birlikte nasıl değiştiği” bile daha tamamlandı, ama bence anlaşılması biraz daha zor.
Peter Flom

1
Tek, basit bir cümleye sığdırmak için +1, ama bu korelasyon değil mi? Yani, daha büyük cov => daha büyük bir düzeltme biliyorum, ancak bu cümle ile bir cevap olarak "% 80" gibi bir şey beklerdim, bu da düzeltme = 0.8'e tekabül eder. Cov, verilerdeki varyansı da açıklamıyor mu? yani. "Kovaryans, diğeri arttığında bir değişkenin ne kadar artacağı ile orantılıdır ve ayrıca verilerin her iki değişkende yayılmasıyla orantılıdır" ya da bir şey mi?
naught101

4
Bu doğru, Peter, bu yüzden @ naught101 bu yorumu yaptı: sen bir değişim oranı gibi geliyor; bu nedenle birimleri [bir değişkene ait birimler] / [diğer değişkene ait birimler] olacaktır (eğer bir türev gibi yorumlanırsak) ) veya sadece [bir değişkenin birimi] olacaktır (eğer saf bir fark olarak yorumlanırsak). Bunlar ne kovaryans (ölçü birimi iki değişken için birimlerin ürünüdür) ne korelasyondur (ünite olmayan).
whuber

1
herhangi bir somut örneği ele alalım @nbro: Eğer değişkenler kovaryansını biliyor varsayalım ve ise mesela. En değişken "değişken" ve "yükselme" anlayışıyla bile, belirli bir miktarda yükselmesi durumunda ne kadar arttığını bu bilgiden tek başına söyleyebilir misiniz ? Cevap hayırdır: Size verdiği tek bilgi artma eğiliminde olacağıdır. Peter bu yazıda kovaryansı bir regresyon katsayısı ile karıştırdı (bu arada ikisi var ve bunlar genellikle farklı.). Y, 1 , Y, X, Y,XY1,YXY
whuber

12

Ben am Kendi sorumu yanıtlayan ama bu yazı boyunca gelenlerin açıklamaların bazı kontrol etmek için harika olur düşünce bu sayfada .

Çok iyi ifade edilmiş cevaplardan birini (bir kullanıcı 'Zhop' ile) anlatıyorum. Bu site kapanırsa veya birileri artık bu yayına eriştiğinde sayfa kapatılırsa bunu yapıyorum;)

Kovaryans, iki değişkenin birlikte ne kadar değiştiğinin bir ölçüsüdür. Bunu, sadece bir ölçünün (veya değişkenin) değiştiği aralık olan Varyans ile karşılaştırın.

Sosyal yapıların incelenmesinde, zengin insanların daha eğitimli olmaları muhtemel olduğunu varsayıyor olabilirsiniz, bu nedenle zenginlik ve eğitim ölçütlerinin birlikte nasıl bir arada kaldığını görmeye çalışırsınız. Bunu belirlemek için bir kovaryans ölçümü kullanırsınız.

...

İstatistiklere nasıl uygulandığını sorduğunda ne demek istediğinden emin değilim. Birçok istatistik sınıfında öğretilen bir ölçüdür. Bunu ne zaman kullanmalısın?

Birbiriyle ilişkili olarak ne kadar iki veya daha fazla değişkenin değiştiğini görmek istediğinizde kullanırsınız.

Bir takımdaki insanları düşünün. Coğrafi konumdaki farklılıkların birbirlerine göre nasıl değiştiğine bakın. Takım oynarken veya pratik yaparken, bireysel üyeler arasındaki mesafe çok küçüktür ve aynı yerde olduklarını söyleyebiliriz. Konumları değiştiğinde, bütün bireyler için birlikte değişir (örneğin bir otobüse seyahat etmek için seyahat). Bu durumda, yüksek kovaryans seviyesine sahip olduklarını söyleyebiliriz. Fakat oynamadıkları zamanlarda, kovaryans oranının oldukça düşük olması muhtemeldir, çünkü hepsi farklı hızlarda farklı yerlere gidiyorlar.

Böylece bir takım üyesinin konumunu, yüksek doğruluk derecesine sahip bir oyun yaparken veya oyun oynarken başka bir takım üyesinin konumuna göre tahmin edebilirsiniz. Kovaryans ölçümünün 1'e yakın olacağını düşünüyorum. Ancak, pratik yapmadıklarında veya oynamadıklarında, bir ekibin konumuna göre bir kişinin yerini tahmin etme şansınız çok daha düşük olacaktır. Muhtemelen sıfıra yakın olurdu, muhtemelen sıfır olmasa da, bazen ekip üyeleri arkadaş olacak ve kendi zamanlarında birlikte yerlere gidebilir.

Ancak, Amerika Birleşik Devletleri'ndeki bireyleri rastgele seçtiyseniz ve bunlardan birini diğerinin yerlerini tahmin etmek için kullanmaya çalıştıysanız, kovaryansın sıfır olduğunu muhtemelen görürsünüz. Başka bir deyişle, rastgele seçilen bir kişinin ABD'deki konumu ile diğerinin kesinlikle hiçbir ilişkisi yoktur.

Sezgiyi güçlendirmeye yardımcı olan başka bir tane ('CatofGrey' tarafından) eklenmesi:

Olasılık teorisi ve istatistiklerinde kovaryans, iki rastgele değişkenin ne kadar birlikte değiştiğinin ölçüsüdür (varyanstan farklı olarak, tek bir değişkenin ne kadar değiştiğini ölçer).

İki değişken birlikte değişme eğilimindeyse (yani, biri beklenen değerin üstünde olduğunda, diğer değişken de beklenen değerin üstünde olur), o zaman iki değişken arasındaki kovaryans pozitif olur. Öte yandan, bir tanesi beklenen değerin üstünde ise ve diğer değişken beklenen değerin altında ise, iki değişken arasındaki kovaryans negatif olacaktır.

Bu ikisi birlikte daha önce hiç anlamadığım şekilde kovaryansı anlamamı sağladı! Tek kelimeyle muhteşem!!


15
Her ne kadar bu tanımlar niteliksel olarak müstehcen olsa da, ne yazık ki eksiktir: kovaryansı korelasyondan ayırt etmez (ilk açıklama, ikisini birbirine karıştıracak gibi görünmez) ve lineer ortak varyasyonun temel varsayımını ortaya çıkarmaz. Ayrıca, kovaryansın her değişkenin ölçeğine (doğrusal olarak) bağlı olduğu önemli yönü de belirtmez.
whuber

@whuber - kabul etti! Ve dolayısıyla benim cevabını cevap olarak işaretlemedi :) (henüz değil;)
Doktora

12

Whuber'nin cevabını gerçekten seviyorum, bu yüzden daha fazla kaynak topladım. Kovaryans, hem değişkenlerin ne kadar yayıldığını hem de ilişkilerinin doğasını tanımlar.

Kovaryans, scatter grafiğindeki bir gözlemin ortalamadan ne kadar uzakta olduğunu tanımlamak için dikdörtgenler kullanır:

  • Bir dikdörtgen uzun kenarlara ve yüksek genişliğe veya kısa kenarlara ve kısa genişliğe sahipse, iki değişkenin birlikte hareket ettiğini kanıtlar.

  • Bir dikdörtgenin, bu değişkenler için nispeten uzun olan iki tarafı ve diğer değişken için nispeten kısa olan iki tarafı varsa, bu gözlem, değişkenlerin birlikte çok iyi hareket etmediğinin kanıtını sağlar.

  • Dikdörtgen 2. veya 4. kadrandaysa, bir değişken ortalamanın üzerinde olduğunda, diğeri ortalamanın altındadır. Bir değişkende bir artış, diğerinde bir düşüş ile ilişkilidir.

Bunun harika bir görselleştirmesini http://sciguides.com/guides/covariance/ adresinde buldum .


7
+1 Güzel açıklama (özellikle giriş niteliğindeki bir cümle özeti). Bağlantı ilginç. Wayback makinesinde arşiv bulunmadığından büyük olasılıkla yenidir. Olumlu ilişkiler için pozitif ve mavi için kırmızı seçimine kadar (üç yaşındaki) cevabımı çok yakından paralelleştirdiğinden, bu sitedeki malzemenin (yüklenmemiş) bir türevi olduğundan şüpheleniyorum.
whuber

4
"Harika görselleştirme" bağlantısı öldü ....
whuber

1
@ MSIS Bunu çözmek mümkün değil, çünkü dairede çok fazla sayıda olası dağılım var. Ancak, tek biçimli dağılıma atıfta bulunuyorsanız, hesaplamak için hiçbir şey yoktur, çünkü (konu başlıklarında istatistik.stackexchange.com/q/414365/919 adresindeki notu hatırladığım gibi ) korelasyon katsayısının kendi negatif QED
whuber

1
XX0XX2X1,XX2:11
whuber

1
α,a<αb((ba)mod2π)/(2π).

10

İşte kovaryansı bir resimle açıklama çabası. Aşağıdaki resimde yer alan her panelde, iki değişkenli bir dağılımdan simüle edilmiş 50 nokta, x & y, 0.8 ve satır ve sütun etiketlerinde gösterildiği gibi varyanslar arasında korelasyon vardır. Kovaryans, her panelin sağ alt köşesinde gösterilir.

Hepsi birbiriyle korelasyonlu farklı kovaryanslar = 0.8

Bunu geliştirmekle ilgilenen herkes ... işte R kodu:

library(mvtnorm)

rowvars <- colvars <- c(10,20,30,40,50)

all <- NULL
for(i in 1:length(colvars)){
  colvar <- colvars[i]
  for(j in 1:length(rowvars)){
    set.seed(303)  # Put seed here to show same data in each panel
    rowvar <- rowvars[j]
    # Simulate 50 points, corr=0.8
    sig <- matrix(c(rowvar, .8*sqrt(rowvar)*sqrt(colvar), .8*sqrt(rowvar)*sqrt(colvar), colvar), nrow=2)
    yy <- rmvnorm(50, mean=c(0,0), sig)
    dati <- data.frame(i=i, j=j, colvar=colvar, rowvar=rowvar, covar=.8*sqrt(rowvar)*sqrt(colvar), yy)
    all <- rbind(all, dati)
  }
}
names(all) <- c('i','j','colvar','rowvar','covar','x','y')
all <- transform(all, colvar=factor(colvar), rowvar=factor(rowvar))
library(latticeExtra)
useOuterStrips(xyplot(y~x|colvar*rowvar, all, cov=all$covar,
                      panel=function(x,y,subscripts, cov,...){
                        panel.xyplot(x,y,...)
                        print(cor(x,y))
                        ltext(14,-12, round(cov[subscripts][1],0))
                      }))

10

@Whuber'ın cevabını sevdim - kovaryansın nasıl görselleştirilebileceği konusunda aklımda belli belirsiz bir fikir olmadan önce, ama bu dikdörtgen grafikler dahi.

Bununla birlikte, kovaryans formülü ortalamayı içerdiğinden ve OP'nin orijinal sorusu, 'alıcının' ortalamanın kavramını anladığını belirttiğinden, her bir veri noktasını her veri noktasını karşılaştırmak için @ whuber'in dikdörtgen planlarını uyarlama konusunda bir çatlak olacağını düşünmüştüm. x ve y anlamına gelir, çünkü bu kovaryans formülünde neler olup bittiğini gösterir. Gerçekten sezgisel görünmenin bittiğini düşündüm: "Farklı korelasyonlu değişkenler için kovaryans grafikleri"

Her grafiğin ortasındaki mavi nokta x (x_mean) ve y (y_mean) ortalamasıdır.

Dikdörtgenler, her veri noktası için x - x_mean ve y - y_mean değerlerini karşılaştırıyor.

Dikdörtgen, aşağıdaki durumlarda yeşildir:

  • Hem x hem de y, ilgili araçlarından daha büyük
  • Hem x hem de y, ilgili araçlarından daha az

Şu durumlarda dikdörtgen kırmızıdır:

  • x, x_mean'dan daha büyük ancak y, y_mean'den daha küçüktür
  • x, x_mean'den daha az ancak y, y_mean'den daha büyüktür

Kovaryans (ve korelasyon) hem güçlü negatif hem de güçlü pozitif olabilir. Grafiğe bir renk diğerinden daha fazla baskın geldiğinde, bu verilerin çoğunlukla tutarlı bir desen takip ettiği anlamına gelir.

  • Grafiğin kırmızıdan çok yeşil olması durumunda, x arttığında y genellikle artar.
  • Eğer grafik yeşilden daha kırmızıysa, x arttığında y genellikle azalır.
  • Grafiğin bir rengin veya diğerinin hakimiyeti yoksa, x ve y'nin birbirleriyle olan ilişkisinde çok fazla bir kalıp olmadığı anlamına gelir.

İki farklı değişken x ve y için kovaryansın gerçek değeri, temelde tüm yeşil alanların eksi tüm kırmızı alanların toplamıdır, daha sonra toplam veri noktalarının sayısına bölünür - etkili bir şekilde grafiğin ortalama yeşilliği-kırmızılığı .

Bu nasıl ses / görünüyor?


3

Varyans, beklenen değere göre rastgele bir değişkenliğin değişme derecesidir. Temelde olmanın stokastik niteliği nedeniyle rastgele değişken temsil eder.

Kovaryans, iki farklı rastgele değişkenin birbirine göre değişme derecesidir. Bu, rastgele değişkenler aynı temel işlem veya bunların türevleri tarafından sürüldüğünde ortaya çıkabilir. Bu rastgele değişkenler tarafından temsil edilen işlemler birbirini etkiler veya aynı işlemdir ancak rastgele değişkenlerden biri diğerinden türetilir.


2

Ben sadece sezgisel olan korelasyonu açıklardım. "Korelasyon, iki değişkenle X ve Y arasındaki ilişkinin gücünü ölçer. Korelasyon -1 ile 1 arasındadır ve ilişki güçlü olduğunda mutlak değerde 1'e yakın olacaktır. Kovaryans, sadece standart sapmalarla çarpılan korelasyondur. İki değişken vardır: Böylece korelasyon boyutsuz olsa da, kovaryans, X ve Y değişkenlerinin birimlerinin ürünündedir.


10
Bu yetersiz görünüyor çünkü doğrusallıktan söz edilmiyor. X ve Y'nin güçlü bir kuadratik ilişkisi olabilir ama sıfır korelasyonu olabilir.
mark999

0

Yüksek pozitif kovaryansa sahip olacak iki değişken (korelasyon) bir odadaki insan sayısı ve odadaki parmak sayısı olacaktır. (İnsan sayısı arttıkça, parmak sayısının da artmasını bekliyoruz.)

Olumsuz bir kovaryansa (korelasyona) sahip olabilecek bir şey, bir kişinin yaşı ve başlarındaki saç köklerinin sayısı olabilir. Veya, bir kişinin yüzündeki sivilce sayısı (belirli bir yaş grubunda) ve haftada kaç tane randevu aldıkları. Daha uzun yıllara sahip olanlardan daha az saçlı, daha fazla aknesi olan insanlardan daha az randevu almasını bekliyoruz.


2
Kovaryans, korelasyonla mutlaka birbirinin yerine geçemez - ilki çok birim bağımlıdır. Korelasyon, IMO'nun kovaryansının 'gücünü' temsil eden, birimsiz bir skaler -1 ile 1 arasında bir sayıdır ve cevabınız net değil
Doktora

Cevap olarak indirgendi, kovaryans ve korelasyonun birbirinin yerine kullanılabileceği anlamına geliyor.
sapo_cosmico
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.