Bağımsızlık neden sıfır korelasyon anlamına gelir?


16

Her şeyden önce şunu sormuyorum:

Sıfır korelasyon neden bağımsızlık anlamına gelmez?

Burada (oldukça güzel) burada ele alınmaktadır : /math/444408/why-does-zero-correlation-not-imply-independence

Sorduğum şey tam tersi ... iki değişkenin birbirinden tamamen bağımsız olduğunu söyleyin.

Kazayla küçük bir korelasyonları olamaz mı?

Olmamalı mıydı ... bağımsızlık ÇOK KÜÇÜK korelasyonu ima eder mi?


5
Bağımsız değişkenler bile neredeyse her zaman sıfırdan farklı bir ÖRNEK korelasyonuna sahip olacaktır, ancak yine de sıfıra yakın olacaktır.
jsk

10
@Jsk'ın işaret ettiği gibi, örnek korelasyonu beklenen korelasyon ile karıştırıyor olabilir
David

1
@David açıklayabilir misin? Hala istatistiklere yeni başlayan biriyim.
Joshua Ronis

3
@JoshuaRonis Örnek korelasyon, bir grup veri ile çalışırken gözlemlediğiniz korelasyondur. Bunu, iki değişken arasındaki "gerçek" korelasyonun ne olduğu hakkında bir fikir edinmek için kullanırsınız. Örnek ne kadar büyük olursa, alacağınız tahmin o kadar iyi olur. Örneğin, iki zarın sonuçları arasındaki korelasyon bağımsızdır, bu nedenle ilişkisizdir, on kez birlikte yuvarlasanız bile korelasyon alabilirsiniz (rastgele şans nedeniyle) Ama lütfen pozitif veya negatif korelasyon için bir tercih olmadığını unutmayın. (yani her birinin eşit şansı vardır)
David

Yanıtlar:


36

Korelasyon katsayısının tanımıyla, eğer iki değişken bağımsız ise korelasyonları sıfır olur. Yani, kazayla herhangi bir korelasyonu olamazdı!

ρX,Y=E[XY]E[X]E[Y]E[X2][E[X]]2 E[Y2][E[Y]]2

Eğer X ve Y bağımsız olarak, anlamına gelir E[XY]=E[X]E[Y] . Bu nedenle, bu durumda ρX,Y payı sıfırdır.

Yani, burada belirtildiği gibi korelasyonun anlamını değiştirmezseniz, bu mümkün değildir. Eğer tanımınızı korelasyonun ne olduğu konusunda açıklığa kavuşturmayın.


2
Yine de, korsan sayısı ile küresel ortalama sıcaklık arasında (ters) korelasyonu açıkça gösteren grafiklerimiz var. Diğer yorumlarda belirtildiği gibi, 'kazara görünümler' bahsetmemek için örnek boyutları konusunda dikkatli olunmalıdır
Carl Witthoft

@OmG "Burada belirtildiği gibi korelasyonun anlamını değiştirmezseniz" OPs sorusunu okuduğumda, "korelasyon" un çok farklı bir anlamı var. Bana göre: "Kazayla küçük bir korelasyonları olamaz mı?" çok güçlü bir şekilde 'ölçüm' korelasyonunu ima eder ve gerçekte korelasyonu ölçtüğünüzde sıklıkla "kazayla küçük bir korelasyon" bulacaksınız
endüstri7 20

1
@ endüstri7 Anlıyorum. Ancak resmi bir yöntemle tanımlanmalıdır. Nitel ve burada bunun hakkında konuşamayız.
OmG

@CarlWitthoft Korsan sayısı ve küresel ortalama sıcaklık bağımsız değildir. Aralarında bir bağımlılık yaratan ortak bir nedenleri vardır (yani zaman, gelişme, modernleşme vb.). "Bağımsızlık", "sebep olmaz" anlamına gelmez; "ilişkisiz" anlamına gelir ve bu çizelgeler açıkça bir ilişki gösterir.
Noah

@ Hayır, bir WHOOSH'un gerçekleşmesinden korkuyorum. venganza.org
Carl Witthoft

19

Örnek korelasyonu hakkında yorum yapar . Aynı boyutta iki küçük bağımsız örnekleri karşılaştırarak, örnek korelasyon genellikle gelen belirgin bir şekilde farklı olan r=0. burada [şey üzerinde OMG Yanıt (1) 'aykırı olduğuna nüfus korelasyon ρ.]

Oran 1 ile üstel dağılımdan n=5 büyüklüğünde bir milyon bağımsız örnek çifti arasındaki korelasyonları düşünün 1.

set.seed(616)
r = replicate( 10^6, cor(rexp(5), rexp(5))  )
mean(abs(r) > .5)
[1] 0.386212
mean(r)
[1] -0.0005904455

hist(r, prob=T, br=40, col="skyblue2")
  abline(v=c(-.5,.5), col="red", lwd=2)

resim açıklamasını buraya girin

Örneğin, aşağıda boyutta numune milyon çift ilk dağılım olan 5, için r=0.5716.

resim açıklamasını buraya girin

Bu konuda üstel dağılım hakkında özel bir şey yoktur. Üst dağıtımın standart normale değiştirilmesi aşağıdaki sonuçları vermiştir.

set.seed(2019)
...
mean(abs(r) > .5)
[1] 0.391061
mean(r)
[1] 1.43269e-05

resim açıklamasını buraya girin

n=20.

resim açıklamasını buraya girin

r


6
Küçük örnek boyutu için, sıfırdan "fark edilir şekilde" farklı olan korelasyonlar bulmanız muhtemeldir, ancak sıfırdan önemli ölçüde farklı korelasyonlar bulmanız daha olası değildir . Puan tahmininiz sıfırdan uzak olsa da, şanstan başka bir şey nedeniyle sıfır olmayan bir korelasyon gördüğünüzü güvenle iddia etmek için çok az veriye sahipsiniz. Sadece 5 çiftle, ​​0.8'den büyük korelasyon katsayıları 0'dan önemli ölçüde farklı olmayabilir.
Nükleer Wang

11

Basit cevap: 2 değişken bağımsız ise, popülasyon korelasyonu sıfırdır, oysa örnek korelasyon tipik olarak küçük fakat sıfırdan farklı olacaktır.

Çünkü örnek popülasyonun mükemmel bir temsili değildir.

Örnek ne kadar büyük olursa, popülasyonu o kadar iyi temsil eder, bu nedenle sahip olduğunuz korelasyon o kadar küçük olur. Bir İçin sonsuz numune korelasyon sıfır olacaktır.


1
Kesin formülasyon, herhangi biri için p ve ε, biraz var n böylece örnek boyutu daha büyükse n, sonra korelasyonun olasılığı ε daha az p.
Birikim

Evet, kesinlikle doğru! Cevabımı mümkün olduğunca basit ve kavramsal tutmaya çalıştım.
Dave

1

Belki de bu aynı sezgisel anlayışı paylaşan bazı insanlar için faydalıdır. Hepimiz böyle bir şey gördük:

resim açıklamasını buraya girin

Bu veriler muhtemelen bağımsızdır, ancak açıkça korelasyon sergilemektedir (r=0,66). İnternethaber.com "Bağımsızlığın sıfır korelasyon olduğunu düşündüm!" diyor öğrenci.

Diğerlerinin de belirttiği gibi, örnek değerler birbiriyle ilişkilidir, ancak bu popülasyonun sıfır olmayan korelasyonu olduğu anlamına gelmez .

Tabii ki, bu ikisi bağımsız olmalı - Nicolas Cage bu yıl rekor kıran 10 filmde göründüğü için, güvenlik amacıyla yaz için yerel havuzu kapatmamalıyız.

Ancak bu yıl kaç kişinin boğulduğunu kontrol ettiğimizde, rekor kıran 1000 kişinin bu yıl boğulma ihtimali düşük.

Böyle bir korelasyon elde etmek pek olası değildir. Belki binde bir. Ancak ikisi bağımsız olsa da mümkündür. Ama bu sadece bir vaka. Orada ölçmek için milyonlarca olası olayın olduğunu düşünün ve bazı ikisinin yüksek bir korelasyon verme olasılığının oldukça yüksek olduğunu görebilirsiniz (bu nedenle yukarıdaki gibi grafiklerin varlığı).

Buna bakmanın bir başka yolu, iki bağımsız olayın her zaman ilişkisiz değerler vermesini garanti etmenin kendisinin kısıtlayıcı olmasıdır. İki bağımsız zar ve birincisinin sonuçları göz önüne alındığında, ikinci zar için bazı sıfır olmayan korelasyon verecek belirli (büyükçe) bir dizi sonuç vardır. İkinci zarın sonuçlarını birinci ile sıfır korelasyon verecek şekilde sınırlamak, ilk zarın atışları sonuçların dağılımını etkilediğinden, bağımsızlığın açık bir ihlalidir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.