Nedensellik korelasyon anlamına mı gelir?


118

Korelasyon, nedensellik anlamına gelmez, çünkü korelasyon için birçok açıklama olabilir. Ancak nedensellik korelasyon anlamına mı gelir? Sezgisel olarak nedensellik varlığının mutlaka bir korelasyonun olduğu anlamına geldiğini düşünüyorum. Ancak sezgim istatistiklerde bana her zaman iyi hizmet etmedi. Nedensellik korelasyon anlamına mı gelir?


5
Sorun şu ki, bir sözlükteki "ima" kelimesini ararsanız, "öner" ve "zorunlu" ifadelerini görürsünüz.
rolando2

6
Korelasyon nedensellik anlamına gelmez, ancak kaşlarını anlamlı bir şekilde sallandırır ve ağızdan 'oraya bakarken' şiddetli bir şekilde hareket eder. xkcd.com/552
jchristie

1
Sorunun kendisi, ima edilen kelimenin kullanımıyla belirtildiği gibi, spesifik ve olgusal bir cevap aramıyor gibi görünmektedir. Yukarıdaki referans belki de nihai gibi. Ya da daha çok bir olasılık gibi ama ispatlayamam.
jchristie

Yanıtlar:


96

Yukarıdaki cevapların çoğunun belirttiği gibi, nedensellik doğrusal korelasyon anlamına gelmez . Korelasyon kavramlarının çoğu, ağırlıklı olarak doğrusal istatistiklere dayanan alanlardan geldiğinden, genellikle korelasyonun doğrusal korelasyona eşit olduğu görülmektedir. Wikipedia makale Gerçekten bu görüntü gibi, bunun için bir Tamam kaynağıdır:

Korelasyon örnekleri

Alt satırdaki bazı şekillere bakın, örneğin 4. örnekteki parabol şeklinde. Bu, @StasK cevabında ne olduğuna benzer (biraz gürültü eklendi). Y tamamen X'ten kaynaklanabilir, ancak sayısal ilişki doğrusal ve simetrik değilse, yine de 0 korelasyonuna sahip olursunuz.

Aradığınız kelime karşılıklı bilgidir : bu genel korelasyonun doğrusal olmayan versiyonudur. Bu durumda, ifadeniz doğru olacaktır: nedensellik, yüksek karşılıklı bilgi anlamına gelir .


3
Yüksek karşılıklı bilginin nedenselliğe eşlik ettiği genellikle ancak her zaman doğru değildir. @ Gung'ın cevabına bakınız, “neden tam tersi etkiye sahip başka bir nedensel değişkenle mükemmel şekilde ilişkiliyse”.
Neil G

5
Birbirini daima iptal eden ters etkilere sahip iki nedenin argümanı bana bir neden olarak pek mantıklı gelmiyor . Bir şeye neden olan tek boynuzlu atlar olduğunu ve gremlinlerin çabalarını kusursuz bir şekilde iptal ettiğini her zaman varsayabilirim; Aptalca olduğu için bundan kaçınıyorum. Ama belki de amacını yanlış anlıyorum.
Artem Kaznatcheev

11
Örneği olması gerekenden daha aşırı. ve Boolean değişkenlerine sahip olmanız mümkündür , öyle ki ve ve nedenleridir (mod 2). O zaman, , ve bilgisinin yokluğu karşılıklı bilgi sahibi değildir. keşfedilmemiş bir karartıcı - çok yaygın bir şey olsa bile "gremlin" dediğiniz şey. C A B C C = A + B B A C BA,BCABCC=A+BBACB
Neil G

2
@NielG İlk cümlenizle aynı fikirdeyim, ikincisi değil. Sadece A ve B'nin C'ye neden olması, A'nın C ve B'nin C'ye neden olduğu anlamına gelmez. Nedenin neden üzerinde dağılması gerektiğini anlamıyorum.
Artem Kaznatcheev

4
Yine de, A'nın bir C nedeni olmasının sebebi, A'yı değiştirmenin hala C'yi değiştireceğidir. Dolayısıyla, C, B'yi gözlemlemediğimizde bile, A'ya bağımlıdır.
Neil G

41

Kesin cevap “hayır, nedensellik mutlaka korelasyon anlamına gelmez” dir.

Düşünün ve . Nedensellik güçlenmiyor: belirler . Ancak, ve arasındaki korelasyon 0'dır. Kanıt: Bu değişkenlerin (eklem) momentleri: ; ; kullanarak standart normal dağılımın tuhaf anlarının hepsinin sıfıra eşit olma özelliği (moment oluşturma fonksiyonundan kolayca türetilebilir). Dolayısıyla, korelasyon sıfıra eşittir.XN(0,1)Y=X2χ12XYXYE[X]=0E[Y]=E[X2]=1

Cov[X,Y]=E[(X0)(Y1)]=E[XY]E[X]1=E[X3]E[X]=0

Yorumların bir kısmına değinmek: Bu argümanın çalışmasının tek nedeni, dağılımının sıfırda merkezlenmiş olması ve 0 civarında simetrik olmasıdır. Aslında, bu özelliklere sahip, yeterli sayıda anı olacak başka herhangi bir dağılım, yeri , örneğin üzerine üniforma veya Laplace . Basitleştirilmiş argüman her pozitif değeri için olmasıdır , bir eşit olasılıkla negatif değer yoktur size karesini aldığımda nedenle aynı büyüklükteydi , sen büyük değerler olduğunu söyleyemeyiz büyük veya daha küçük değerler ile ilişkilidir veXN(0,1)(10,10)exp(|x|)XXXXY. Ancak, eğer derseniz , , , ve . Bu mükemmel bir anlam ifade eder: sıfırın altındaki her değeri için, sıfırın üstünde olan çok daha muhtemel bir değeri vardır , dolayısıyla daha büyük değerleri daha büyük değerleri ile ilişkilendirilir . (İkincisi, merkezi olmayan bir dağılımına sahiptir ; varyansı Wikipedia sayfasından çekebilir ve ilgileniyorsanız korelasyonu hesaplayabilirsiniz.)XN(3,1)E[X]=3E[Y]=E[X2]=10E[X3]=36X - X X -Y χ 2Cov[X,Y]=E[XY]E[X]E[Y]=3630=60XXXYχ2


2
@DQdlM: Standart rastgele değişken, yoğunluğun düzgünlüğünden dolayı garip merkezi anlara sahiptir . Matthew: Cevap hayır, StasK'ın da gösterdiği gibi, çünkü korelasyon tek bağımlılık türü değildir.
Emre

3
XN(3,1)

3
PS Bu cevabı gönderdiğiniz için çok memnunum. Sorunun bu cevap olmadan çok uzun sürdüğüne inanmak zordu. Bu soruyu gördüğümde aklıma gelen tam bir örnekti, ancak yazmaya zaman bulamadım. Sana sevindim ki zaman alacaktır. Şerefe.
kardinal

3
@cardinal: evet, sanırım hepimiz grad okulda bu tür basit karşı örnekleri öğrendik ... ve evet, kovaryansın türetilmesinden, sadece ilk ve üçüncü anların sıfır olması gerekir. Sıfır üçüncü momenti olan (5 veya altı puanın üzerinde hassas ayarlanmış olasılık kütleleri sayılmaz) önemsiz olmayan bir asimetrik dağılım örneğiniz varsa, bunu görmek çok merak ediyorum.
StasK

3
XYfY=f(X)

31

Esasen, evet.

Korelasyon nedensellik anlamına gelmez, çünkü nedenin ötesinde bir korelasyon için başka açıklamalar olabilir. Fakat A'nın B'ye sebep olabilmesi için bir şekilde ilişkilendirilmeleri gerekir . Yani, aralarında bir korelasyon var - bu korelasyonun mutlaka doğrusal olması gerekmese de.

Yorum yapanların bazılarının önerdiği gibi, muhtemelen korelasyondan ziyade 'bağımlılık' veya 'dernek' gibi bir terim kullanmak daha uygun olacaktır. Yorumlarda bahsettiğim gibi, basit korelasyonun çok ötesinde bir analize cevap olarak "korelasyonun nedensellik anlamına gelmediğini" gördüm ve bu nedenle, bu ifadenin amaçları doğrultusunda, aslında "korelasyonu" herhangi birine A ve B arasındaki ilişki


16
Korelasyon kelimesini lineer korelasyon için ayırma eğilimindeyim ve lineer korelasyonu olan veya olmayan lineer olmayan ilişkiler için bağımlılık kullanın .
12'de

4
@Memming Ben de insanların "Korelasyon nedensellik anlamına gelmez" şeklinde davrandığı gerçeğini korudum: Oldukça karmaşık doğrusal olmayan ilişki.
Fomite

Memming doğru. Pearson korelasyonunu kastetmiyorsanız korelasyonu tanımlamanız gerekir.
Neil G

1
@NeilG Veya bu konuda, biri değişkenini diğeri değiştirerek doğrusal bir Pearson korelasyonu elde edilebilir. Sorun, atasözünün aşırı basitleştirilmiş olmasıdır.
Fomite

1
@EpiGrad: Her iki iyi nokta. Ortak paritede, korelasyon A'nın daha fazlasıdır. B ile çakışmaktadır. Bence cevabınız, geniş bir korelasyon tanımını kullanımınızı netleştirmekten fayda sağlayacaktır.
Neil G

23

@EpiGrad'ın cevabına ekleme. Bence birçok insan için "korelasyon", "doğrusal korelasyon" anlamına gelir. Ve doğrusal olmayan korelasyon kavramı sezgisel olmayabilir.

Yani, "hayır onlar edilmesi gerekmez söyleyebilirim korelasyon ama olmak zorunda mı ilgili ". Maddenin üzerinde hemfikiriz, ancak maddeyi geçmenin en iyi yolunda aynı fikirde değiliz.

Böyle bir nedenin bir örneği (en azından insanlar bunun nedensel olduğunu düşünüyor), telefonunuzu yanıtlama olasılığı ile gelir arasında olduğu anlamına gelir. Gelir spektrumunun her iki ucundaki kişilerin telefonlarına cevap verme ihtimalinin ortadakilerden daha az olduğu bilinmektedir. Nedensel modelin fakirler için farklı olduğu düşünülmektedir (örneğin, fatura toplayıcılardan kaçınmak) ve zengin (örneğin, bağış isteyen insanlardan kaçınmak).


21

XY

Aşağıdaki nedensel modeli göz önünde bulundurun:

XYU

XUY

Şimdi izin ver:

Xbernoulli(0.5)Ubernoulli(0.5)Y=1XU+2XU

UP(Y|X)=P(Y)XYYX

XUYXUXYUY {X,U}YXYXYXYXYU

Yani kısaca şunu söyleyebilirim ki: (i) nedensellik bağımlılığı öneriyor ; ancak, (ii) bağımlılık işlevsel / yapısal bağımlılıktır ve düşündüğünüz belirli istatistiksel bağımlılıkta çeviri yapabilir veya olmayabilir.


Carlos, nedensel modelde yer alan değişkenlerin tam setini biliyorsanız, bu sorunun (istatistiksel görünmezlik) ortadan kalktığını söylemek doğru olur.
markowitz

@ markowitz her şeyi deterministik düzeyde gözlemlemeniz gerekecekti, dolayısıyla çok gerçekçi bir senaryo değil.
Carlos Cinelli,

Cevabınızı “evet” olarak yorumluyorum. Haklısın, sandığım durum gerçekçi değil; Bunun farkındayım. Bununla birlikte, soru yalnızca sizin tanımladığınız mantıkla ilgiliydi ve nihai olmak onu kavramaktı. Benim inancım, “nedensellik istatistiksel ilişki anlamına gelir” gibi bir şeydi ve bu sayfadaki diğer cevaplar bunun gibi geliyor. Ne de olsa, örneğiniz biraz gerçekçi değil, fakat bu nedenle ilgi çekici değil. Görünen o ki, genel olarak, istatistiksel bir ilişki olmadan nedensellik biraz gerçekçi olmamakla birlikte teorik olarak ilginç.
markowitz

1
@ markowitz "istatistiksel görünmezlik", model grafiğe sadık olmadığında gerçekleşir. Kesin iptal için, bu, belirli bir parametreleştirme seçimine bağlıdır, bu yüzden bazı insanlar bunun pek mümkün olmadığını iddia ederler. Bununla birlikte, yakın bir çözüm, bir parametrelerin komşuluğuna bağlı olduğu için makul olabilir, bu yüzden hepsi bağlama bağlıdır. Burada mesele, nedensel varsayımlarınızı açıklığa kavuşturmanız gerektiğidir, çünkü mantıksal olarak nedensellik kendiliğinden ilişkilendirme anlamına gelmez - ekstra varsayımlara ihtiyacınız vardır.
Carlos Cinelli

13

Hiçbir varyasyon olmadıkça neden ve sonuç ilişkili olacaktır hiç insidansı ve nedene büyüklüğü ve hiçbir varyasyon hiç onun nedensel yürürlükte. Diğer tek olasılık, nedenin tam tersi etkiye sahip başka bir nedensel değişkenle mükemmel bir şekilde korelasyon göstermesi olabilir . Temel olarak, bunlar düşünce deneyi koşullarıdır. Gerçek dünyada nedensellik, bir biçimde bağımlılık anlamına gelecektir ( doğrusal korelasyon olmasa da ).


3
@NeilG, italik bağımlılığımı şımarttım .
gung

1
Bazı teoriler aslında bunu ima eder, örneğin birçok oyun teorisi modeli. Farklılığı ayırt edemediğiniz bazı ampirik durumlar (gerçekte :-) 'italik olarak' 'gung-italics'te bir tane olmasına rağmen' 'nötr' içerir), iki seviyede evrimsel seçim baskısı farklı yönlere işaret ettiğinde hiçbir gen değiştirme senaryosu yoktur.
conjugateprior

1
İlk istisnayı seviyorum ama ikinci istisnayı değil. Düğmeyi çevirmenin ışığın yanmasına neden olduğunu düşünmeyi seviyorum, ancak bir karartma sırasında düğmeyi çevirirsem hiçbir şey olmuyor. Belki de nedensel bir ilişki yoktu.
emory

1
@ naught101, bu sayfada başka bir yerde tartışılan iyi bir noktaya değindiniz. Cevabımı düzenledim. Bununla birlikte, insanlarla çalıştığımda, onlara söylesem de, kesinlikle lineer olarak güçlü bir korelasyon anlayışına sahip olduklarını sanmıyorum. Her ne kadar bunu bu terimlere sokmasalar da, çoğu insanın 'korelasyonu' 'işlevine' yaklaştığını anlayabildiğini düşünüyorum. Yine de, terimleri kullanmam konusunda daha net olmalı ve en baştan olmalıydım.
gung

2
@ emory: ışığın yanması, aslında elektrik devresinin (anahtarın sallanmasından kaynaklanan, çalışan bir şebekeyi de içeren çevresel şartlarla) kapatılmasıdır. Karartma sırasında, düğmeye basmak devreyi kapatmaz, çünkü başka bir yerde kırılmıştır. Dolayısıyla, bir anlamda, karartma, gung'un bahsettiği “karşıt” etkidir (yani ışık yanar, karartma onu kapatır). Ayrıca, geçersiz bir etki olarak düşünülebilir.
naught101

2

Burada harika cevaplar var. Artem Kaznatcheev , Fomite ve Peter Flom , nedenselliğin doğrusal korelasyondan ziyade bağımlılık anlamına geldiğine dikkat çekiyor. Carlos Cinelli , üretim fonksiyonunun nasıl kurulduğuna bağlı olarak, bağımlılığın olmadığı bir yerde bir örnek verir.

Bu bağımlılığın uygulamada nasıl çalışabileceği, iyi çalışabileceğiniz veri setleri konusunda bir noktaya eklemek istiyorum. Carlos'un örneği gibi durumlar sadece "düşünce deney koşulları" ile sınırlı değildir.

Bağımlılıklar öz düzenleme süreçlerinde ortadan kalkar . Örneğin, homeostaz, iç vücut sıcaklığınızın oda sıcaklığından bağımsız kalmasını sağlar. Dış ısı doğrudan vücut sıcaklığınızı etkiler, ancak vücut sıcaklığını sabit tutan vücudun soğutma sistemlerini (örneğin terlemeyi) de etkiler. Sıcaklığı son derece hızlı aralıklarla ve son derece kesin ölçümler kullanarak örneklersek, nedensel bağımlılıkları gözlemleme şansımız olur, ancak normal örnekleme oranlarında, vücut sıcaklığı ve dış sıcaklık bağımsız görünür.

Öz düzenleyici süreçler biyolojik sistemlerde yaygındır; evrim tarafından üretilirler. Vücut ısısını düzenleyemeyen memeliler, doğal seleksiyonla giderilir. Biyolojik verilerle çalışan araştırmacılar, nedensel bağımlılıkların veri setlerinde ortadan kalkabileceğinin farkında olmalıdır.


-3

İlişkisi olmayan bir sebep olmaz mıydı?

Kabul edilen cevabın ima ettiği gibi, 'korelasyon' kelimesinin son derece sınırlı bir yorumunu kullanıyorsanız, aptalca bir soru - eğer bir şey bir başkasına “sebep olursa”, bir şekilde etkilenen tanımdan, popülasyonda artış veya sadece yoğunluğu.

sağ?

Sonra tekrar, şöyle bir şey daha, tartışırken olabilir görünürlüğünü ben nedensellik gibi görünecektir tahmin başka bir şey tarafından etkilenen şey, ama gerçekten sen ölçtüğünüzü düşündüğünü ölçmüyorlar ...

Bu yüzden evet, sanırım kısa cevap "Evet, entropi yaratmadığınız sürece."

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.