Korelasyon nedensellik olmadan ne zaman faydalı olabilir?


27

Birçok istatistikçinin söylediği bir evcil hayvan "Korelasyon nedensellik anlamına gelmez" dir. Bu kesinlikle doğrudur, ancak DOES'in burada ima ettiği bir şey korelasyonun çok az değeri olduğu veya hiç olmadığıdır. Bu doğru mu? İki değişkenin birbiriyle ilişkili olduğunu bilmek işe yaramaz mı?

Bunun böyle olduğunu hayal edemiyorum. Prediktif analizlere çok aşina değilim, ancak Xbir tahmin ederse nedensellikten bağımsız olarak , Ygelecekteki değerlerin tahmininde faydalı olacağı görülüyor . YX

Korelasyonda değeri görmekte yanlış mıyım? Ve eğer değilse, bir istatistikçi veya veri bilimcisi hangi durumlarda nedensellik olmadan korelasyon kullanabilir?


5
Benim düşünceme göre, "nedensellik korelasyon anlamına gelmez" ifadesi genellikle istatistiklerin her zaman güvenilmemesi gerektiğini (yanlış, ancak her zaman nedensellik eksikliğinden dolayı) yanlış kullanmak anlamına gelir. Tahmini analizin neden yanlış olduğuna atıfta bulunarak insanların bu ifadeyi bıraktığını gördüğümde çok üzülüyorum. Örneğin, facebook.com/notes/mike-develin/debunking-princeton/… hem korkunç bir analizin, hem de korkunç bir analizin berbat bir şekilde bozulmasının harika bir örneğidir.
Cliff AB,

10
Örneğin, belli bir şehirde yaşamanın erken ölüm ile ilişkili olduğunu varsayalım. Bu şehirde yaşamanın erken ölüme neden olduğu ya da insanların bu şehirden uzaklaşmasının daha uzun yaşamalarına yardımcı olacağı sonucuna varamazsınız. (Belki de şehir, hastalıklı insanlara çekici geliyor, nedense). Ama eğer bir aktüatörseniz, o kentin üyelerine daha yüksek hayat sigortası primi almak istemenizde haklısınız - bu ilişkiyi bilmek çok değerli olabilir. sen.
Nate Eldredge

2
İngiltere'nin güneyinde daha fazla insan ölüyor @NateEldredge. Çünkü insanlar orada emekli oluyor.
TRiG

1
Yokluğu korelasyon tartışmasız, fazla anlam taşır.
Raphael,

Zorunlu xkcd referansı: xkcd.com/552
vsz

Yanıtlar:


32

Korelasyon (veya başka bir ilişki birliği ölçüsü) nedensellikten bağımsız olarak tahmin için yararlıdır. İki değişken arasında açık ve sabit bir ilişki ölçtüğünüzü varsayalım. Bunun anlamı, bir değişkenin seviyesini bilmenin, bir değişkeni diğerinin bir işlevi olarak tahmin etmesine yardımcı olmak için kullanabileceğiniz ve en önemlisi, bu tahmine dayanarak biraz harekete geçmek için kullanabileceğiniz başka bir ilgilenilen değişken hakkında bilgi sağlar. . Harekete geçmek, otomatik bir öneride bulunmak veya bir tıbbi müdahaleyi uygulamak gibi bir veya daha fazla değişkeni değiştirmeyi içerir. Elbette, iki değişken arasındaki doğrudan veya dolaylı ilişkilere daha fazla kavrayışınız varsa, daha iyi tahminler yapabilir ve daha etkili davranabilirsiniz. Bu içgörü uzaysal ve zamansal olanlar dahil olmak üzere diğer değişkenleri içerebilir.


4
Korelasyonlar tahmin için her zaman yararlı değildir. Ters nedensellik durumlarında, her zaman kontrol edilemeyen önemli geçici yönler vardır. Alzheimer Hastalığı ile her zaman bununla karşı karşıyayız. Ayırt etmek için sürekli olarak başımızı duvara çarpıyoruz: AD'de bulduğumuz biyobelirteçler hastalığa neden olan mı yoksa hastalıktan mı kaynaklanıyor ?
AdamO

1
@AdamO Sanırım cevabım son iki ya da iki cümle içindeki temeli kapsıyor, bu yüzden size katılmıyorum.
Brash Dengesi

1
Nedensellik ile ilgili problem aslında sadece tahminde bulunan modelinizi yorumlamaya çalışıyorsanız ortaya çıkar. (Elbette bu, bilime sıkça ilgi duyduğumuz şeydir). Biyobelirteç Açok iyi bir tahminci olduğunu gördüğümüzde, bunun hastalığın nedeni de olduğunu iddia etmek çok cazip geliyor - Ve yorumlarda da belirtildiği gibi yanlış sonuçlara varmak çok kolay. Eğer sadece öngörülerde bulunmak istiyorsak, örneğin bir hastanın hastalığı olup olmadığını söyleyin, korelasyonlarla ilgili bir sorun yoktur.
cel,

1
Bu doğru değildir ve işte bunun nedeni sadece bir örnektir. Tahminlerinize göre hareket etmek bir değişkeni değiştirmeyi ve hedefin de değişmesini beklemeyi gerektiriyorsa, ancak aslında doğrudan bir bağlantı yoktur veya nedensel ilişki diğer tarafa giderse, yanlış eylemde bulunursunuz. Ve demeden önce, "ama bu örnekte modeli yorumluyorsun," diyorum ", hangi senaryoda tahmin için bir modelden bile çıkarım yapmazsınız?” Cevap: Modelinizin ima ettiği nedensel ilişkilere çok fazla güvenmediğinizde.
Brash Dengesi

1
@BrashEquilibrium: Tahmini elde etmek için kullanılan değişkenleri herhangi bir şekilde değiştirmeyi gerektirmeyen bir tahmine göre hareket etmenin birçok yolu vardır. Mağazanızın yünlü eldivenlerde stokta olup olmadığını bilmek ister misiniz? Son zamanlarda ne kadar dondurma sattığınızı bilmek (daha doğrudan veri kaynaklarının varsayımsal olmaması durumunda) elbette iyi bir tahminde bulunabilir.
Ilmari Karonen

17

Burada zaten birçok iyi nokta var. " XBir tahmin ederse , nedensellikten bağımsız olarak , Ygelecekteki değerleri tahmin etmede faydalı olacağı " iddiasını biraz açalım . Haklısın: İstediğiniz tek şey bilinen bir değerden ve bilinen, sabit bir ilişkiden bilinmeyen bir değeri tahmin edebilmekse , o ilişkinin nedensel durumu önemsizdir. Bunu bir düşün: YXYX

  • Sebepten bir sonuç tahmin edebilirsiniz. Bu sezgisel ve tartışmasızdır.
  • Bir etkinin bilgisinden bir neden de tahmin edebilirsiniz. Bazıları, ancak çok az sayıda, akciğer kanseri olan insanlar hiç sigara içmedi. Sonuç olarak, birinin akciğer kanseri olduğunu biliyorsanız, sigara içmenin nedensel olduğu ve kanserin etkisi olduğu gerçeğine rağmen, sigara içenlerin / içici olduklarını iyi bir şekilde tahmin edebilirsiniz. Bahçedeki çimler ıslaksa ve fıskiyeler akmıyorsa, yağmur sebebi ve ıslak çimlerin sadece etkisi olmasına rağmen yağmur yağdığını tahmin edebilirsiniz. Vb.
  • Aynı nedenin bilinen bir etkisinden bilinmeyen bir etki de tahmin edebilirsiniz. Örneğin, eğer Billy ve Bobby aynı ikizlerse ve Billy ile hiç tanışmadım, ama Bobby'nin 5 '10' (178 cm) olduğunu biliyorum, Billy'nin aynı zamanda 178 cm olduğunu da söyleyebilirim. Ne Billy'nin yüksekliği Bobby'nin yüksekliğine neden olur ne de Bobby'nin yüksekliği Billy'nin yüksekliğine neden olmaz.

7
Sadece kategorilerinize isimler vermek için: Üç tür tahmininiz (sıra ile) kesinti , kaçırma ve indüksiyon olarak adlandırılır .
Neil G,

12

Korelasyonun önemine kaka yapmıyorlar. Sadece eğilim, korelasyonu nedensellik olarak yorumlamaktır.

Emzirmeyi mükemmel bir örnek olarak alın. Anneler, emzirme ile ilgili (gözlemsel çalışmaların) bulgularını hemen hemen her zaman emzirmeleri gerekip gerekmediğini bir öneri olarak yorumlamaktadır. Ortalama olarak, anne sütüyle beslenen bebeklerin, uzunlamasına anne ve baba yaşı, sosyoekonomik statü, vb. Kontrol ettikten sonra bile düzenli yaşta daha sağlıklı yetişkinler olma eğiliminde oldukları doğrudur. iştah düzenlemenin erken gelişiminde kısmen rol oynamaktadır. İlişki çok karmaşıktır ve kişi, gözlenen farklılıkların altında kalabilecek bir dizi aracı araca kolaylıkla spekülasyon yapabilir.

Birçok çalışma, neler olup bittiğini daha derinden anlamayı garanti etmek için derneklere bakıyor. Korelasyon işe yaramaz değil, nedensellikten sadece birkaç adım ötede ve uzman olmayanların yanlış yorumlanmasını önlemek için bulguların nasıl bildirileceğine dikkat etmek gerekiyor.


9

Haklısın ki bu korelasyon faydalıdır. Nedensel modellerin birliktelik modellerden daha iyi olmasının nedeni - Pearl'ün dediği gibi - müdahaleler için cesaretli olmalarıdır. Başka bir deyişle, varsayımsal olarak düşünmenize izin verir. Nedensel bir model, "X'i gerçekleştirirsem, Y'ye ne olur?"

Fakat her zaman varsayımsal olarak düşünmenize gerek yoktur. Modelinizin ise yalnızca gibi cevap sorulara kullanılacaktır "Ben X'i gözlemlemek, ben Y hakkında ne biliyoruz?", Daha sonra bir örgütsel model tüm ihtiyacınız.


3
Oracles For Interventions, bir grup için iyi bir isim olurdu.
Malvolio

@Malvolio: lol, nedensel modelleri tarif etmenin unutulmaz derecede özlü bir yoludur. Bu cümleyi çok beğendim.
Neil G,

4

Korelasyonun tahmin için faydalı olduğu konusunda haklısın. Çalışmadaki sistemi daha iyi anlamak için de faydalıdır.

Nedensel mekanizma hakkında bilginin gerekli olduğu bir durum, hedef dağılımın manipüle edilmiş olup olmadığıdır (örneğin, bazı değişkenler belirli değerleri almaya zorlanmıştır). Korelasyona dayanan bir model sadece kötü performans gösterirken, nedensel bilgiyi kullanan bir model daha iyi performans göstermelidir.


2

Korelasyon nedensellik açıklayan temel bir model varsa, yararlı bir araçtır.

Örneğin, bir nesneye kuvvet uygulamanın hareketini etkilediğini biliyorsanız, kuvvet ve hız ile kuvvet ve ivme arasındaki ilişkiyi ölçebilirsiniz. Daha güçlü olan korelasyon (ivme ile) kendiliğinden açıklayıcı olacaktır.

Gözlemsel çalışmalarda korelasyon, nedenselliği doğrulayabilen veya reddeden uygun deneysel tasarım yoluyla daha fazla bilimsel araştırma için zemin oluşturabilecek (örneğin emzirme ve daha sonraki sağlık) belirli ortak kalıpları ortaya çıkarabilir (örneğin, belki de emzirmek yerine olabilir. belirli bir kültürel çerçevenin sonucu).

Dolayısıyla korelasyon faydalı olabilir, ancak nadiren kesin olabilir.


2

Belirttiginiz gibi, yalnizca korelasyon esas olarak öngörme olmak üzere çok yararlidir.

birBbirB

Örneğin, yaşlı vatandaşlarda kahvenin yoğun kullanımının sağlıklı kardiyo-vasküler sistemlerle korele olduğunu gösteren tüm bu çalışmalar bence ağır kahve alışkanlıklarını haklı çıkarmak isteyen insanlar tarafından mucize edilemez. Bununla birlikte, kahve içmek sadece nedensel olmaktan ziyade sağlıklı kalplerle ilişkilidir, gerçek ilgi sorunumuza cevap verecek hiçbir şey yapmaz: Daha fazla kahve içersek veya kesersek daha sağlıklı mı oluruz? Çok ilginç sonuçlar bulmak çok sinir bozucu olabilir (Kahve sağlıklı kalplerle bağlantılıdır!) Ancak bu bilgiyi karar vermek için kullanamazsınız (hala daha sağlıklı olmak için kahve içip içmeyeceğinizi bilmiyorum) ve bu yüzden neredeyse her zaman var korelasyonu nedensellik olarak yorumlamaya yönelik bir cazibe.

Tek umursadığın kumar olmadığı sürece (yani tahmin etmek istiyor ama etkilemek istemiyorsun).


2

Korelasyonda değer var, ancak nedensellik sonucuna varmak için daha fazla delile bakmak gerekiyor.

Yıllar önce, "kahve kansere neden olur" diye bir çalışma yapıldı. Bunu haberlerde duyduğumda, karıma "yanlış korelasyon" dedim. Anlaşıldı ki ben haklıydım. Günde 2-3 fincan kahve popülasyonu, kahve içmeyenlere göre daha yüksek bir sigara içme oranına sahipti. Veri toplayıcıları bunu çözdükten sonra sonuçlarını geri çektiler.

Konut patlaması ve baskınından önceki bir başka ilginç çalışma ipotek işlemeye gelince ırkçılık gösterdi. İddia, siyah başvuranların beyazlardan daha yüksek oranda reddedildiği idi. Ancak başka bir çalışma varsayılan oranlara baktı. Siyah ev sahipleri, beyazlar olarak sames oranında temerrüd ediyorlardı. Siyah uygulama daha yüksek bir standartta tutulsaydı, varsayılan oranları gerçekten çok daha düşük olurdu. Not: Bu fıkra yazar Thomas Sowell tarafından The Housing Boom and Bust adlı kitabında paylaşılmıştır.

Veri madenciliği, kolayca yüksek korelasyon gösteren iki veri kümesi üretebilir, ancak muhtemelen ilişkilendirilemeyen olaylar için. Sonunda, yolunuza gönderilen çalışmalara çok kritik bir gözle bakmak en iyisidir. Yanlış korelasyon bulmak her zaman kolay değildir, edinilmiş bir yetenek.


Bu cevabı okumaktan zevk aldım. Bununla birlikte, şu sorunun tersine değiniyor gibi görünüyor: "İki değişkenin ilişkili olduğu bilgisine sahip olmanın yararı yok mu? ... Hangi durumlarda bir istatistikçi veya veri bilimcisi nedensellik olmadan korelasyonu kullanabilir?"
whuber

1
"Siyah ev sahipleri, beyazlar olarak sames oranında temerrüde düşüyorlardı. Eğer siyah uygulama daha yüksek bir standartta tutulsaydı, varsayılan oranlar aslında çok daha düşük olurdu." sonuçlara atlıyor. Bu tam olarak bu sorun; siyah başvuranlar istatistiksel olarak beyaz başvuranlardan farklı olacaklardır ve daha fazla siyah, varsayılan olarak ipotek kabul etme olasılığı daha yüksek olan bir gruptaysa, aynı varsayılan orana sahip siyah başvuranlar ayrımcılığa işaret eder. Şaşırtma etkilerini ayırmak zordur.
prosfilaes

Dediğim gibi, fıkra iyi bilinen bir bilginden geldi. Ve başvurduğum kitapta tartışılacak bir paragraftan çok daha fazlasını aldı.
JTP - Monica'dan özür dilerim

1

Korelasyon gözlemlenebilir bir olgudur. Bunu ölçebilirsin. Bu ölçümler üzerinde hareket edebilirsiniz. Kendi başına, yararlı olabilir.

Ancak, sahip olduğunuz tek şey bir korelasyon ise, yaptığınız bir değişikliğin gerçekten bir etkisi olacağına dair hiçbir garantiniz yoktur (iPhone'un deniz aşırı köleliğe yükselmesini bağlayan ünlü grafikleri görün). Sadece orada bir korelasyon olduğunu gösterir ve çevreyi ince ayarlarsanız (oyunculuk yaparak), o korelasyon hala orada olabilir.

Ancak, bu çok ince bir yaklaşımdır. Birçok senaryoda daha az ince bir araca sahip olmak istiyoruz: nedensellik. Nedensellik, ortamınızı bir şekilde veya başka bir şekilde hareket ederek ayarlayan bir kişinin , korelasyonun hala orada olmasını beklemesi gerektiği iddiasıyla birleştirilen bir korelasyondur . Bu, yararlı bir sonucu tanımlamak için art arda 20 veya 50 nedensel olayın zincirlenmesi gibi daha uzun vadeli planlamaya izin verir. Bunu 20 veya 50 korelasyonla yapmak, genellikle çok bulanık ve bulanık bir sonuç bırakır.

Geçmişte nasıl faydalı olduklarına bir örnek olarak, batı bilimine karşı Geleneksel Çin Tıbbı (TCM) düşünün. Batı bilimi temel olarak "Bir teori geliştirin, teoriyi gösterebilen, testi uygulayan ve sonuçları belgeleyen bir testi izole edin" üzerine odaklanır. Bu, nedenselliğe çok bağlı "teori geliştirmek" ile başlar. TCM, "yararlı sonuçlar sağlayabilecek bir test tasarla, testi çalıştır, cevaptaki korelasyonları belirle" ile başlayarak döndü. Odak korelasyonlar üzerinde daha fazla.

Batılılar günümüzde neredeyse tamamen nedensellik terimleriyle düşünmeyi tercih ediyor, bu yüzden korelasyon çalışmanın değeri casusluk yapmakta zorlanıyor. Ancak, hayatımızın her köşesinde gizleniyor. Ve batı bilimlerinde bile korelasyonların hangi teorileri keşfetmeye değer olduğunu belirlemede önemli bir araç olduğunu asla unutmayın!

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.