Korelasyon ve nedensellik arasındaki ilişkiler


19

Wikipedia başlıklı korelasyon nedensellik anlamına gelmez ,

A ve B ile ilişkili iki olay için olası farklı ilişkiler şunları içerir:

  1. A, B'ye neden olur (doğrudan nedensellik);
  2. B, A'ya neden olur (ters nedensellik);
  3. A ve B, ortak bir nedenin sonuçlarıdır, ancak birbirlerine neden olmazlar;
  4. A ve B'nin her ikisi de (açık ya da dolaylı) üzerinde koşullandırılmış C'ye neden olur .;
  5. A nedenleri B ve B nedenleri A (çift yönlü veya siklik nedensellik);
  6. A, B'ye neden olan C'ye neden olur (dolaylı nedensellik);
  7. A ve B arasında bağlantı yoktur; korelasyon bir tesadüf.

Dördüncü nokta ne anlama geliyor. A ve B'nin her ikisi de (açık ya da dolaylı) koşullandırılmış C'ye neden olur. A ve B C'ye neden oluyorsa, A ve B'nin neden ilişkili olması gerekir.


8
Zorunlu ilgili xkcd: xkcd.com/552
Todd Wilcox

2
Söylemesine rağmen, korelasyon ve nedensellik arasında yüksek bir korelasyon olmasını beklerdim ...
Mehrdad


Muhtemelen de tartışma ayrıca bkz hiçbir korelasyon yok nedenselliği ima Does?
ctwardy

Yanıtlar:


18

"Koşullama" olasılık teorisinden bir kelimedir: https://en.wikipedia.org/wiki/Conditional_probability

C koşullaması yalnızca C'nin doğru olduğu durumlara baktığımız anlamına gelir. "Örtük olarak", bu kısıtlamayı açıkça yapmıyor olabileceğimiz, hatta bazen bunu bile bilmediğimiz anlamına gelir.

Buradaki nokta, A ve B'nin her ikisi de C'ye neden olduğunda, C'nin doğru olduğu durumlarda A ve B arasında bir korelasyon gözlemlemek, A ve B arasında gerçek bir ilişki olduğu anlamına gelmez. yapay bir korelasyon yaratır.

Bir örnek verelim.

Bir ülkede tam olarak bağımsız tam olarak iki tür hastalık vardır. A: "kişinin ilk hastalığı var", B: "kişinin ikinci hastalığı var". , varsayın .P ( B ) = 0,1P(A)=0.1P(B)=0.1

Şimdi bu hastalıklardan birine sahip olan herhangi biri doktora ve sadece o zaman görmeye gider. C'yi arayın: "kişi doktora gider". Biz .C=A or B

Şimdi birkaç olasılığı hesaplayalım:

  • P(C)=0.19
  • P(A|C)=P(B|C)=0.10.190.53
  • P(A and B|C)=0.010.190.053
  • P(A|C)P(B|C)0.28

Açıkçası, C, ve üzerinde koşullandırıldığında bağımsız olmaktan çok uzaktır. Aslında, C üzerinde koşullandırılmış, neden olur gibi görünüyor .B n o t A BABnotAB

Analizleri için veri kaynağı olarak doktor (lar) ı tarafından kaydedilen kişilerin listesini kullanırsanız, ve hastalıkları arasında güçlü bir korelasyon olduğu görülmektedir . Veri kaynağınızın aslında bir koşullama olduğunu bilmiyor olabilirsiniz. Buna "seçim yanlılığı" da denir.BAB


13

Dördüncü nokta, açıklayıcı fenomen olarak da bilinen bir çarpıştırıcı üzerinde koşullandırma olarak da bilinen Berkson paradoksunun bir örneğidir .

Örnek olarak, genç erkekler tarafından sıkça sorulan genç bir kadını düşünün ve her tarih teklifini kabul edip etmeyeceğine karar vermelidir. Genç erkekler ne kadar çekici ve çekici oldukları konusunda farklılık gösterirler ve bu iki özelliğin tarih öneren erkeklerin popülasyonunda bağımsız olduğunu varsayalım. Doğal olarak, genç kadın, bir erkeğin önerisini kabul etmeye daha eğilimlidir. Bu durum için bir nedensel modeli gibi görünebilir Yani: olduğunu ve hem neden kadın reddeder veya tarih teklifi kabul ederse sırasıyla 0 ya da 1 değerleri üzerinde aldığı,.

AttractiveAcceptCharming
AttractiveCharmingAccept

Yukarıda, ve olanın, tarih öneren erkeklerin nüfusunda bağımsız olduğunu varsaydık . Ama sadece kadınları kabul eden erkekleri düşünürsek, hâlâ bağımsızlar mı? Başka bir deyişle, koşulunu yerine . Şimdi varsayalım ki, kadının çıkmayı kabul ettiği bir adamdan bahsediyorum ve size (kadının görüşüne göre) hiç çekici olmadığını söylüyorum. Zaten kadının onunla çıkmayı kabul ettiğini biliyoruz, bu yüzden gerçekten oldukça çekici olması gerektiğini makul bir şekilde çıkartacağız. Tersine, tarih teklifi kabul edilen ve çekici olmayan bir adam hakkında bilgi alırsak, oldukça çekici olması gerektiğini makul bir şekilde çıkarırız.AttractiveCharmingAccept=1

Burada ne olduğunu görüyor musun? koşuluna göre, bu iki özellik marjinal olarak bağımsız olmasına rağmen ve arasında negatif bir korelasyon oluşturduk . Kadın açısından, çıktığı çekici erkekler daha az çekici olma eğilimindedir ve çıktığı çekici erkekler daha az çekici olma eğilimindedir. Sadece o tarihli etti erkeklerin düşünerek, o üzerinde dolaylı koşullanmadır, çünkü bu . Bunun yerine, tarih öneren tüm erkekleri düşünürse, teklifi kabul edip etmediğine bakılmaksızın, iki özellik arasında istatistiksel bir ilişki olmadığını görür.Accept=1AttractiveCharmingAccept


5

Simpson paradoksu ve Berkson paradoksunun her biri "A ve B'nin her ikisi de C'ye neden olur, bu da (açık veya üstü kapalı) koşullandırılır"

Örnek olarak, koleksiyonumda nadir ( ) ve güzel ( ) damga olduğunu varsayalım . Nadirlik ve güzellik arasında içsel bir ilişki yoksa, pullarımın hem güzel hem de nadir olduğu ortaya çıkabilir .100010010%20020%20

Ben artık gösterirseniz ilginç pulları, yani o ki oldukça nadir veya veya her ikisi, nadir ve güzelliğini (arasında çıktığı sanılan negatif korelasyon olacak görüntülenen nadir pulları oldukça ederken vardır görüntülenen ortak pulları güzelsin ) tamamen ilginç olma koşullarından dolayı. 20 % 100 %28020%100%


Bu, Berkson'un paradoksuna bir örnektir, Simpson'ın paradoksuna değil (cevabıma bakın).
Jake Westfall

@JakeWestfall Muhtemelen haklısın - Pulları daha önce bir yere yazdığımı biliyordum ama nerede unuttum ve Berkson'un paradoksu için Wikipedia sayfası olduğu ortaya çıktı
Henry

4

Paragraf "A ve B, ... ile ilişkili iki olay için" ile başlar, bu yüzden tahminim korelasyonun başlangıçta varsayıldığıdır. Başka bir deyişle, eşzamanlı olarak C'ye neden olmak için korelasyona ihtiyaç duymazlar, ancak eğer korelasyonluysa ve her ikisi de C'ye neden olduysa, aralarında nedensel bir ilişki olduğu anlamına gelmez.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.