Hangi koşullar altında korelasyon nedensellik anlamına gelir?


85

Tüm birinci sınıf istatistik öğrencilerine batırılmış olan "korelasyonun nedensellik anlamına gelmediğini" mantığını hepimiz biliyoruz. Fikri açıklamak için burada bazı güzel örnekler var .

Ama bazen korelasyon yapar nedenselliği ima. Aşağıdaki örnek bu Wikipedia sayfasından alınmıştır

Örneğin, testlerinde sürekli aynı notları aldığı bilinen tek yumurta ikizleri üzerinde bir deney yapabilir. Bir ikiz altı saat çalışmaya, diğeri ise eğlence parkına gönderilir. Test puanları aniden büyük ölçüde farklılaşırsa, bu çalışmanın (veya eğlence parkına gitmenin) test puanları üzerinde nedensel bir etkiye sahip olduğuna dair güçlü bir kanıt olacaktır. Bu durumda, çalışma ve test puanları arasındaki korelasyon neredeyse kesin olarak nedensellik anlamına gelir.

Korelasyonun nedensellik anlamına geldiği başka durumlar var mı?


16
Korelasyon ve bir bağlantının altında yatan güçlü bir neden, aksi ispatlanana kadar muhtemelen elde edebileceğinizin en iyisi olduğu sonucuna neden olabilir.
James,

8
İnsanın nedensellik kuramayacağı söylenen Karl Popper değil mi: Bilimsel teoriler doğada soyuttur. Sahte olabilirler ve bir şeyi tahrif etmedeki zorlayıcı zorluklar bizi nedensellik hakkında düşündürür ...
robin girard

3
Jaynes'den ilginç bir karşı örnek: “Bulutsuz” anlamına gelen “yağmursuz” anlamına gelen tümdengelim ilişkimiz var; Ancak kim “bulutsuz” un “yağmursuz” un fiziksel nedeni olduğuna inanır ki?
Olasılık

4
'İma' kelimesinden farklı bir terim kullanalım; çünkü sözlükteki anlamlar hem 1. Suggest hem de 2. Necessitate (!)
rolando2,

İkiz, bu örneğin bir anlam ifade ediyor mu? Demek istediğim, ima edilen nedensellik, çalışma yöntemleri / rejimleri arasındaki farkların ikizlerin sınav puanlarında farklılıklara neden olduğu anlamına geliyor. Fakat bu, bir örneklem ve hatta büyük bir örneklemle bile, tek gereken, hipotezi kırmak için zıt bir tepkiye sahip olmak için bir ikiz set, siyah kuğu stilini ... @probabilityislogic: "bulutsuz" kavramı fiziksel mi? anlam? Eğer öyleyse, neden ikinci kısmın inanılır olmadığını anlamıyorum.
naught101

Yanıtlar:


33

Korelasyon nedensellik için yeterli değildir. Vikipedi örneğinin etrafından dolaşmak, bu ikizlerin her zaman kendi cevaplarını veren bir cihaza sahip olduklarında testlerinde hile yaptıklarını hayal ederek elde edilebilir. Eğlence parkına giden ikiz cihazı kaybeder, bu yüzden düşük dereceli.

Bu gibi şeyleri düzeltmenin iyi bir yolu, Pearl tarafından Causality kitabında olduğu gibi, ölçülen miktarları üretebilecek Bayesian ağının yapısını düşünmektir . Temel amacı gizli değişkenleri aramaktır. Ölçülen örnekte değişmeyen gizli bir değişken varsa, o zaman korelasyon nedensellik anlamına gelmez. Tüm gizli değişkenleri göster ve nedenselleş.


Karşılık gelen bir Bayesian ağındaki ok yönlerinin neden nedensellik ile ilgisi olduğunu anlamakta bazı sıkıntılarım var. Örneğin, A-> B ve B-> A nedensellik için farklı yönleri temsil eder, ancak bu iki yapı için Bayes ağları eşdeğerdir
Yaroslav Bulatov

6
Müdahale karşısında eşdeğer değiller.
Neil G

Bu Bayes ağları, bunlardan birinden örneklenen veriler göz önüne alındığında, hangisinin olduğunu söyleyemezsiniz
Yaroslav Bulatov

4
Er ... Uzun bir atışta gerçek istatistiklere aşina değilim ... ama "tüm gizli değişkenleri açıklamak" tanımı imkansız değil mi? Artık "gizli" değişkenler olmadığını nereden biliyorsunuz?
Craig Walker

4
@Craig Konu bu; bu mümkün değil.
Justin L.

35

Sadece epidemiyolojik bir perspektiften bakıldığında nedensellik hakkında ek yorumlar ekleyeceğim . Bu argümanların çoğu Prince ve ark. Tarafından Pratik Psikiyatrik Epidemiyoloji'den alınmıştır . (2003).

Nedensellik veya nedensellik yorumu epidemiyolojik araştırmaların en zor yanlarıdır. Kohort ve kesitsel çalışmaların her ikisi de örneğin ortak etkilere yol açabilir. Alıntı Yapma S. Menard ( Longitudinal Research , Sage University Paper 76, 1991), Nedensel Modellemede HB Asher (Sage, 1976) başlangıçta yerine getirilmesi gereken aşağıdaki kriterleri önermiştir:

  • Söz konusu fenomenler veya değişkenler, örneğin deneysel ve kontrol grupları arasındaki farklar veya iki değişken arasındaki sıfır olmayan korelasyonlar ile gösterildiği gibi kovarj olmalıdır.
  • İlişki, başka herhangi bir değişkene veya değişken grubuna atfedilebilir olmamalıdır; yani, sahte olmamalı, ancak örneğin bir deney tasarımında başarılı bir randomizasyon ile belirtildiği gibi, diğer değişkenler kontrol edildiğinde bile devam etmelidir (deneysel ile deneysel arasındaki fark yok tedavi öncesi kontrol grupları) veya diğer değişkenler sabit tutulan iki değişken arasında sıfır olmayan kısmi bir korelasyonla.
  • Söz konusu nedenin, söz konusu etkinin ilişkili değişiklikten en geç olmamak üzere, nedenindeki değişiklikle belirtildiği gibi, söz konusu etkinin zaman içinde söz konusu etkene eşlik etmesi veya eşzamanlı olması gerekir.

İlk iki kriter, enine kesitsel veya zaman siparişli enine kesitsel bir çalışma kullanılarak kolayca kontrol edilebilirken, ikincisi, zamansal sıranın boyuna veriler olmadan alınabileceği biyolojik veya genetik özellikler hariç, yalnızca boyuna verilerle değerlendirilebilir. Elbette, özyinelemeli olmayan bir nedensellik ilişkisi durumunda durum daha karmaşık hale gelir.

Ayrıca, aşağıdaki ifadeleri de (yukarıda belirtilen referansta Bölüm 13), @James tarafından da belirtildiği gibi, nedensellik etkisine ilişkin 9 farklı kriter içeren Hill (1965) tarafından öne sürülen yaklaşımı özetleyenleri seviyorum. Orijinal makale gerçekten "Çevre ve hastalık: dernek mi nedensellik mi?" ( PDF versiyonu ).

Hill1965

Son olarak, Rothman'ın en ünlü kitabı olan Modern Epidemiyoloji'nin 2. Bölümü (1998, Lippincott Williams & Wilkins, 2. Baskı) nedensellik ve nedensel çıkarım konusunda hem istatistiksel hem de felsefi açıdan çok kapsamlı bir tartışma sunar.

Aşağıdaki referansları eklemek isterim (kabaca epidemiyoloji dersinde çevrimiçi bir dersten alınmış) da çok ilginç:

Son olarak, bu derleme nedensel modelleme üzerine daha geniş bir perspektif sunmaktadır , İstatistiklerdeki nedensel çıkarım: Bir genel bakış (J Pearl, SS 2009 (3)).


18

Sorunuzun merkezinde "bir ilişki ne zaman nedenseldir?" Sorusudur. Sadece nedensellik ima eden (ya da etmeyen) korelasyon olması gerekmez.

Bu konuyla ilgili iyi bir kitap, Johua Angrist ve Jorn-Steffen Pischke'den En Zararsız Ekonometri olarak adlandırılıyor . Çalışmakta olan “tedaviyi” bazı şekillerde rastgele bulabildiğimiz deneysel idealden başlıyorlar ve daha sonra nedensel etkilerini ortaya koymak için bu rasgele düzenlemeyi oluşturmak için alternatif yöntemlere geçiyorlar. Bu, doğal deneyler denen bir çalışma ile başlar.

Nedensel ilişkileri tanımlamak için kullanılan doğal bir denemenin ilk örneklerinden biri Angrist'in 1989'da "Ömür Boyu Kazançlar ve Vietnam Dönemi Taslak Piyango" adlı makalesidir . Bu makale, askerlik hizmetinin ömür boyu kazançlar üzerindeki etkisini tahmin etmeye çalışmaktadır. Herhangi bir nedensel etkinin tahmin edilmesindeki kilit bir problem, belirli insan tiplerinin listeye katılmasının daha muhtemel olmasıdır, ki bu da ilişkinin herhangi bir ölçümünü etkileyebilir. Angrist, Vietnam piyango piyango tarafından oluşturulan doğal deneyi, bir grup erkeğe etkili bir şekilde "tedavi" askerlik hizmeti "vermek için kullanır.

Peki, ne zaman nedenselliğimize sahibiz? Deneysel koşullar altında. Ne zaman yaklaşıyoruz? Doğal deneyler altında. Bizi “nedensellik” e yaklaştırmak için başka teknikler de var, yani bunlar istatistiksel kontrolü kullanmaktan çok daha iyi. Regresyon süreksizliklerini, farklılıklardan farkı vb. İçerirler.


15

Karşı davada, korelasyon eksikliğinin nedensellik eksikliğinin kanıtı olarak kullanıldığı zaman da bir sorun var. Bu problem doğrusal değildir; Korelasyona bakıldığında insanlar genellikle sadece buzdağının görünen kısmı olan Pearson'u kontrol eder.


14

Örneğiniz kontrollü bir deneydir . Bir korelasyonun nerede nedensellik anlamına gelebileceğini bildiğim diğer bağlam, doğal bir deneydir .

Temel olarak, doğal bir deney, bazı katılımcıların gerçek dünyada doğal olarak gerçekleşen bir tedaviye atanmasından yararlanır. Ankete cevap verenlerin tedavi ve kontrol gruplarına atanması deneyci tarafından kontrol edilmediğinden, korelasyonun hangi nedenselliğe neden olacağı, belki de bir dereceye kadar zayıf olacaktır.

Daha fazla bilgi kontrollü / doğal deneyler için wiki bağlantılarına bakın.


12

Bence APA İstatistiksel Görev Gücü bunu oldukça iyi özetledi

'' Rasgele tasarımlardan nedensellik çıkarımı riskli bir girişimdir. Rasgele tasarımları kullanan araştırmacılar, tasarımlarında yer alan değişkenlerin ardındaki mantığı açıklama ve okuyucuyu sonuçlarını açıklayabilecek makul rakip hipotezleri konusunda uyarma yükümlülüğüne sahiptir. Randomize deneylerde bile, nedensel etkilerin tedavi koşulunun herhangi bir yönüne atfedilmesi ek deneylerden destek gerektirir. '' - APA Görev Gücü


11

Sir Austin Bradford Hill'in Başkanının Kraliyet Tıp Derneği'ne ( Çevre ve Hastalık: Dernek veya Nedensellik? ) Adresi, iki korelasyonlu veya ilişkili değişken arasında nedensel bir ilişki olup olmadığına karar vermede yardımcı olan dokuz kriteri açıklar.

Onlar:

  1. Derneğin gücü
  2. Tutarlılık: "farklı kişiler, farklı yerler, durumlar ve zamanlarda defalarca gözlemlendi mi?"
  3. Özgünlük
  4. Geçicilik: "at arabası ve at hangisi?" - sebep sonuçtan önce gelmelidir
  5. Biyolojik gradyan (doz-yanıt eğrisi) - etkinin büyüklüğü (şüpheli) nedensel değişkenin büyüklüğüne ne şekilde bağlı?
  6. Olasılık - nedensellik için olası bir açıklama var mı?
  7. Uyum - nedensellik diğer yerleşik gerçeklerle çelişir mi?
  8. Deney - (şüpheli) nedensel değişkenin deneysel manipülasyonu (şüpheli) bağımlı değişkeni etkiler mi
  9. Analoji - Geçmişte benzer nedensel ilişkilerle karşılaştık mı?

9

İkizler örneğinde sadece nedenselliğe işaret eden korelasyon değil, aynı zamanda ilgili bilgi ya da önceki bilgidir.

Diyelim ki bir bilgi daha ekledim. Çalışkan ikizin 6 saat boyunca bir istatistik sınavı için çalışmakta olduğunu, ancak talihsiz bir hata nedeniyle sınavın tarihte olduğunu varsayalım. Çalışmanın üstün performansın nedeni olduğu sonucuna varır mıyız?

Nedensellik belirleme bilimsel bir soru kadar felsefi bir sorundur, dolayısıyla nedensellik tartışıldığı zaman David Hume ve Karl Popper gibi filozofları çağırma eğilimidir.

Şaşırtıcı olmayan bir şekilde tıp, Koch'un mikroplarla hastalık arasındaki nedensel ilişkinin kurulmasına ilişkin önerileri gibi sezgisel yöntemle nedensellik oluşturmaya önemli katkılarda bulunmuştur. Bunlar, bir patojenin içindeki bir genin, patojenin neden olduğu hastalığa katkıda bulunan bir ürünü kodladığını göstermek için gereken "moleküler Koch'un varsayımlarına" genişletilmiştir.

Ne yazık ki sözde bir köprü gönderemiyorum, çünkü yeni bir kullanıcıyım (doğru değil) ve yeterli "itibar puanım" yok. Asıl sebep, herhangi birinin tahmininde bulunmak.


9

Tek başına korelasyon asla nedensellik anlamına gelmez. Bu kadar basit.

Ancak, iki değişken arasında sadece bir korelasyon olması çok nadirdir. Genellikle, bu değişkenlerin ne olduğu ve değişkenler arasında nedensel bir ilişki olabileceğini öne süren bir teori veya teori hakkında da bir şeyler biliyorsunuz. Olmazsa, o zaman bir korelasyon kontrolü için rahatsız mı ediyoruz? (Bununla birlikte, insanlar büyük korelasyon matrislerini anlamlı sonuçlar için madenciliğe dönüştürürler, genellikle gündelik teorileri yoktur - aksi halde madenciliği neden rahatsız ederler. Buna karşılık olarak, gündelik teoriler için fikir edinmek için sık sık bazı keşiflerin yapılması gerekir.

Yaygın eleştiriye cevap olarak "Evet, ama bu sadece bir korelasyon: nedensellik anlamına gelmez":

  1. Sıradan bir ilişki için, korelasyon gereklidir. Bir korelasyon bulmak için tekrarlanan bir başarısızlık gerçekten de kötü bir haber olacaktır.
  2. Sadece sana bir korelasyon vermedim.
  3. Ardından, korelasyonu açıklayan olası nedensel mekanizmaları açıklamaya devam edin ...

2
1. noktanıza bir karşı örnek: kaotik bir sistemde, belirgin bir korelasyon olmadan nedensellik yaşayabilirsiniz.
mkt

8

Bazı nedensellik tanımları için yeterli bir koşul:

İlişkili değişkenlerden biri kontrol edilebildiğinde (doğrudan değerini ayarlayabiliriz) ve korelasyon hala mevcut olduğunda nedensellik iddia edilebilir.


2
Belki de Pearl'ün sözünü "doğrudan bir değişkenin değerini" ayarlamak "için kullanın: bir müdahale.
Neil G

8
  1. Neredeyse her zaman randomize çalışmalarda
  2. Neredeyse her zaman gözlemcilerin çalışmalarında birileri tüm taraftarları ölçerken (neredeyse hiç)
  3. Bazen birileri bazı bilgileri öğrendiğinde (IC'in Pearl's Book Causality'deki DAG keşfi algoritması)
  4. İki veya daha fazla değişkenli, Gauss olmayan lineer modellerde, ancak ilişki ölçüsü olarak korelasyon kullanılmıyor ( LiNGAM )

Keşif algoritmalarının çoğu Tetrad IV'te uygulanmaktadır


6

İlgili bir soru olabilir - hangi koşullar altında nedensel ilişkileri güvenilir bir şekilde verilerden çıkarabilirsiniz?

2008 NIPS çalıştayı bu soruyu ampirik olarak ele almaya çalışmaktadır. Görevlerden biri, bir değişkenin diğerine neden olduğu bilinen değişken çiftlerinin gözlemlerinden nedensellik yönünü çıkarmaktı ve en iyi yöntem, nedensel yönünü zamanın% 80'ini doğru şekilde çıkarabilmekti.


3

Neredeyse kesinlikle iyi tasarlanmış bir deneyde. (Tabii ki, böyle bir bağlantı ortaya çıkarmak için tasarlanmıştır .)


3

Diyelim ki A faktörü B fenomeninin nedenidir. Sonra B'nin değişip değişmediğini görmek için onu değiştirmeye çalışırız. Eğer B değişmezse ve her şeyin değişmediğini varsayabilirsek, A'nın B'nin sebebi olmadığına dair güçlü kanıtlar varsa B'nin değişmesi durumunda, A'nın değişiminin neden olabileceği için A'nın sebebi olduğu sonucuna varamayız. gerçek nedensel C de meydana gelen bir değişiklik, bu da B'yi değiştirdi.


A değişebilir mi?
RockScience

2

Ampirik paradigmayı tartışırken burada “kanıtın” kullanıldığını fark ettim. Öyle bir şey yok. İlk önce fikrin ileri sürdüğü hipotezi; daha sonra "kontrollü koşullar" altında [not a] ve "yeterli" olduğunda test yapılır yetersizlik eksikliği ile karşılaşılırsa, hipotez aşamasına ilerler... dönemi. Biri 1) söz konusu olayın her olayında bulunmayı başaramazsa [not b] ve elbette 2) nedensellik belirleyemezse, kanıt yoktur. 1) sonsuz bir evrende imkansız [doğa ile sonsuzluğun kanıtlanamayacağına dikkat edin]. Çay yok; tamamen kontrol edilen koşullar altında hiçbir deney yapılmaz ve şartlar ne kadar kontrol edilirse, görünüşte sınırsız nedensellik çizgileriyle dış dünyaya olan benzerliği o kadar az olur. Not b; akılda tutulması gereken 'olayı' mükemmel bir şekilde tarif etmiş olmanız gerekir, bu da muhtemelen doğru bir dil anlamına gelir = muhtemelen bir insan dili değil. Son bir not için, tüm nedensellik muhtemelen İlk Olay'a geri döner. Şimdi git bir teoriyle herkesle konuş. Evet, resmi ve gayrı resmi olarak çalıştım. Sonunda; hayır, yakınlık nedensellik veya geçici korelasyondan başka bir şey anlamına gelmez.


1

XY

Y=bX+u

Daha sonra tarafsız bir tahmin olup nedensel etkisi X ile Y (yani E ( b ) = B ) arasında hiç bir bağıntı yoktur, ancak ve ancak , X ve ubXYE(b)=BXuE(u|X)=0u YXY

Tarafsız olmak bir tahmin edicinin arzulanan bir özelliğidir, ancak tahmin edicinizin verimli (düşük değişkenlikli) ve tutarlı olmasını (olasılıkla gerçek değere eğilim gösterir) olmasını istersiniz. Gauss-Markov varsayımlarına bakınız.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.