Eğer “korelasyon nedensellik anlamına gelmiyorsa”, o zaman istatistiksel olarak anlamlı bir korelasyon bulursam, nedenselliği nasıl kanıtlayabilirim?


30

Korelasyonun nedensellik olmadığını biliyorum . İki değişken arasında yüksek korelasyon elde ettiğimizi varsayalım. Bu korelasyonun gerçekten nedensellik yüzünden olup olmadığını nasıl kontrol edersiniz? Veya, hangi koşullar altında, iki ya da daha fazla değişken arasındaki nedensel ilişkiyi ortaya çıkarmak için deneysel verileri tam olarak kullanabilir miyiz?


2
Deneysel veri gerektirecektir. Lütfen başvurduğunuz deney tasarımını tanımlayınız.
Frank Harrell,

1
Efendim, deneysel verilerim yok. Sebep tespiti için ne tür kontrollü deneylerin yapılması gerektiğini anlamak istedim?
Manish Barnwal

4
Pek çok olası tasarım var. Kısacası, diğer tüm değişkenleri fiziksel olarak kontrol etmeye çalışırsınız ve ilgilendiğiniz bir faktörü değiştirirsiniz ya da diğer olası açıklamaların etkilerini "ortalayan" deneysel manipülasyonun uygulamasını rastgele seçersiniz.
Frank Harrell

2
Kısacası, bir çeşit dışsal varyasyona ihtiyacınız var.
abaumann

1
Arasında ilişki Xve Ysorumluluk duygusunu en aza indirecek ve kader duygusunu en üst düzeye çıkarmak olacak birini diğerinin nedeni olarak seçin.
ttnphns

Yanıtlar:


16

2 değişkenin ilişkilendirilmesinin çok muhtemel bir nedeni, değişikliklerinin üçüncü bir değişkene bağlı olmasıdır. Diğer olası nedenler tesadüflerdir (korelasyon için yeterince ilişkili olmayan değişkenleri test ederseniz, bazıları korelasyon gösterecektir) veya çoklu adımlar içeren çok karmaşık mekanizmalardır.

Bkz http://tylervigen.com/ gibi örnekler için :

görüntü tanımını buraya girin

A -> B nedenini güvenle belirtmek için, A değişkenini kontrol edebileceğiniz ve diğer değişkenleri etkileyemeyeceğiniz bir deney yapmanız gerekir. Sonra değişkeninizi değiştirirseniz, A ve B arasındaki korelasyonun hala var olup olmadığını ölçersiniz.

Neredeyse tüm pratik uygulamalar için, diğer (genellikle bilinmeyen) değişkenleri de etkilememek neredeyse mümkün değildir, bu nedenle yapabileceğimizin en iyisi nedensellik yokluğunu kanıtlamaktır.

Nedensel bir ilişkiyi ifade edebilmek için, 2 değişkenin nedensel bir ilişkiye sahip olduğu hipoteziyle başlarsınız, hipotezi bozmak için bir deney kullanırsınız ve başarısız olursanız, hipotezin doğru olduğunu kesin olarak belirtebilirsiniz. Kesinlik derecenizin ne kadar yüksek olması gerektiği, araştırma alanınıza bağlıdır.

Birçok alanda denemenizin 2 bölümünü paralel olarak çalıştırmak gerekir, bunlardan biri A değişkeninin değiştiği bir yer ve değişken değişkenlerin değişmediği bir kontrol grubunu çalıştırmaktır, ancak deney aksi halde tamamen aynıdır - örneğin ilaçları hala bir iğneyle tutturuyorsunuz ya da hapları yutarsanız. Deney, A ile B arasında bir korelasyon gösteriyorsa, ancak A ile B 'arasında (kontrol grubunun B'si) korelasyon göstermiyorsa, nedensellik olduğunu varsayabilirsiniz.

Bir deney mümkün değilse veya çeşitli nedenlerle (ahlaki, ahlak, etik, halkla ilişkiler, maliyet, zaman) mümkün değilse, nedensellik sonucuna varmanın başka yolları da vardır. Yaygın bir yol, kesinti kullanmaktır. Bir yorumdan bir örnek alarak: sigara içmenin insanlarda kansere neden olduğunu kanıtlamak için, sigara içiminin farelerde kansere neden olduğunu kanıtlamak için bir deney kullanabiliriz, daha sonra sigara içiminin farelerde kansere neden olduğunu kanıtlamak için bir deney kullanabiliriz ve bu nedenle insanlarda sigara içiciliği ile kanser arasında bir korelasyon olduğunu kanıtlayabiliriz. sigara içmenin insanlarda kansere neden olması muhtemeldir - bu kanıt, kanserin sigara içmeye yol açtığını da kanıtlarsak güçlendirilebilir. Nedensellik sonucuna varmanın başka bir yolu, diğer nedenlerin ilişkinin dışlanmasıdır, nedensellik ile ilişkinin kalan en iyi açıklaması olarak bırakılmıştır - bu yöntem her zaman uygulanamaz, çünkü korelasyonun olası tüm nedenlerini ortadan kaldırmak imkansızdır (başka bir cevapta "arka kapı yolları" olarak adlandırılır). Sigara içme / kanser örneğinde, muhtemelen bu yaklaşımı sigara içmenin akciğerlerdeki katrandan sorumlu olduğunu kanıtlamak için kullanabiliriz, çünkü bunun için çok fazla kaynak yoktur.

Nedensellik kanıtlamanın bu diğer yolları bilimsel açıdan her zaman ideal değildir, çünkü daha basit bir deney kadar kesin değildirler. Küresel ısınma tartışması, tekrarlanabilir bir deneyle henüz kesin olarak kanıtlanmamış olan nedensellikten kurtulmanın ne kadar kolay olduğunu göstermek için harika bir örnektir.

Komik rahatlama için, teknik olarak makul ancak bilimsel olmayan sebeplerden dolayı tavsiye edilmeyen bir deney örneği (ahlak, etik, PR, maliyet):

Phroyd.tumblr.com alınan görüntü


3
Bu çok güçlü bir durum. Epidemiyolojide, gereksinimler daha az katıdır, çünkü bir deneyi kontrol etmek en iyi pratik değildir ve en kötüsü etik
dışıdır

2
Pearl'ün sigara içmenin insanlarda kansere neden olduğunu göstermesi örneği, katranın sigara içimi ve kanser arasında bir ara değişken olarak görüldüğü ön kapı yöntemidir. "İdeal değil" derken ne demek istediğini anlamadım. İnsanları sigara içmeye zorlamaktan ve kanser olup olmadıklarını görmekten kesinlikle daha ideal!
Neil G,

1
@Neil "İnsanları sigara içmeye zorlamak ve kanser olup olmadıklarını görmek kesinlikle daha ideal" - Amaç nedensel bir ilişki olduğunu kanıtlamaksa, kesinlikle katılmıyorum. Öte yandan, eğer amaç etik bir problemden, azalan fondan veya linç çetesinden kaçınmaksa, o zaman daha idealdir, evet.
Peter

10

Tasarımın deneysel mi yoksa gözlemsel mi olduğuna bakılmaksızın, A değişkeni ile bir Y sonucu arasındaki ilişki, A ve Y arasında açık arka kapı yolu yoksa A ve Y arasındaki nedensel ilişkiyi yansıtır.

Deneysel bir tasarımda bu, maruz kalma veya tedavi atamasının randomizasyonuyla en kolay şekilde gerçekleştirilir. İdeal randomizasyonu engelleyen birliktelik tedavi etkisi, değişebilirlik varsayımları altında nedensel tedavi etkisinin tarafsız bir tahminidir (tedavi ataması karşı-olgusal sonuçlardan bağımsızdır), pozitiflik, vb.

Referanslar

Hernan, Robins. Nedensel çıkarım
İnci. İstatistikte Nedensel Çıkarım: Genel Bir Bakış

PS Konuyla ilgili daha fazla bilgi için Nedensel Çıkarım ve aşağıdaki adlarla (başlarda) google yapabilirsiniz: Judea Pearl, Donald Rubin, Miguil Hernan.


Burada bir göz atın: en.wikipedia.org/wiki/Correlation_does_not_imply_causation Ash'in ifadesine aykırıyım : Tasarımın deneysel mi yoksa gözlemsel mi olduğuna bakılmaksızın, A değişkeni ile bir Y sonucu arasındaki nedensellik ilişkisini yansıtırsa A ve Y arasında açık arka kapı yolu yoktur. Örneğin A dondurma satışı, yüzme havuzlarında Y ölümü; ilişkilidir, ancak sıcaklıklarını arttırma veya azaltma sebepleridir. Belki Ash, her ikisi de üçüncü bir değişkene bağlı olarak açık arka kapı yolları ile anlamına gelir , ancak daha sonra formülasyonu çok belirsizdir.
Karl

Örnekteki arka kapı yolu mevsimdir. Bir arka kapı yolu, üçüncü bir değişken anlamına gelir.
Neil G

Judea Pearl'ün nedensellik çalışmasına yaptığı katkıları bilmeyenler için, biyografisini , 2011 Turing Ödülü'nü kazanan Bilgisayar Hesap Makineleri Birliği web sitesinden okumak faydalı olabilir . Pearl, istatistiki eğitim müfredatına nedensel çıkarımın daha fazla tartışılmasının Amstat News ile yapılan röportajda yer alması gerektiğini tartışıyor .
jthetzel

Yorumlar genişletilmiş tartışmalar için değildir; bu konuşma sohbete taşındı .
gung - Reinstate Monica

3

Avukatlık gelirindeki artışla ilişkili olarak boşanma oranındaki artışı düşünün.

Sezgisel olarak, bu ölçütlerin ilişkilendirilmesi gerektiği açıktır. Daha fazla çift (talep) daha fazla boşanma davası açmakta, dolayısıyla daha fazla avukat (tedarik) fiyatlarını yükseltmektedir.

Boşanma oranındaki artışın avukat gelirinde artışa neden olduğu görülüyor , çünkü çiftlerden gelen ilave talep avukatların fiyatlarını yükseltmesine neden oldu .

Yoksa bu geriye mı? Avukatlar kasten ve bağımsız olarak fiyatlarını yükselttikten sonra yeni gelirlerini boşanma ilanlarına harcarlarsa? Bu aynı zamanda makul bir açıklama gibi gözüküyor.

Bu senaryo, istatistiksel bir analizin gösterebileceği keyfi üçüncü, açıklayıcı değişken sayısını göstermektedir. Aşağıdakileri göz önünde bulundur:

  1. Her veri noktasını ölçemezsiniz,
  2. Açıklayıcı olmayan her veri noktasını ortadan kaldırmak istiyorsunuz.
  3. Bir veri noktasını neden ölçtüğünüzde ortadan kaldırmanın nedenini açıklayabilirsiniz.

Bir bilmecen var. Her veri noktasını ölçemezsiniz, açıklayıcı olmayan veri noktalarını dikkate almamayı haklı göstermek istiyorsanız, bunları ölçmeniz gerekir. ( Yapabilirsin onları ölçmek olmadan bazı datapoints ortadan kaldırmak, ancak en az onları haklı az gerekir.)

Sınırlandırılmamış bir sistemde nedensellik kanıtı doğru olamaz.


2

A ve B bağıntılıysa ve tesadüfü dışladıktan sonra, A'nın B'ye veya B'nin A'ya veya muhtemelen bilinmeyen bir kısmının X'in hem A hem de B'ye neden olması muhtemeldir.

İlk adım, olası bir mekanizmayı incelemektir. A'nın B durumunu veya bunun tam tersini nasıl yapabileceğini veya X'in her ikisine neden nasıl bir sebep olabileceğini düşünebiliyor musunuz? (Bu sınavın bir neden olduğunu kanıtlamaya çalışan bir deney yapmaktan daha ucuz olduğu varsayılmaktadır). Umarım nedensellik göstermek için bir denemenin değerli göründüğü bir pozisyonda kalırsınız. Sen olabilir Eğer bir mekanizma düşünemiyorum eğer devam (Bir B neden ama biz bir olasılık neden hiçbir fikrim yok).

Bu deneyde, şüpheli sebebi isteğinizde manipüle edebilmeniz gerekir (örneğin, neden “A hapı alıyorsa”, bazıları ise hapı alacak, bazıları ise almaz). Daha sonra, hapları kim alıp almayacağına karar veren, ne alıp ne de hapı alıp kim alamadığını bilenler ile olağan önlemleri alıyorsunuz. Ayrıca (, rahatsız oda sadece diğer grup bir kirli sahte hap alırken güneş pencereden gelen güzel sıcak bir odada insanlara hap A vererek eşit deney kalanını tutmaya çalışır olabilir verilerinizi etkilemez). Öyleyse tek farkın bu hap olduğu ve hapı alıp almama sebebinin başka hiçbir şeyi etkilemeyen rastgele bir karar olduğu sonucuna varırsanız,


2

Gnasher ve Peter tarafından açıklanan girişimsel (deneysel) veriler nedensel bir ilişki için iyi bir örnek olmanın en kolay yoludur. Bununla birlikte, yalnızca Ash'in cevabı gözlemsel veriler yoluyla nedensel bir ilişkiden vazgeçme ihtimalinden bahseder. Ek olarak arka kapı yöntemi diye söz edilen, ön kapak yöntemi gözlem verileri ve bazı nedensel varsayımlara dayalı nedenselliği ortaya başka bir yoludur. Bunlar Judea Pearl tarafından keşfedildi. Burada özetlemeye ve bunlara bir referans sağlamaya çalıştım .


0

Nedensel bir ifade vermek için, hem Rastgele Örnekleme hem de Rastgele Atamaya sahip olmanız gerekir.

  • Rastgele Örnekleme: Her birey, çalışma için seçilecek eşit olasılıklara sahiptir.
  • Rastgele Atama: deneydeki her birey biraz farklı özellikler gösterir.

Bu nedenle, yukarıdaki örneklenmiş gruptan bir tedavi ve kontrol grubu seçerken, benzer özellikteki eşit sayıda insan hem tedavi hem de kontrol grubunda olmalıdır.

Tedavi grubu ilaç insanlara verildiği gruptur. Kontrol grubu ilaç verilmemiş olduğu gruptur. Ayrıca bir plasebo grubu da tanımlayabilirsiniz. , deneklere ilaç verilmediği, ancak onlara verildiği söylenen .

Son olarak, eğer etkiler tedavi grubunda görülebilir ancak kontrol grubunda görülmüyorsa, nedensellik belirleyebiliriz.


Bence, plasebo grubu kesinlikle gereklidir. Ayrıca, test konularını ele almaktan sorumlu kişiler kimin hangi grupta olduğunu bilmemelidir ("çift kör"). Daha az bir şey kesinlikle güvenilmez olarak kabul ediyorum. Test yapmak kolay değil.
mafu

Randomize Kontrollü Plasebo denemeleri Randomize Kontrollü denemelerden daha otantiktir, ancak Randomize Kontrollü denemeleri kullanarak nedensel ifadeler yapılabilir
show_stopper

2
“Nedensel bir ifade vermek için hem Rastgele Örnekleme hem de Rastgele Atamaya ihtiyacınız var” - bu doğru değil. Ön kapı ve arka kapı yöntemlerine bakın.
Neil G
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.