İstatistik ve nedensel çıkarım?


51

1984 tarihli "İstatistik ve Nedensel Çıkarım" adlı makalesinde Paul Holland, istatistikteki en temel sorulardan birini dile getirdi:

İstatistiksel bir model nedensellik hakkında ne söyleyebilir?

Bu onun sloganına yol açtı:

Manipülasyon olmadan neden yok

Bu nedensellik düşünen deneyler etrafında kısıtlamaların önemini vurguladı. Andrew Gelman da benzer bir noktaya değindi :

“Bir şeyi değiştirdiğinizde ne olacağını öğrenmek için, onu değiştirmek gerekir.” ... Herhangi bir pasif gözlemden asla öğrenemeyeceğiniz bir sistemi rahatsız etmekten öğrendiğiniz şeyler var.

Bu yazıda onun fikirleri özetlenmiştir .

İstatistiksel bir modelden nedensel bir çıkarım yapılırken nelere dikkat edilmelidir?


2
Harika bir soru: Ayrıca korelasyon ve nedensellik konusundaki bu soruya bakın. istatistik.stackexchange.com/questions/534/…
Jeromy Anglim


5
Söylenecek çok şey var. Ancak Pearl'ün "Nedensellik" kitabını (2002, ancak daha yeni 2. basım) veya Hernan and Robins'in "Nedensellik Çıkarımı" kitabını (2015'te, arama yaparsanız çevrimiçi ücretsiz elektronik taslak) okuyabilirsiniz.

Yanıtlar:


28

Bu geniş bir sorudur, fakat Kutu göz önüne alındığında, Hunter ve Hunter alıntı doğru, aşağı doğru geldiğini düşünüyorum

  1. Deneysel tasarımın kalitesi:

    • randomizasyon, örneklem büyüklüğü, kafa karıştırıcıların kontrolü, ...
  2. Tasarımın uygulamasının kalitesi:

    • protokole bağlılık, ölçüm hatası, veri işleme, ...
  3. Tasarımı doğru bir şekilde yansıtacak modelin kalitesi:

    • engelleme yapıları doğru şekilde temsil edilir, uygun serbestlik dereceleri efektlerle ilişkilendirilir, tahmin ediciler yansızdır ...

Açıkça ifade etme riski altında her birinin kilit noktalarına vurmaya çalışacağım:

  1. geniş bir istatistik alt alanıdır, ancak en temel haliyle, nedensel çıkarım yaparken ideal olarak bir tedaviye atanma dışındaki özdeş ortamlarda izlenen özdeş birimlerle başladığımız gerçeğine bağlı olduğunu düşünüyorum. Atanmadan sonra gruplar arasındaki sistematik farklılıklar, mantıksal olarak tedaviye atfedilebilir (nedenini çıkartabiliriz). Ancak, dünya o kadar hoş değil ve birimler tedaviden önce farklılık gösterir ve deneyler sırasında cepheler tamamen kontrol edilmez. Bu yüzden "neyi kontrol edebileceğimizi ve neyi randomize edemeyeceğimizi kontrol ederiz", bu da kontrol ettiğimiz veya randomize ettiğimiz karışıklıklar nedeniyle sistematik önyargının olmayacağına dair güvence veriyor. Bir problem, deneylerin zor (imkansız) ve pahalı olma eğiliminde olmaları ve maliyetler göz önüne alındığında, mümkün olduğu kadar dikkatli bir şekilde kontrol edilen bir ortamda mümkün olduğunca fazla bilgiyi etkin bir şekilde elde etmek için çok çeşitli tasarımların geliştirilmesidir. Bunlardan bazıları oldukça titiz (örneğin, tıpta çift-kör, randomize, plasebo kontrollü deneme) ve diğerleri daha az (örneğin “yarı deneylerin çeşitli biçimleri”).

  2. aynı zamanda büyük bir konudur ve istatistikçilerin genelde düşünmememiz gereken bir konu .... Uygulamalı istatistiksel çalışmada, verilerde bulunan 'etkilerin' veri toplamanın ya da ele almanın tutarsızlığının sahte sonuçları olduğu olayları hatırlayabiliyorum. Ayrıca, bu sorunlar nedeniyle ilginin gerçek nedensel etkileri hakkındaki bilgilerin ne kadar sıklıkla kaybedildiğini merak ediyorum. ...)

  3. başka bir büyük teknik konudur ve nesnel nedensel çıkarımda gerekli bir başka adımdır. Belli bir dereceye kadar bu durum dikkate alınır, çünkü tasarım kalabalığı birlikte tasarım ve modeller geliştirir (bir modelden çıkarım amaç, tahmin edicilerin nitelikleri tasarımdır). Fakat bu sadece bizi şimdiye kadar götürüyor, çünkü 'gerçek dünyada' ders kitabı olmayan tasarımların deneysel verilerini analiz etmemiz gerekiyor ve ardından uygun kontroller gibi şeyler ve modele nasıl girmeleri gerektiği ve hangi derecelerde ilişkili olduğu hakkında düşünmek zorundayız. ihlallerin nasıl düzeltileceği ve tahmin edicilerin kalan ihlallere karşı ne kadar güçlü olduğu ve ne olduğu konusunda bir özgürlük olmalı ve varsayımların karşılanıp karşılanmadığı ...

Her neyse, umarım yukarıdakilerden bazıları, bir modelden nedensel çıkarım yapmayla ilgili düşünceler hakkında düşünmeye yardımcı olur. Büyük bir şey unuttum mu?


3
2. nokta için çok büyük bir artı bir kişi. İnsan denekleri koruma eğitiminden geçmenin dışında, veri toplama ve depolama konusunda en ufak bir eğitim almadım. Veri toplamanın doğru yapılması, analizden çok daha önemlidir.
Matt Parker

Ben de cevaplamak isterdim ama korkarım Kingsford'un söylediklerine ekleyecek hiçbir şey kalmadı.
Joris Meys

7

Yukarıdaki mükemmel cevaba ek olarak, nedensellik göstermeye daha fazla yaklaşmanızı sağlayacak istatistiksel bir yöntem var. Bağımlı değişkenden önce meydana gelen bağımsız bir değişkenin nedensel bir etkiye sahip olup olmadığını gösteren Granger Nedenselliktir. Bu yöntemi aşağıdaki linkte sunumu kolay bir şekilde tanıtıyorum:

http://www.slideshare.net/gaetanlion/granger-causality-presentation

Bu yöntemi rakip makroekonomik teorileri test etmek için de uyguluyorum: http://www.slideshare.net/gaetanlion/economic-theory-testing-presentation

Bu yöntemin mükemmel olmadığını unutmayın. Sadece belirli olayların diğerlerinden önce meydana geldiğini ve bu olayların tutarlı bir yönlü ilişkiye sahip olduğunu onaylar. Bu gerçek nedensellik gerektiriyor gibi görünüyor, ancak her zaman böyle değildir. Horoz sabah çağrısı güneşin doğmasına neden olmaz.


4

İstatistiksel bir model nedensellik hakkında ne söyleyebilir? İstatistiksel bir modelden nedensel bir çıkarım yapılırken nelere dikkat edilmelidir?

Açıklığa kavuşturmak için ilk şey, tamamen istatistiksel bir modelden nedensel çıkarım yapamazsınız. Hiçbir istatistiksel model nedensel varsayımlar olmadan nedensellik hakkında bir şey söyleyemez. Yani nedensel çıkarım yapmak için nedensel bir modele ihtiyacınız vardır .

Randomize Kontrol Denemeleri (RCT'ler) gibi altın standart olarak kabul edilen bir durumda bile, devam etmek için nedensel varsayımlar yapmanız gerekir. Bunu açıklamama izin ver. Örneğin, randomizasyon prosedürü, ilgi muamele ve de sonucun sonuç olduğunu varsayalım . Mükemmel bir RCT varsayarak, varsaydığınız şey şudur:ZXY

görüntü tanımını buraya girin

Bu durumda yani işler iyi gidiyor. Bununla birlikte, ile arasında karışık bir ilişki ile sonuçlanan kusurlu uyumluluğunuz olduğunu varsayalım . O zaman, şimdi, RCT'niz şöyle görünür:P(Y|do(X))=P(Y|X)XY

görüntü tanımını buraya girin

Analiz yapmak için hala bir niyet yapabilirsin. Ancak gerçek etkisini tahmin etmek istiyorsanız, artık basit değil. Bu bir enstrümantal değişken ayarıdır ve bazı parametrik varsayımlar yaparsanız, etkiyi tanımlayabilir, hatta sınırlayabilirsiniz .X

Bu daha da karmaşıklaşabilir. Ölçüm hatası problemleriniz olabilir, denekler çalışmayı bırakabilir veya diğer hususların yanı sıra talimatları izlemeyebilir. Bu şeylerin çıkarım ile nasıl ilerleyeceği ile ilgili varsayımlarda bulunmanız gerekir. "Tamamen" gözlemsel verilerle bu daha problemli olabilir, çünkü genellikle araştırmacılar veri üretme süreci hakkında iyi bir fikir sahibi olmayacaktır.

Bu nedenle, modellerden nedensel çıkarımlar yapmak için sadece istatistiksel varsayımlarını değil, en önemlisi nedensel varsayımlarını değerlendirmeniz gerekir. İşte nedensel analiz için bazı yaygın tehditler:

  • Eksik / kesin olmayan veriler
  • Hedef nedensel ilgi miktarı iyi tanımlanmamış (Tanımlamak istediğiniz nedensel etki nedir? Hedef kitle nedir?)
  • Kafa karıştırıcı (gözlemlenmemiş kafa karıştırıcılar)
  • Seçim yanlılığı (kendiliğinden seçim, kesilmiş örnekler)
  • Ölçüm hatası (karıştırıcı olabilir, sadece gürültüyü değil)
  • Yanlış tanımlama (örneğin, yanlış işlevsel biçim)
  • Dış geçerlilik sorunları (hedef nüfusa yanlış çıkarım)

Bazen bu problemlerin bulunmadığı iddiası (veya bu problemleri ele alan iddiası) çalışmanın tasarımıyla desteklenebilir. Bu nedenle deneysel veriler genellikle daha güvenilirdir. Bununla birlikte, bazen insanlar bu problemleri ya teorik olarak ya da kolaylık olsun diye kabul eder. Teori yumuşaksa (sosyal bilimlerde olduğu gibi), sonuçları yüz değerinde almak daha zor olacaktır.

Ne zaman yedeklenemeyeceğine dair bir varsayım olduğunu düşünüyorsanız, sonuçların bu varsayımların makul ihlallerine karşı ne kadar hassas olduğunu değerlendirmelisiniz - buna genellikle duyarlılık analizi denir.


Kesikli iki yönlü oku, ek bir düğümden iki adet tek yönlü katı okla değiştirmek eşdeğer midir?
Taylor,

@Taylor evet, gizli (gözlenmeyen) ek bir düğüm.
Carlos Cinelli
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.