Nedensellik matematiksel olarak nasıl tanımlanır?


16

İki rasgele değişken arasındaki nedensel ilişkinin matematiksel tanımı nedir?

İki rastgele değişken X ve Y ortak dağılımından bir örnek verildiğinde , X neden neden olduğunu söyleyebiliriz ?Y

Bağlam için nedensel keşif hakkındaki bu makaleyi okuyorum .


2
Gördüğüm kadarıyla nedensellik, matematiksel değil bilimsel bir kavramdır. Açıklığa kavuşturmak için düzenleyebilir misiniz?
mdewey

2
@mdewey katılmıyorum. Nedensellik tamamen resmi olarak paraya çevrilebilir. Bkz. Örneğin cevabım.
Kodiologist

Yanıtlar:


9

İki rasgele değişken arasındaki nedensel ilişkinin matematiksel tanımı nedir?

Matematiksel olarak, nedensel bir model değişkenler arasındaki fonksiyonel ilişkilerden oluşur . Örneğin, aşağıdaki yapısal denklemler sistemini düşünün:

x=fx(ϵx)y=fy(x,ϵy)

Bu, xy değerini işlevsel olarak belirlediği anlamına gelir ( x müdahale ederseniz, bu y değerlerini değiştirir ), ancak tersi olmaz. Grafiksel, bu genellikle ile temsil edilir xy bu araçlar, x , y yapısal devreye girer. Bir zeyilname olarak, fonksiyonel modellere matematiksel olarak eşdeğer olan karşı-olgusal değişkenlerin ortak dağılımları açısından da nedensel bir model ifade edebilirsiniz .

İki rastgele değişken X ve Y'nin ortak dağılımından bir örnek verildiğinde, X'in Y'ye neden neden olduğunu söyleyebiliriz?

Bazen (veya çoğu kez) Eğer yapısal denklem şekline hakkında bilgi yok fx , fy , ne de hatta olsun xy veya yx . Sahip olduğunuz tek bilgi ortak olasılık dağılımı p(y,x) (veya bu dağılımdan örnekler).

Bu şu soruya yol açar: nedensellik yönünü sadece verilerden ne zaman kurtarabilirim? Ya da, daha kesin olarak, xy ya da tam tersi yapısal denklemine girip girmediğini ne zaman kurtarabilirim ?

Tabii ki, nedensel model hakkında temel olarak test edilemeyen varsayımlar olmadan , bu imkansızdır . Sorun, birkaç farklı nedensel modelin, gözlemlenen değişkenlerin aynı ortak olasılık dağılımını gerektirebilmesidir. En yaygın örnek, gauss gürültüsü olan nedensel bir doğrusal sistemdir.

Ancak bazı nedensel varsayımlar altında bu mümkün olabilir --- ve nedensel keşif literatürünün üzerinde çalıştığı şey budur. Bu konuya önceden maruz kalmadıysanız, Peters, Janzing ve Scholkopf'un Nedensel Çıkarım Unsurları'nın yanı sıra Judea Pearl'den Nedensellik bölümünden başlamak isteyebilirsiniz . Biz nedensel keşif üzerine referanslar için CV burada bir konuyu , ama biz birçok referanslar henüz listelenen yok.

Bu nedenle, sorunuzun varsayımlarına bağlı olduğu için sorunuzun tek bir cevabı yoktur. Bahsettiğiniz makalede, gauss olmayan gürültülü doğrusal bir model varsaymak gibi bazı örnekler veriliyor . Bu durum LINGAN (doğrusal gauss olmayan asiklik modelin kısaltması) olarak bilinir , burada bir örnek R:

library(pcalg)
set.seed(1234)
n <- 500
eps1 <- sign(rnorm(n)) * sqrt(abs(rnorm(n)))
eps2 <- runif(n) - 0.5
x2 <- 3 + eps2
x1 <- 0.9*x2 + 7 + eps1

# runs lingam
X <- cbind(x1, x2)
res <- lingam(X)
as(res, "amat") 

# Adjacency Matrix 'amat' (2 x 2) of type ‘pag’:
#     [,1]  [,2]
# [1,] .     .   
# [2,]  TRUE .     

Burada dikkat edin, x2 neden olduğu gauss olmayan gürültüye sahip doğrusal bir nedensel modelimiz varx1 ve Lingam doğru nedensel yönünü kurtarır. Bununla birlikte,bunun LINGAM varsayımlarınakritikolarakbağlı olduğunadikkat edin.

Alıntı yaptığınız makale söz konusu olduğunda, bu özel varsayımı yaparlar (bkz. "Önermeleri"):

Eğer xy X mekanizması eşleme Y az açıklama uzunluğu Y'nin değerine bağlıdır, oysa Y mekanizması eşleme X az açıklama uzunluğu, X değerinin bağımsızdır

Bu bir varsayımdır. Biz buna “tanımlama koşulu” diyoruz. Esasen postüla, p(x,y) eklem dağılımına kısıtlamalar getirir . Yani, önermede xy belirli verilerde bazı kısıtlamalar varsa ve yx diğer kısıtlamalar geçerli ise diyor . Test edilebilir çıkarımları olan bu tür kısıtlamalar ( p(y,x) üzerine kısıtlamalar getirme ) gözlemsel verilerden yönelimli bir şekilde iyileşmeyi sağlayan şeydir.

Son bir açıklama olarak, nedensel keşif sonuçları hala çok sınırlıdır ve güçlü varsayımlara bağlıdır, bunları gerçek dünya bağlamında uygularken dikkatli olun.


1
Sahte verilere sahip bazı basit örnekleri bir şekilde yanıtlamak için bir şansınız var mı ? Örneğin, biraz Nedensel Çıkarım Unsurları okuduktan ve Peters'in bazı derslerini inceledikten sonra, bir regresyon çerçevesi, sorunu ayrıntılı olarak anlama ihtiyacını motive etmek için yaygın olarak kullanılmaktadır (ICP çalışmalarına bile değinmiyorum). RCM'den uzaklaşma çabanızda, yanıtlarınızın gerçek somut modelleme makinelerini dışarıda bıraktığı (belki de yanlış) izlenimine sahibim.
usεr11852 diyor Reinstate Monic

1
@ usεr11852 Sorularınızın bağlamını anladığımdan emin değilim, nedensel keşif örnekleri ister misiniz? Jane'in sunduğu makalede birkaç örnek var. Ayrıca, "RCM'den kaçınarak ve gerçek somut modelleme makinelerini dışarıda bırakarak" ne demek istediğini anladığımdan emin değilim, burada nedensel keşif bağlamında hangi somut makineleri kaçırıyoruz?
Carlos Cinelli

1
Karışıklık için özür dilerim, gazetelerden örnekler umurumda değil. Diğer kağıtları kendimden alıntılayabilirim. (Örneğin, Lopez-Paz ve ark., Onların nöral nedensellik katsayısı hakkında CVPR 2017) Benim umurumda olan biri R (veya en sevdiğiniz dil) çalıştırmak sahte verileri ile basit bir sayısal örnek ve ne demek istediğini görmektir. Eğer alıntı yaparsanız Peters 've ark. kitap ve onlar çok yararlı küçük kod parçacıkları (ve bazen sadece kullanın lm) var. Nedensel keşif hakkında bir fikir edinmek için Tuebingen veri setleri gözlem örnekleri etrafında çalışamayız! :)
usεr11852 diyor Reinstate Monic

1
@ usεr11852 emin, sahte bir örnek de dahil olmak üzere önemsiz, ben R'de lingam kullanarak birini dahil edebilirim. Ama "RCM'den kaçınarak ve gerçek somut modelleme makinelerini bırakarak" ne demek istediğinizi açıklamak ister misiniz?
Carlos Cinelli

2
@ usεr11852 tamam geribildirim için teşekkürler, uygun olduğunda daha fazla kod eklemeye çalışacağım. Son bir açıklama olarak, nedensel keşif sonuçları hala çok sınırlıdır, bu nedenle insanların bağlama bağlı olarak bunları uygularken çok dikkatli olmaları gerekir.
Carlos Cinelli

4

Nedenselliğin resmileştirilmesine yönelik çeşitli yaklaşımlar vardır (bu, yüzyıllardır süren nedensellik hakkında önemli felsefi anlaşmazlıklara uygundur). Popüler olan potansiyel sonuçlar açısından. Rubin nedensel modeli adı verilen potansiyel sonuçlar yaklaşımı, her nedensel durum için farklı bir rastgele değişken olduğunu varsayar. Yani, Y1 konu çalışma ilacını alır ve eğer bir klinik çalışmanın olası sonuçların rastgele değişken olabileceğini Y2 o plasebo alırsa rastgele değişken olabilir. Nedensel etkisi arasındaki farktır Y1 ve Y2 . Aslında Y1=Y2 , tedavinin bir etkisi olmadığını söyleyebiliriz. Aksi takdirde, tedavi durumunun sonuca neden olduğunu söyleyebiliriz.

Değişkenler arasındaki nedensel ilişkiler, , çok farklı bir tada sahip olan ancak matematiksel olarak Rubin modeline eşdeğer olduğu ortaya çıkan yönlü asil grafikler edilebilir (Wasserman, 2004, bölüm 17.8).

Wasserman, L. (2004). Tüm istatistikler: İstatistiksel çıkarımda kısa bir kurs . New York, NY: Springer. ISBN 978-0-387-40272-7.


teşekkür ederim. eklem dağılımından bir dizi örnek verildiğinde bunun için bir test ne olurdu?
Jane

3
Okuyorum arxiv.org/abs/1804.04622 . Referanslarını okumadım. Gözlemsel verilere dayalı nedenselliğin ne anlama geldiğini anlamaya çalışıyorum.
Jane

1
Üzgünüm (-1), sorulan şey bu değil, veya Y 2'yi gözlemlemiyorsunuz , X , Y olgusal değişkenlerinin bir örneğini gözlemliyorsunuz . Jane'in bağladığı makaleye bakın. Y1Y2XY
Carlos Cinelli

2
@Vimal: "Girişimsel dağılımlar" ın olduğu durumu anlıyorum. Bu ortamda "girişimsel dağılımlarımız" yoktur ve bu da anlaşılmasını zorlaştırır. Makaledeki motive edici örnekte gibi bir şey veriyorlar . X'in y'nin koşullu dağılımı esasen gürültünün ϵ artı bazı çevirilerinin dağılımıdır , ancak bu y'nin x'in koşullu dağılımı için geçerli değildir. Örneği anlıyorum. Nedenselliğin gözlemsel keşfi için genel tanımın ne olduğunu anlamaya çalışıyorum. (x,y=x3+ϵ)ϵ
Jane

2
@ Gözlemsel vaka için Jane (sorunuz için), genel olarak nedensellik yönünü tamamen matematiksel olarak, en azından iki değişken durum için çıkaramazsınız. Daha fazla değişken için, altında ek (test edilemeyen) varsayımlara sen olabilir bir iddiada ama sonuca hala sorgulanabilir. Bu tartışma yorumlarda çok uzun. :)
Vimal

0

XY nedeni olup olmadığını belirlemenin iki yolu vardır . Birincisi standart, ikincisi kendi iddiam.

  1. Üzerinde bir müdahale var Varlığından X böyle değeri, bu Y değiştirilir

Bir müdahale, bağımlı olduğu değişkenleri etkilemeyen bir değişkende yapılan cerrahi bir değişikliktir. Müdahaleler yapısal denklemlerde ve nedensel grafik modellerinde titizlikle resmileştirilmiştir, ancak bildiğim kadarıyla belirli bir model sınıfından bağımsız bir tanım yoktur.

  1. YX

Bunu titiz hale getirmek için bir modeli üzerinde resmileştirmek gerekirXY ve özellikle nasıl simüle edildiğini tanımlayan anlambilim gerekir.

Modern nedensellik yaklaşımlarında, müdahale nedensel ilişkileri tanımlayan ilkel nesne olarak kabul edilir (tanım 1). Ancak benim görüşüme göre, müdahale simülasyon dinamiklerinin bir yansımasıdır ve zorunlu olarak tutarlıdır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.