Bir değişkeni kontrol etmek ne zaman uygunsuz olur?


15

En az bir naif örnek düşünebilirim. X ve Z arasındaki ilişkiyi incelemek istediğimi varsayalım. Y'nin Z'yi etkilediğinden de şüpheliyim, bu yüzden Y'yi kontrol ediyorum. Y için, X ve Z arasındaki ilişkiyi "örtüyorum", çünkü X, Y verilen Z'den bağımsızdır.

Şimdi, önceki örnekte, çalışmam gereken ilişkiler X ve Y ile Y ve Z arasındaki ilişkiler olabilir. Ancak, eğer böyle şeyleri önsel olarak bilseydim, bilim yapmazdım ilk sırada. Yaptığım çalışma şimdi X ve Z arasında bir ilişki olmadığını gösteriyor ki durum böyle değil .... X ve Z ARE ile ilgili.

Bu, aşağıdaki bağımlılık diyagramında gösterilmiştir. Doğru senaryoda, Z X ve Y'ye bağlıdır ve X ve Y bağımsızdır. X ve Z arasındaki ilişkiyi belirlemek için Y'yi kontrol ediyoruz. Sol senaryoda Z, X'e bağlı Y'ye bağlıdır. X ve Z, Y verildiğinde bağımsızdır, bu nedenle X ve Z arasındaki ilişki, Y.

variable_relationships

Benim sorum temelde "Değişken Y için ne zaman kontrol etmek ve ne zaman uygun değildir?" ... X ve Y arasındaki ilişkiyi tam olarak araştırmak zor ya da imkansız olabilir, ancak örneğin Y'yi belirli bir seviyede kontrol etmek bir seçenek. Çalışmamızı yapmadan önce nasıl karar veriyoruz ve çok fazla veya çok az kontrol etmenin ortak tuzakları nelerdir?

Alıntılar takdir edildi.


7
Bir örnek vermek gerekirse, kesin durumunuz ırk ayrımcılığının etkisini değerlendirirken ortaya çıkar. Let be yarışı. Let Z ücretler olmak. Let Y eğitim olmak. Açıkça eğitim ücretleri etkiler, bu yüzden bunu kontrol etmek istersiniz, AMA ırk ayrımcılığının ırksal bir azınlığın daha kötü eğitim almasına neden olması durumunda, eğitim için kontrol etmek bu ayrımcılığı kapsayacaktır. Örneğin. bakınız Neal and Johnson (1996) . Alexis'in cevabının işaret ettiği gibi, probleminizin ayrıntılarına girmeniz gerekir. Her şeyi çözen basit bir düğmeye basmak yok. XZY
Matthew Gunn

1
Basmak için basit bir tuş umudum yoktu. Gerçekten, sorumun önemsiz bir cevabı olduğu ortaya çıksaydı oldukça hayal kırıklığına uğrayabilirdim. :)
Scott

1
@Repmat Evet. Bununla birlikte, IV tahmininin 4 varsayımı nadiren karşılanmaktadır ve bunlar olsa bile, ilgili derneklerin gücü IV tahmininin taraflı sonuçlar vermesini sağlayabilir. Örneğin, Hernán ve Robins Nedensel Tahmini ( cevabımda tam alıntı ve bağlantı), bölüm 16: Enstrümantal değişkenlerin tahmini.
Alexis

1
@Alexis Doğal olarak, IV'lerin gelmesi zor ... "Ücretsiz öğle yemeği yok" ve hepsi, ancak bunu yaptığınızda, bunu çok az veya hiç şüphe olmadan bilirsiniz.
Repmat

1
@Repmat ... geçerli IV tahminleri için varsayımlar, resimde görülen DAG'dan daha fazlasını gerektirir ... gerçekten oldukça zayıftırlar.
Alexis

Yanıtlar:


7

Üçüncü değişkenler üzerinde bazı öngörücüler verildiğinde bazı sonuçların olasılıklarını koşullandırmak (yani ayarlamak) yaygın olarak uygulanmaktadır, ancak haklı olarak belirttiğiniz gibi, nedensel etkilerin bir temsili olarak ortaya çıkan tahmine önyargı getirebilir . Bu, potansiyel bir nedensel karışıklığın "klasik" tanımları ile bile olabilir, çünkü hem karışıklığın kendisi hem de ilgilenilen prediktörlerin her biri daha yukarı doğru nedensel çelişkilere sahip olabilir. Aşağıdaki DAG'da, örneğin, L , E'nin D üzerindeki nedensel etkisinin klasik bir birleşimidir, çünkü (1) neden olduğu ve bu nedenle E ile ilişkilidir ve (2) D ile ilişkili olduğu için D ile ilişkilidir.LEDED ile ilişkili olan D . Bununla birlikte, ıslah edici veya katmanlaştırıcı ya P ( D | e ) ile L , (a "hızlandırıcı") etkisi nedensel tahminleri taraflı üretecek E ile D , çünkü L ile karıştırılmakta D ölçülmeyen değişken ile U 2 ve L ile karıştırılmakta e ölçülmeyen değişkenine göre , U 1 .U2DP(D|E)LEDLDU2LEU1

DAG

İnci, Robins ve diğerleri tarafından tarif edilen, değişkenlerin nedensel bir tahmin sağlamak için hangi değişkenlerin koşullandırılacağını veya katmanlaştırılacağını anlamak için nedensel etki tanımlanabilirlik ölçütlerini (arka kapı yollarıyla engellenmeyen ortak nedenler yok) kullanarak olası DAG'ların dikkatle incelenmesini gerektirir. . Kısayol yok. Ortak karıştırıcı kalıpları öğrenin. Ortak seçim önyargı kalıplarını öğrenin. Uygulama.

Referanslar

Grönland, S., Pearl, J. ve Robins, JM (1999). Epidemiyolojik araştırma için nedensel diyagramlar . Epidemiyoloji , 10 (1): 37-48.

Hernán, MA ve Robins, JM (2018). Nedensel Çıkarım . Chapman & Salonu / CRC, Boca Raton, FL

Maldonado, G. ve Grönland, S. (2002). Nedensel etkileri tahmin etmek . Uluslararası Epidemiyoloji Dergisi , 31 (2): 422-438.

Pearl, J. (2000). Nedensellik: Modeller, Akıl Yürütme ve Çıkarım . Cambridge Üniversitesi Yayınları.


12

Sorunuzun hızlı bir cümle cevabına inanıyorum,

Y değişkenini ne zaman kontrol etmek uygundur ve ne zaman olmaz?

"arka kapı kriteri" dir.

Judea Pearl'ün Yapısal Nedensel Modeli, hangi değişkenlerin koşullandırma için yeterli olduğunu (ve gerektiğinde), bir değişkenin diğeri üzerindeki nedensel etkisini ortaya çıkarmak için kesin olarak söyleyebilir. Yani, bu, Pearl tarafından bu inceleme belgesinin 19. sayfasında açıklanan arka kapı kriteri kullanılarak cevaplanmaktadır .

En büyük uyarı, değişkenler arasındaki nedensel ilişkiyi bilmenizi gerektirmesidir (bir grafikte yön okları şeklinde). Bunun hiçbir yolu yok. Zorluk ve olası öznellik burada devreye girebilir. Pearl'ün yapısal nedensel modeli, sadece bir nedensel model (yani yönlendirilmiş grafik) verilen doğru soruları nasıl cevaplayacağınızı, bir veri dağıtımı verildiğinde hangi nedensel modeller kümesinin mümkün olduğunu veya doğru deneyi gerçekleştirerek nedensel yapıyı nasıl arayacağınızı bilmenizi sağlar. Sadece veri dağıtımı verildiğinde doğru nedensel yapıyı nasıl bulacağınızı söylemez. Aslında, değişkenlerin anlamı hakkında dış bilgi / sezgi kullanmadan bunun imkansız olduğunu iddia eder.

Arka kapı kriterleri aşağıdaki gibi ifade edilebilir:

Y üzerindeki nedensel etkisini bulmak için , bir dizi değişken düğüm S , aşağıdaki kriterlerin her ikisini de karşıladığı sürece koşullandırılmak için yeterlidir:XY,S

1) No elemanları soyundan XSX

2) , X ve Y arasındaki tüm "arka kapı" yollarını engellerSXY

Burada, bir "arka kapı" yolu sadece ile başlayan ve X'i gösteren bir ok ile biten bir ok yoludur . (Diğer tüm okların işaret ettiği yön önemli değildir.) Ve "engelleme", belirli bir anlamı olan ve yukarıdaki bağlantının 11. sayfasında verilen bir ölçüttür. Bu, "D-ayrımı" hakkında öğrenirken okuduğunuz kriterle aynıdır. Şahsen Bishop'un Örüntü Tanıma ve Makine Öğrenimi bölümünün 8. bölümünün D-ayrımında engelleme kavramını yukarıda bağladığım İnci kaynağından çok daha iyi tanımladığını buldum. Ama şu şekilde gider:YX.

Bir dizi düğüm, aşağıdaki ölçütlerden en az birini karşılıyorsa, X ve Y arasındaki bir yolu engeller :S,XY

1) 'de de yolundaki düğümlerin biri yayar yolu üzerinde en az bir ok (yani ok) uzak düğümden işaretS,

2) içinde de olan bir düğüm veya bir düğümün bir atası S ) kafa kafaya bunu yerine (buna karşı örneğin "çarpışma" yol iki oklar vardırSS

Bu bir veya ölçüttür, genel arka kapı ölçütünden farklı olarak ve ölçüttür.

Arka kapı kriteri hakkında açık olmak gerekirse, size söylediği şey, belirli bir nedensel model için, yeterli bir değişkeni koşullandırırken, nedensel etkiyi verilerin olasılık dağılımından öğrenebilirsiniz. (Bildiğimiz gibi, ortak dağılım tek başına nedensel davranışları bulmak için yeterli değildir, çünkü aynı dağıtımdan birden fazla nedensel yapı sorumlu olabilir. Bu nedenle nedensel model de gereklidir.) Dağıtım sıradan istatistiksel / gözlemsel veriler üzerinde makine öğrenme yöntemleri. Bildiğiniz sürece nedensel yapının bir değişken (veya değişkenler kümesi) üzerinde koşullandırmaya izin verdiğinden, bir değişkenin diğeri üzerindeki nedensel etkisine ilişkin tahmininiz, istatistiksel yöntemlerle elde ettiğiniz verilerin dağılımı hakkındaki tahmininiz kadar iyidir.

Arka kapı ölçütünü iki diyagramınıza uyguladığımızda bulduklarımız:

ZX.YYX,Y

YXZXYYYZ.YY.X.YYYXY

YYXZ.

Is it sufficient to control for $Y$ to find the causal impact of $X$ on $Z$?

YX.ZX.

ZYXZWBAX. YY B,B,YZYX

ZWBYX. Y ZYXZWBAX,B.

YAWXZB.XZB,BAWBAWXZ

Daha önce de belirttiğim gibi, arka kapı ölçütünün kullanılması nedensel modeli bilmenizi gerektirir (yani değişkenler arasındaki okların "doğru" diyagramı). Ama Yapısal Nedensel Model, bence, böyle bir modeli aramak veya aramanın ne zaman boş olduğunu bilmek için en iyi ve en resmi yolu verir. Ayrıca "karıştırıcı", "arabuluculuk" ve "sahte" (hepsi beni şaşırtan) gibi terimleri geçersiz kılmak gibi harika bir yan etkiye sahiptir. Sadece bana resmi göster, hangi dairelerin kontrol edilmesi gerektiğini söyleyeyim.


3
Güzel. Cevabımın referanslar bölümüne Pearl's Causality ekleyip eklemeyeceğimi tartışıyordum .... ve şimdi yaptım. :)
Alexis

0

Sizin durumunuz için aşağıdakiler uygun olabilir veya olmayabilir: Xbir tedavi ise , eşleştirmeyi yaptığınızda değişkeni koruyacağınız eğilim skoru eşleşmesini kullanarak sorununuzu çözebilirsiniz Y. Başka bir deyişle, Ytedaviyi almayı öngören ortak değişkenleri (bu tür ortak değişkenlerden biridir) dengelersiniz X. Yukarıdaki
sonuç değişkenine nasıl bir referans olmadığına dikkat edin Z. Ayrıca gözlemlerinizin ne kadar dengeli olduğunu kontrol edebilirsiniz (bir denge tablosu eşleştirmeden önce ve sonra), bu da ne kadarının Xbelirlendiğine dair fikir verebilir Y.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.