İstatistiksel bir bakış açısıyla, gözlemsel bir çalışma ile eğilim puanları kullanarak bir nedensellik çıkarımı olabilir mi?


27

Soru: İstatistikçi (veya bir uygulayıcı) açısından bakıldığında, gözlemsel bir çalışma ile eğilim puanları kullanarak ( bir deney değil ) nedensellik ortaya çıkabilir mi?

Lütfen, bir alev savaşı veya fanatik bir tartışma başlatmak istemeyin.

Amaç: Stat doktora programımızda sadece çalışma grupları ve birkaç konu oturumuyla nedensel çıkarımlara dokunduk. Bununla birlikte, diğer bölümlerde (örn. HDFS, Sosyoloji) aktif olarak kullanan çok önemli bazı araştırmacılar var.

Zaten bu konuda oldukça ateşli tartışmalara tanık oldum. Burada bir şeyi başlatmak niyetim değil. Yani, hangi referanslarla karşılaştınız? Hangi bakış açılarına sahipsiniz? Örneğin, nedensel bir çıkarım tekniği olarak eğilim puanlarına karşı duyduğum bir argüman, değişken değişken önyargı nedeniyle hiçbir zaman nedensellikten çıkamayacağıdır. Bu çözülemeyen bir sorun mu?

Feragatname: Bu sorunun doğru bir cevabı olmayabilir - cw tıklamasıyla tamamen havalı, ancak yanıtlara şahsen çok ilgiliyim ve gerçek dünya örnekleri içeren birkaç iyi referansla mutlu olabilirim.

Yanıtlar:


16

Epidemiyolojide PS kullanımının desteklenmesini amaçlayan bir makalenin başında Oakes ve Church (1), Hernán ve Robins'in epidemiyolojideki kafa karıştırıcı etki konusundaki iddialarını dile getirdi (2):

Gözlemsel çalışmanızın sonuçlarının ölçülmemiş karıştırmadan etkilenmeyeceğini garanti edebilir misiniz? Bir epidemiyoloğun sağlayabileceği tek cevap 'hayır'dır.

Bu, sadece gözlemsel çalışmalardan elde edilen sonuçların tarafsız veya yararsız olduğundan emin olamayacağımız anlamına gelmez (çünkü, propropolün dediği gibi, sonuçlarının RCT'lerin tasarlanmasında faydalı olabilir), aynı zamanda PS'lerin bu konuda kesinlikle tam bir çözüm sunmadıklarını sorun veya en azından mutlaka diğer eşleştirme veya çok değişkenli yöntemlerden daha iyi sonuçlar vermez (bkz. örneğin (10)).

Propensity puanları (PS), inşaat tarafından, olan olasılık değil nedensel göstergeler. Eğilim skoru fonksiyonuna giren değişkenlerin seçimi, güvenilirliğini sağlamak için kilit bir unsurdur ve söylendiği gibi, zayıflıkları, esasen gözlemlenmemiş karıĢıklıkları kontrol etmemekten (retrospektif veya vaka kontrol çalışmalarında oldukça muhtemeldir) durmaktadır. . Diğer faktörler dikkate alınmalıdır: (a) modelin yanlış tanımlanması doğrudan etki tahminlerini etkileyecektir (OLS örneğinden çok daha fazla değil), (b) eş değişkenler düzeyinde eksik veriler olabilir, (c) PS'ler nedensel yorumlamayı etkilediği bilinen sinerjistik etkilerin üstesinden gelmemesi (8,9).

Referanslara gelince, Roger Newson'ın slaytlarını - Nedensellik, şaşırtma ve eğilim puanları - gerçek çalışmalardan gelen örneklerle eğilim puanlarını kullanma avantajları ve dezavantajları hakkında oldukça dengeli buldum . İki yıl önce Tıp İstatistikleri'nde gözlemsel çalışmalarda ya da çevresel epidemiyolojide eğilim puanlarının kullanımını tartışan birkaç iyi makale vardı.ve sonunda bir kaçını içine aldım (3-6). Ancak Pearl'ün incelemesini (7) seviyorum, çünkü nedensellik konularında daha geniş bir bakış açısı sunuyor (PS'ler s. 117 ve 130). Açıkçası, uygulamalı araştırmaya bakarak çok daha fazla örnek bulacaksınız. Andrew Gelman'ın web sitesinde rastlanan William R Shadish'den iki yeni makale eklemek istiyorum (11,12). Eğilim puanlarının kullanımı tartışılmaktadır, ancak iki makale daha çok gözlemsel çalışmalardaki nedensel çıkarımlara odaklanmaktadır (ve bunun randomize ortamlarla nasıl karşılaştırıldığı).

Referanslar

  1. Oakes, JM ve Church, TR (2007). Davetli Yorum: Epidemiyolojide İlerleme Eğilimi Puanı Yöntemleri . Amerikan Epidemiyoloji Dergisi , 165 (10), 1119-1121.
  2. Hernan MA ve Robins JM (2006). Nedensel çıkarım için araçlar: bir epidemiyologun hayali mi? Epidemiyoloji , 17, 360-72.
  3. Rubin, D. (2007). Nedensel etkiler için gözlemsel çalışmaların analizine karşı tasarım: Randomize edilmiş denemelerin tasarımına paralel . Tıpta İstatistik , 26, 20–36.
  4. Shrier, I. (2008). Editöre mektup . Tıpta İstatistik , 27, 2740-2741.
  5. Pearl, J. (2009). Eğilim skoru metodu üzerine açıklamalar . Tıpta İstatistik , 28, 1415–1424.
  6. Stuart, EA (2008). Eğilim puanlarının kullanımı için pratik öneriler geliştirmek: Peter Austin tarafından '1996 ve 2003 yılları arasında tıp literatüründeki eşleşme puanı eşleşmesinin kritik bir değerlendirmesi' tartışması . Tıpta İstatistik , 27, 2062–2065.
  7. Pearl, J. (2009). İstatistiklerde nedensel çıkarım: Bir genel bakış . İstatistik Araştırmaları , 3, 96-146.
  8. Oakes, JM ve Johnson, PJ (2006). Sosyal epidemiyoloji için eğilim puan uyumu . Gelen Sosyal Epidemiyoloji Yöntemleri JM Oakes ve S. Kaufman (Ed.), S. 364-386. Jossez-Bas.
  9. Höfler, M (2005). Karşı taraflara dayalı nedensel çıkarım . BMC Tıbbi Araştırma Metodolojisi , 5, 28.
  10. Winkelmayer, WC ve Kurth, T. (2004). Eğilim puanları: yardım mı yutturmaca mı? Nefroloji Diyaliz Nakli , 19 (7), 1671-1673.
  11. Shadish, WR, Clark, MH ve Steiner, PM (2008). Örgütlenmemiş Deneyler Doğru Cevaplar Verebilir mi? Rastgele ve Rastgele Olmayan Atamaları Karşılaştıran Rastgele Bir Deney . JASA , 103 (484), 1334-1356.
  12. Cook, TD, Shadish, WR ve Wong, VC (2008). Deney ve Gözlem Çalışmalarının Karşılaştırılabilir Nedensel Tahminler Ürettiği Üç Koşul: Çalışma İçi Karşılaştırmalardan Yeni Bulgular . Politika Analiz ve Yönetimi Dergisi , 27 (4), 724-750.

11

Eğilim puanları tipik olarak eşleşen literatürde kullanılır. Eğilim puanları, tedavi alma olasılığını tahmin etmek için tedavi öncesi değişkenleri kullanır. Temel olarak, sonuç ve tedavi öncesi değişkenler eş değişkenleriniz olduğu için tedavi ile eğilim puanını hesaplamak için regresyon (sadece normal OLS veya logit, probit, vb.) Kullanılır. Eğilim skorunun iyi bir tahmininin elde edilmesinden sonra, benzer eğim skorlarına sahip, ancak farklı tedaviler alınan kişiler birbiriyle eşleştirilir. Tedavi etkisi, bu iki grup arasındaki ortalama farktır.

Rosenbaum ve Rubin (1983), sadece eğilim puanını kullanan eşleştirilmiş tedavi ve kontrol deneklerinin, skoru oluşturmak için kullanılan gözlenen işlem öncesi değişkenlerden kaynaklanan tedavi etkisinin tahminindeki tüm önyargıları gidermek için yeterli olduğunu göstermektedir. Bu ispatın bir tahmin yerine gerçek eğilim puanının kullanılmasını gerektirdiğini unutmayın. Bu yaklaşımın avantajı, birden fazla boyutta (her işlem öncesi ortak değişken için bir tane) eşleşme sorununu tek değişkenli bir eşleştirme durumuna - büyük bir basitleştirmeye dönüştürmesidir.

Rosenbaum, Paul R. ve Donald B. Rubin. 1983. " Nedensel Etkiler için Gözlemsel Çalışmalarda Eğilim Puanının Merkezi Rolü ." Biometrika. 70 (1): 41-55.


8

Sadece prospektif bir randomize deneme nedensellik belirleyebilir. Gözlemsel çalışmalarda, her zaman nedensellik atfetmeyi imkansız kılan ölçülmemiş veya bilinmeyen bir ortak değişken olma şansı olacaktır.

Bununla birlikte, gözlemsel araştırmalar, x ve y arasında güçlü bir ilişkinin kanıtını sağlayabilir ve bu nedenle hipotez oluşturma için yararlıdır. Bu hipotezlerin daha sonra randomize bir deneme ile onaylanması gerekir.


Sana tamamen katılıyorum. Gözlemsel bir çalışma, daha sıkı bir çerçeve kullanarak test edebileceğiniz bazı ilişkileri ortaya çıkarmak için iyi olabilir (önerdiğiniz gibi randomize deneme).
Sympa

Temiz ifade. X ve y arasındaki 'güçlü' dernek kelimesi ile daha fazla aynı fikirde olamazsınız.
Kevin Kang

7

Soru, gerçekten ayrı olarak düşünülmesi gereken iki şeyi içeriyor gibi görünüyor. Birincisi, gözlemsel bir çalışmadan nedensellik çıkarıp çıkaramayacağı ve bunun üzerine, süreci doğru bir şekilde modelleyebildiğiniz sürece evet diyen Pearl (2009) 'un görüşlerini zıtlaştırabilirsiniz (propofol). Gerber ve ark. (2004) tarafından deneysel disiplinlerde birçok müttefik bulup, (oldukça belirsiz fakat yine de iyi) bir makalede ifade edilen düşüncelerin bazılarını paylaşabileceklerdir. İkincisi, nedenselliğin gözlemsel verilerden çıkarılabileceğini düşündüğünü varsayarsak, eğilim puanlama yöntemlerinin bunu yaparken yararlı olup olmadığını merak edebilirsiniz. Eğilim skoru yöntemleri çeşitli koşullandırma stratejilerinin yanı sıra ters eğilim ağırlıklandırmasını da içerir. Lunceford ve Davidian (2004) tarafından güzel bir derleme yapılmıştır.

Yine de küçük bir kırışıklık: eğim skoru eşleştirme ve ağırlıklandırma, örneğin, "dolaylı etkilerin" hesaplanmasına ilgi duyulduğunda ve ayrıca potansiyel olarak rastlantısal olmayan yıpranma veya düşme problemleri olduğunda, randomize deneylerin analizinde de kullanılır ( bu durumda sahip olduğunuz gözlemsel bir çalışmaya benzer.

Referanslar

Gerber A, vd. 2004. "Gözlemsel araştırmalardan öğrenme yanılsaması." Shapiro'da ben ve ark., Politika Çalışmalarında Sorunlar ve Yöntemler , Cambridge University Press.

Lunceford JK, Davidian M. 2004. "Nedensel tedavi etkilerinin tahmininde eğilim skoru ile tabakalaşma ve ağırlıklandırma: karşılaştırmalı bir çalışma." Tıp İstatistikleri 23 (19): 2937–2960.

Pearl J. 2009. Nedensellik (2. Basım) , Cambridge University Press.


Bütün kitabı Pearl'den alıntıladın.
chl

0

Geleneksel bilgelik, yalnızca randomize kontrollü çalışmaların ("gerçek" deneyler) nedensellik tanımlayabildiğini belirtir.

Ancak, bu kadar basit değil.

Randomizasyonun yetersiz kalmasının bir nedeni, "küçük" örneklerde, çok sayıda kanunun her bir farklılığın dengelenmesini sağlamak için "yeterince" güçlü olmamasıdır . Soru şudur: "çok küçük" nedir ve ne zaman "yeterince büyük" başlar? Saint-Mont (2015) burada “yeterince büyük” in binlerceda başlayabileceğini savunuyor (n> 1000)!

Ne de olsa, amaç gruplar arasındaki farklılıkları dengelemek, farklılıkları kontrol etmek. Bu nedenle, deneylerde bile gruplar arasındaki farkları dengelemek için büyük özen gösterilmelidir. Saint-Mont (2015) 'in hesaplamalarına göre, daha küçük örneklerde, eşleştirilmiş (manuel olarak dengelenmiş) örneklerle bir miktar daha iyi olabilir.

Olasılık ile ilgili olarak. Elbette, olasılık asla kesin bir cevap veremez - olasılık aşırı olmadığı sürece (sıfır veya bir). Ancak, bilimde, sık sık karşılaştığımız durumlarla karşı karşıya olduğumuzu tespit ettik, çünkü şeyler zor olduğu için kesin bir cevap veremiyoruz. Bu yüzden olasılık ihtiyacı var. Olasılık, belirsizliğimizi bir ifadeyle ifade etmekten başka bir şey değildir. Bu nedenle, mantığa benzer; Briggs'i (2016) burada görebilirsiniz .

Dolayısıyla, olasılık bize yardımcı olacak ama kesin cevaplar vermeyecek, kesin değil. Ancak belirsizliği ifade etmek çok faydalıdır.

Ayrıca nedenselliğin temelde istatistiksel bir soru olmadığını unutmayın. İki aracın "önemli ölçüde" farklı olduğunu varsayalım. Gruplama değişkeninin, ölçülen değişkendeki farkın nedeni olduğu anlamına gelmiyor mu? Hayır (zorunlu değil). Hangi özel istatistiğin kullandığı önemli değildir - eğilim puanı, p değerleri, Bayes Faktörleri ve benzeri - böyle yöntemler (pratik olarak) nedensel iddiaları desteklemek için asla yeterli değildir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.