Eğilim skor eşleştirmesi neden nedensel çıkarım için çalışır?


13

Eğilim skor eşleştirmesi gözlemsel çalışmalarda nedensel çıkarımlar yapmak için kullanılır (bakınız Rosenbaum / Rubin makalesi ). Neden çalıştığının ardındaki basit sezgi nedir?

Başka bir deyişle, neden tedaviye katılma olasılığının iki grup için eşit olduğundan emin olursak, karıştırıcı etkiler ortadan kalkar ve sonucu tedavi hakkında nedensel sonuçlar çıkarmak için kullanabiliriz?


8
Benimki muhtemelen popüler olmayan bir fikir, ama PSM'nin nedensel çıkarımlar yapmanıza izin verdiğini söylemek biraz geriyor. Evet, bir avuç değişken üzerinde "kaba" eşleşmeden daha iyi bir eşleştirme yöntemidir, ancak günün sonunda, yalnızca yalnızca sizin için gözlemlenebilir olan değişkenlerle eşleştirilirsiniz. Hala endojen tedaviniz olabilir, ancak eşleştikten sonra tedavinin eksojen olduğunu varsayarsınız . Ama sonra tekrar, ben hiç kimse Rubin beğenileri ile karşılaştırıldığında :)
Marquis de Carabas

5
Rosenbaum ve Rubin ile aynı fikirde olmayanlar var. Gary King, PSM kullanarak eşleştirmeden elde edilen sonuçların Mahalanobis mesafesine göre eşleştirmeden elde edilen sonuçlardan daha düşük olduğunu oldukça etkili bir şekilde tartıştı. Buradaki makalesine bakın ... gking.harvard.edu/files/gking/files/psnot.pdf?m=1456683191 Ayrıca, bu web semineri daha da etkileyici kanıtlar sunuyor ... method-colloquium.com/…
Mike Hunter

4
Teoride, tüm varsayımların karşılanması durumunda Rubin'in nedensel modelini uygulayarak nedensel çıkarım yapabilirsiniz. Ama elbette şeytan her zaman varsayımın ayrıntılarındadır ve benim için gözlemlenmeyen çelişkilerin varsayımı genellikle zor bir şeydir. Aslında kanıtlamak imkansız. Ancak, gözlemlenmeyen karışıklıklarınız varsa sonuçlarınızın değişmesinin ne olacağını belirlemek için en azından duyarlılık analizleri yapabilirsiniz.
StatsStudent

5
İyi nokta @DJohnson. Ayrıca, "çarpışan" olarak adlandırdığı şeyden dolayı "M-önyargısı" oluşturma olasılığı nedeniyle, Rubin'in Potansiyel Çıktılar Çerçevesi'ni eleştiren Judea Pearl, Ian Shrier ve Arvid Sjolander'ın beğenileri de var. Bunlar ilginç okumalardır ve Rubin'in okumalarını tamamlamalıdır.
StatsStudent

Yanıtlar:


12

Size matematiğe en az vurgu yaparak sezgisel bir anlayış sunmaya çalışacağım.

Gözlemsel veri ve ondan kaynaklanan analizlerle ilgili temel sorun kafa karıştırıcıdır. Karışıklık, bir değişken sadece atanan tedaviyi değil aynı zamanda sonuçları da etkilediğinde ortaya çıkar. Randomize bir deney yapıldığında, denekler tedavilere randomize edilir, böylece ortalama olarak her tedaviye atanan denekler eş değişkenlere (yaş, ırk, cinsiyet, vb.) Benzer olmalıdır. Bu randomizasyonun bir sonucu olarak, (özellikle büyük örneklerde), sonuçtaki farklılıkların herhangi bir ortak değişkene bağlı olması olası değildir, ancak uygulanan tedavi nedeniyle, ortalama olarak, tedavi gruplarındaki ortak değişkenler benzerdir.

Öte yandan, gözlemsel verilerle, deneklere tedavileri atayan rastgele bir mekanizma yoktur. Örneğin, yeni bir kalp ameliyatı sonrasında standart bir cerrahi prosedüre kıyasla hastaların hayatta kalma oranlarını incelemek için bir çalışma alın. Tipik olarak, etik nedenlerden ötürü hastaları her prosedüre randomize edemez. Sonuç olarak hastalar ve doktorlar, genellikle ortak değişkenleri ile ilgili bir dizi nedenden dolayı tedavilerden birine kendileri seçerler. Örneğin, yeni prosedür daha yaşlıysanız biraz daha riskli olabilir ve sonuç olarak doktorlar yeni tedaviyi genç hastalara daha sık önerebilir. Bu olursa ve hayatta kalma oranlarına bakarsanız, yeni tedavi daha etkili gibi görünebilir, ancak genç hastalar bu tedaviye atandığı ve genç hastalar daha uzun yaşama eğilimi gösterdiğinden, bu yanıltıcı olacaktır, Her şey eşit. Eğilim puanlarının işe yaradığı yer burasıdır.

Eğilim skorları, nedensel çıkarımın temel sorununa yardımcı olur - deneklerin tedavilere randomize edilmemesi nedeniyle kafa karıştırıcı olabilirsiniz ve bu sadece müdahale veya tedaviden ziyade gördüğünüz "etkilerin" nedeni olabilir. Analizinizi bir şekilde değiştirebilmeniz için, değişkenler (örneğin yaş, cinsiyet, cinsiyet, sağlık durumu gibi) tedavi grupları arasında “dengeli” ise, sonuçlardaki farkın müdahale / tedaviden kaynaklandığına dair güçlü kanıtlarınız olacaktır. bu değişkenlerden ziyade. Eğilim skorları, gözlemlenen kovarit seti göz önüne alındığında, her bir deneğin tedaviye atanma olasılığını belirler. Daha sonra bu olasılıklarla eşleşirseniz (eğilim puanları),

Neden ortak değişkenlerle tam olarak eşleşmediğini sorabilirsiniz (örn. Tedavi 1'de sağlıklı 40 yaşındaki erkeklerle tedavi 1'de 40 sağlıklı erkeklerle sağlıklı bir şekilde eşleştirdiğinizden emin olun)? Bu, büyük numuneler ve birkaç ortak değişken için iyi çalışır, ancak örnek boyutu küçük olduğunda ve ortak değişkenlerin sayısı orta derecede olduğunda bile neredeyse imkansız hale gelir (neden böyle olduğu için Çapraz Onaylanmış boyutlandırmanın lanetine bakın) .

Şimdi, tüm bunlar söyleniyor, eğilim skoru Aşil topuğu, gözlemlenmeyen bir çelişki olmadığı varsayımıdır. Bu varsayım, düzenlemenize olası çelişkiler olan herhangi bir ortak değişken dahil edemediğinizi belirtir. Sezgisel olarak, bunun nedeni, eğilim puanınızı oluştururken bir karıştırıcı eklemediyseniz, bunun için nasıl ayarlayabileceğinizdir. Bir denek için verilen tedavinin diğer deneklerin potansiyel sonuçlarını etkilemediğini belirten, kararlı birim tedavi değeri varsayımı gibi ek varsayımlar da vardır.


7

Katı bir anlamda, eğilim skoru ayarlamasının nedensel çıkarım ile ilgisi, regresyon modellemesinden daha fazla değildir. Eğilim skorları ile tek gerçek fark, daha fazla gözlenen potansiyel çelişkileri için ayarlama yapmanın, numune boyutunun regresyon modellerinin dahil edilmesine izin verebileceğinden daha kolay hale getirmeleridir. Eğilim skoru ayarlaması (vakaların çoğunda, logit PS'de bir spline kullanılarak ortak değişken ayarlaması yoluyla yapılır), azalmanın önemli bir eksen boyunca karıştırıldığı bir veri azaltma tekniği olarak düşünülebilir. Bununla birlikte, sonuç heterojenliğini (duyarlılık yanlılığı) ele almaz, bu nedenle de eğilimleri kullanırken bile önemli önemli ortak değişkenleri ayarlamanız gerekir (ayrıca oranların ve tehlike oranlarının çökmemesiyle ilgili sorunlara da bakın).

Eğilim skoru eşleştirmesi birçok gözlemi hariç tutabilir ve bu nedenle çok verimsiz olabilir. İlgili gözlemleri hariç tutan herhangi bir yöntemi sorunlu görüyorum. Eşleştirmeyle ilgili asıl sorun, 1: 1 eşleşmeye ihtiyaç duyulan bazı algılanan ihtiyaçlar nedeniyle kolayca eşleştirilebilen gözlemleri hariç tutması ve çoğu eşleşen algoritmanın gözlem sırasına bağlı olmasıdır.

Çakışmayan bölgeleri kontrol etmek ve hariç tutmak için karıştırmak için standart regresyon ayarlaması yaparken çok kolay olduğunu unutmayın. Eğilim skoru kullanıcılarının bunu yapması öğretilir ve regresyon modelcilerinin yapmamasının tek nedeni öğretilmemesidir.

Eğilim skoru analizi, maruziyetle olan etkileşimleri gizler ve eğilim skoru eşleşmesi, PS ve tedavi etkisi arasında olası bir ilişkiyi de gizler.

PS için duyarlılık (ölçülmemiş çelişkilere karşı) analizi yapılmıştır, ancak standart regresyon modellemesi ile daha da kolaydır.

PS'yi tahmin etmek için esnek regresyon yöntemleri kullanırsanız (örn. Sürekli değişkenlerin doğrusal hareket ettiğini varsaymayın) dengeyi kontrol etmeniz bile gerekmez - denge olmalı veya PS regresyon modeli başlangıçta doğru bir şekilde belirtilmemiş olmalıdır . Sadece çakışmayanları kontrol etmeniz gerekir. Bu, eğilim modelinden çıkarılmış önemli bir etkileşim olmadığını varsayar. Eşleştirme aynı varsayımı yapar.


3

Çoğunlukla Zararsız Ekonometri'ye göz atmanızı öneririm - bunun sezgisel düzeyde iyi bir açıklaması var.

xbeny0ben,y1benxy0ben,y1benxy0ben,y1ben tedavi ile ilişkili.

xxxxx

xxxx

y0ben,y1benxbenp(xben)p(x)xx

p(x)xxxy0ben,y1bentedavi ile ilgisi yoktur. Bu durum, işlenmiş ve işlenmemişler arasındaki alt numune ortalama sonuç farkının, bu alt numune üzerindeki ortalama tedavi etkisinin tutarlı bir tahmini olmasını sağlar;

E[yben|İşlenmiş,p(x)]-E[yben|İşlenmemiş,p(x)]

lokal ortalama tedavi etkisinin tutarlı bir tahminidir.

Daha fazla okuma:

Uygulamada eğilim skoru eşleştirmesini gerçekten kullanmalı mıyız?

Eşleştirme ve regresyonu karşılaştıran ilgili soru


1

Regresyonun "aynı şekilde" çalıştığı için "çalışır" - tüm karıştırıcı faktörleri kontrol ediyorsunuz.

Bu tür analitik kontrolü, belki de çok sayıda karıştırıcı değişken içeren tam olarak belirlenmiş bir regresyon modeli veya sadece bir değişkene sahip bir regresyon modeli - eğilim skoru (aynı çelişkilerden oluşan eşit derecede karmaşık bir model olabilir veya olmayabilir) ile gerçekleştirebilirsiniz. Eğilim skoruna karşı bu regresyona bağlı kalabilirsiniz veya benzerliğin eğilim skoru ile tanımlandığı benzer gruplar içindeki yanıtı karşılaştırabilirsiniz. Ruh olarak aynı şeyi yapıyorsunuz, ancak bazı insanlar ikinci yöntemin eldeki nedensel görevi daha iyi vurguladığını düşünüyor.

Aşağıdaki geri bildirimi güncelle

Y(0),Y(1)T|XY(0),Y(1)T|p(X),
ve tedavinin eğilim puanlarının ve en yakın kontrol vakasının maksimum mesafe içinde olması gereken "kumpas eşleşmesi" (s. 108) adı verilen en yakın komşu eşleşmenin yaklaşık bir versiyonunu okuyun, bu da bazı tedavi vakalarının eşleşmeler olmadan sonuçlanmasına neden olur. Bu durumda, yöntem hala regresyona parametrik olmayan bir analog kullanarak eğilim skorunu ayarlayarak işe yarayacaktır, ancak aynı zamanda tek başına verilerden (tahmin edilebilecek bir model olmadan) neyin bilinemeyeceğini ve yeniden tanımlanmasına izin vererek açıklığa kavuşacaktır. mevcut veriler verilen nedensel miktar.

1
Bu cevabın beğenilmemesi gerekir, çünkü nedensel çevrelerde kirli bir kelime olan regresyon ile karşılaştırılarak eğilim skoru yöntemlerini ucuzlaştırır. Ancak önde gelen cevap, "eğilim puanının Aşil topuğu, gözlemlenmeyen bir çelişki olmaması varsayımıdır." Bu oldukça büyük Aşil topuğu. Varsayımın karşılandığını ve evrendeki tüm karışıklıkları içeren bir veri setim olduğunu varsayalım. Regresyonun nedensel gerçeği ortaya çıkarmak için neden işe yaramadığını, ancak eğilim skor eşleşmesinin neden işe yaradığını anlamama yardımcı olun.
Ben Ogorek

1
Regresyonun genellikle sorunlu olmasının nedeni, regresyondan elde edilen sonuçların tahmin edilmesidir. Eğilim skorları ile, ortak denge kontrolleri sırasında, tedavi grupları arasında yeterli karışıklık çakışması olduğundan emin olunur. Regresyonda durum böyle değildir ve yanlış tahminlere yol açabilir, çünkü regresyon modelinizin ekstrapolasyon yaptığını söyleyecek standart bir teşhis kontrolü yoktur. Bu nedenle, sadece bir regresyon modeli çalıştırıyor olsam ve eğilim puanlarını kendileri kullanmayı düşünmese bile genellikle eğilim skoru dengeleme kontrolleri yaparım.
İstatistiklerÖğrenci
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.