Eğilim puanları bir regresyonda kovaryantlar eklemekten ne kadar farklıdır ve ikincisi ne zaman tercih edilir?


41

Eğilim puanları ve nedensel analizler için nispeten yeni olduğumu kabul ediyorum.

Yeni gelen biri olarak benim için açık olmayan bir şey, eğilim puanlarını kullanarak “dengelemenin” bir regresyonda eş değişkenler eklediğimizde olanlardan matematiksel olarak nasıl farklı olduğu? Operasyonda farklı olan nedir ve neden regresyona alt popülasyon eş değişkenleri eklemekten daha iyidir?

Yöntemlerin ampirik bir karşılaştırmasını yapan bazı çalışmalar gördüm, ancak iki yöntemin matematiksel özellikleriyle ilgili iyi bir tartışma görmedim ve PSM'nin neden regresyon değişkenleri de dahil olmak üzere neden nedensel yorumlara yol açtığını görmedim. Ayrıca, bu alanda daha fazla kafa karışıklığı ve tartışma yaşanmış gibi görünüyor; bu da işleri daha da zorlaştırıyor.

Bu konuyla ilgili herhangi bir düşünceniz veya ayrımcılığı daha iyi anlayabilmeniz için iyi kaynaklar / bildirilerle ilgili işaretçiler var mı? (Judea Pearl'ün nedensellik kitabında yavaşça ilerliyorum, bu yüzden beni buna işaret etmenize gerek yok)


3
2007'yi Morgan ve Winship'i okumanı tavsiye ederim . Bölüm 4 ve 5, nedensel etkinin tanımlanması için açık bir regresyon ve kontrast kontrastı ve eşleştirme yapar.
conjugateprior 19

1
Denge istatistiklerini kontrol ettiğinizde, çok boyutlu ortak değişken alanına göre karşılaştırdığınız tedavi grupları arasında ekstrapolasyon olmadığından emin olursunuz. Regresyon, bunu kontrol etmeden basitçe tahmin eder, böylece tahminler kötü tahminler verebilir.
StatsStudent

Yanıtlar:


17

Büyük farklardan biri, regresyonun bu özellikleri doğrusal bir şekilde "kontrol etmesi" dir. Eğilim puanlarıyla eşleştirme doğrusallık varsayımını ortadan kaldırır, ancak bazı gözlemler eşleştirilemediğinden, belirli gruplar hakkında hiçbir şey söyleyemeyebilirsiniz.

Örneğin, bir işçi eğitimi programı okuyorsanız, tüm kayıtlı kişilerin erkek olmalarını sağlayabilirsiniz, ancak katılımcı olmayan nüfus kontrolü kadınlardan ve erkeklerden oluşur. Regresyon kullanarak, katılım göstergesi değişkeninden ve erkek göstergesinden gelir elde edebileceğinizi söyleyebilirsiniz. Tüm verilerinizi kullanır ve programa katılmış bir kadının gelirini tahmin edebilirsiniz.

Eşleştirme yapıyor olsaydın, sadece erkekleri erkeklerle eşleştirebilirdin. Sonuç olarak, analizinizde hiçbir kadını kullanmazsınız ve sonuçlarınız onlara aittir.

Regresyon, doğrusallık varsayımını kullanarak tahmin edebilir, ancak eşleştirme yapamaz. Diğer tüm varsayımlar, regresyon ve eşleştirme arasında temelde aynıdır. Regresyon üzerinden eşleştirmenin faydası parametrik olmadığıdır (eşleştirme işleminizi böyle yapıyorsanız, doğru eğilim puanına sahip olduğunuzu varsaymanızın dışında).

Daha fazla tartışma için, yoğun şekilde eşleştirme yöntemlerine odaklanan bir kurs için sayfamı inceleyin . Bkz. Özellikle Nedensel Etkiler Tahmin Stratejisi Varsayımları .

Ayrıca, eğilim puanları eşleşmesini gösteren Rosenbaum ve Rubin (1983) makalesine de dikkat edin.

Son olarak, eşleştirme 1983'ten bu yana çok yol kat etti. Genetik eşleştirme algoritması hakkında bilgi edinmek için Jas Sekhon'un web sayfasına bakın .


3
Belki de bunun nedeni istatistikçi olmamam, ancak OP genel olarak regresyon hakkında soru sorduğunda lineer regresyon yaptığınız görülüyor. Fakat sanırım asıl amaç, herhangi bir regresöre eş değişkenler eklemenin girdi alanı hakkında bazı varsayımlar yapmasıdır, böylece yeni örneklere göre tahmin edilebilir ve eşleştirme, ne tür şeylerin tahmin edilebileceği konusunda daha temkinlidir.
rrenaud

2
Eğilim fonksiyonunu tahmin ederken, kafa karıştırıcı değişkenlerin fonksiyonel formu hakkında bazı varsayımlar yaparsınız. Ayrıca daha sonra eğilimin "yakın" değerlerine sahip bireylerle eşleşirsiniz, bu yüzden eğilim eğilimlerinin doğrusal olmayan karıĢtırıcı etki sorununu çözdüğünü hemen tahmin edemezdim.
AdamO

2
Bağlantılar koptu.
Carlos Cinelli

11

Kısa cevap, eğilim puanlarının özellikle nedensel yorumlama konusunda eşdeğer ANCOVA modelinden daha iyi olmadığı yönündedir.

Eğilim puanları, veri azaltma yöntemi olarak en iyi anlaşılır. Bunlar, birçok değişkeni tek bir puana düşürmenin etkili bir yoludur ve bir dizi değişkene olan ilginin etkisini ayarlamak için kullanılabilir. Bunu yaparken, çoklu değişkenler yerine tek bir eğilim puanı ayarlayarak özgürlük derecelerinden tasarruf edersiniz. Bu, kesinlikle istatistiksel bir avantaj sunar, fakat daha fazlası değil.

Eğilim puanları ile regresyon ayarlaması kullanılırken ortaya çıkabilecek bir soru, modelde yer alan eğilim puanını tahmin etmek için kullanılan tüm değişkenler ile bir regresyon ayarlaması yapmak yerine, eğilim puanının kullanımında herhangi bir kazanç olup olmadığıdır. Rosenbaum ve Rubin, "çok değişkenli X için bir kovaryans ayarının analizinden elde edilen tedavi etkisinin nokta tahmininin, aynı örnek kovaryans matrisi kullanıldığında, X bazında örnek doğrusal ayırıcı için tek değişkenli kovaryans ayarından elde edilen tahmile eşit olduğunu gösterdi. hem kovaryans ayarı hem de diskriminant analizi için ". Bu nedenle, her iki yöntemin de sonuçları aynı sonuca yol açmalıdır. Ancak, İki aşamalı prosedürü gerçekleştirmenin bir avantajı, birinin etkileşimler ve önce daha yüksek dereceli terimlerle çok karmaşık bir eğilim puan modeline uymasıdır. Bu eğilim puan modelinin amacı, tahmin edilen en iyi tedavi atama olasılığını elde etmek olduğundan, bu modelin aşırı parametrelenmesi ile ilgili değildir.

Gönderen:

RANDOMİZE OLMAYAN BİR KONTROL GRUBUNUN TEDAVİSİNİN KARŞILAŞTIRILMASINDA BİASAL AZALTILMASINA ÇEŞİTLİLİK SCORE YÖNTEMLERİ

D'Agostino (Rosenbaum ve Rubin'den alıntı)

D'agostino, RB 1998. Bir tedavinin randomize olmayan kontrol grubuyla karşılaştırılmasında yanlılık azaltma ile eşleşen eğilim skoru. İstatistiksel Tıp 17: 2265-2281.


5
(+1) Bu konudaki nedensellik konusu ile ilgili ilginç bir konu vardı, İstatistiksel bir bakış açısıyla, gözlemsel bir çalışma ile eğilim puanları kullanarak bir nedensellik çıkarımı olabilir mi? .
chl

3
Bu cevabın genel öncülüne katılıyorum, ancak eğilim puanlarına göre eşleştiğinde, tüm değişkenleri modele sokmakla aynı şey değildir (ve dolayısıyla sadece bir boyut küçültme tekniği değildir). Biri eğilim puanlarına göre ağırlıklandırıldığında da aynı değildir.
Andy W

1
Bu cevaba katılmıyorum. Tahmini eğilim puanları, tedavi ve kontrol gruplarındaki değişkenleri dengelediklerinde iyidir; Sadece bir regresyon koşullandırma yaklaşımı için olduğu gibi. 'Daha iyi' olmaları, yalnızca soruna soruna göre değişecek olan bu özelliğe bağlıdır.
conjugateprior

1
Aynı fikirde değilim, çünkü ölçüt, denge aynı, iki stratejinin de güçlü ve zayıf yönleri aynıdır. Soruna bağlı olarak kişi daha iyi bir yaklaşım olabilir veya olmayabilir. Aslında, ' eşdeğer ANCOVA modeli' bana iyi tanımlanmamış gibi görünüyor. (Eşdeğer nasıl?)
conjugateprior

1
Sağ. Şimdi 'eşdeğerin' ne anlama geldiğini anlıyorum, ancak teklifinizde 'Ancak' ile başlayan cümle ilgili farkı ortaya koyuyor: pratikte pervane. onlar olabilir böylece puanları ayrı ayrı tam tahmin edilmektedir yolu daha bilmenizi isterim analiz modelden daha. (Ve makalenin sonraki paragrafında alıntılanmayan başka bir fark var.)
conjugateprior

7

Muhtemel geniş bir referans, ancak eğer şansınız varsa, bu kitap bölümünü okumanızı tavsiye ederim ( Apel ve Sweeten, 2010 ). Sosyal bilimcilere yöneliktir ve belki de istediğiniz gibi matematiksel olarak zor değildir, ancak sorunuza tatmin edici bir cevaptan daha fazlası olacak kadar derinliğe inmelidir.

İnsanların eğilim puanlarını tedavi etmelerinin, bir regresyon modelinde sadece değişkenleri dahil etmekten farklı sonuçlara yol açabilecek birkaç farklı yolu vardır. Biri puanları eşleştiğinde, birinin tüm gözlemler için ortak bir desteği olması gerekmez (örneğin, birinin hiç bir zaman tedavi grubunda olma şansına sahip olmadığı, bazıları da her zaman tedavi grubunda olan bazı gözlemleri vardır). Ayrıca, gözlemler farklı sonuçlara yol açabilecek çeşitli şekillerde de ağırlıklandırılabilir.

Buradaki cevaplara ek olarak, alıntı yapılan soruya verilen cevapları da kontrol etmenizi öneririm . Eğilim puanlarının ardında, değişken değişken dengeyi sağlamak için yapılan istatistiksel bir numaradan daha fazla madde var. Rosenbaum ve Rubin tarafından çok alıntılanan makaleleri okuyup anlıyorsunuz; yaklaşımın neden bir regresyon modelinde eş değişkenlere eklemekten farklı olduğu daha açık olacak. Bence sorunuza daha tatmin edici bir cevap, eğilim puanlarının ardındaki matematikte değil, mantıkta olmak zorunda.


@Andy W Güncellenmiş yazımda, eşdeğerli regresyonun eşdeğerliği ve eğilim puanının ayarlanması üzerine Rosenbaum ve Rubin'den alıntılara bakın.
Brett,

0

PS'yi çalışmanın tamamen analizden ayrı bir tasarım bölümü olarak düşünmeyi seviyorum. Yani, tasarım (PS) ve analiz (regresyon vb.) Anlamında düşünmek isteyebilirsiniz. Ayrıca PS, ikili işlem için destekleyici bir değiş tokuş edilebilirlik aracı sunar; Belki başkaları da sonuç modeline ortak değişkenleri dahil edip etmeyebilirliği tam olarak destekleyip destekleyemeyeceğini veya bir sonuç modeline ortak değişkenleri dahil etmeden önce değiş tokuş edilebilirliği kabul edip etmediğini yorumlayabilir.


-3

Stat Metodları Med Arş. 2016 19 Nisan.

Eğilim skoru düzeltilmiş doğrusal olmayan regresyon modellerinde yanlılığın değerlendirilmesi.

Gözlemsel çalışmalarda koşullu tedavi etkisini tahmin ederken yaygınlık skoru metotları gözlemlenen karışıklığı ayarlamak için yaygın olarak kullanılır. Bir regresyon modelinde eğilim puanının değişken bir şekilde ayarlandığı popüler bir yöntem, doğrusal olmayan modellerde deneysel olarak önyargılı olduğu gösterilmiştir. Bununla birlikte, zorunlu bir teorik sebep sunulmamıştır. Doğrusal olmayan modellerde eğilim eğilimi ayarlı tedavi etkilerinin yanlılığını ve tutarlılığını araştırmak için yeni bir çerçeve öneriyoruz. Eğilim skoru tahmin edicisinin tutarlılığı ile doğrusal olmayan modellerin daraltılabilirliği arasında bir bağlantı oluşturmak için basit bir geometrik yaklaşım kullanıyor. Bu çerçevede, sonuç modelinde eğilim puanının ayarlanmasının, gözlemlenen değişkenlerin eğilim puanına ve geri kalan bir döneme ayrışmasıyla sonuçlandığını göstermektedir. Bu geri kalan terimin daraltılamayan bir regresyon modelinden çıkarılması, koşullu oran oranı ve koşullu tehlike oranının taraflı tahminlerine neden olur, ancak koşullu oran oranı için değil. Simülasyon çalışmaları ile, bu eğilim puanına göre düzeltilmiş tahmin edicilerdeki önyargının, daha büyük tedavi etkisi büyüklüğü, daha büyük değişken etkileri ve tedavi modelindeki değişkenlerin katsayıları ile sonuç modeline göre farklılıklarının artmasıyla arttığını da gösterdik.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.