Birden fazla değerlendirmeden sonra eğilim skoru eşleşmesi


34

Bu makaleye atıfta bulunuyorum : Hayes JR, Groner JI. "Araba koltukları ve emniyet kemeri kullanımının travma kayıt verilerinden kaynaklanan yaralanma ciddiyeti üzerindeki etkisini test etmek için çoklu değerlendirme ve eğilim puanları kullanmak." J Çocuk Cerrahisi. 2008 Mayıs; 43 (5): 924-7.

Bu çalışmada, 15 tam veri seti elde etmek için çoklu değerlendirme yapılmıştır. Her veri seti için eğilim puanları hesaplandı. Daha sonra, her gözlem birimi için, tamamlanmış 15 veri setinden birinden (ilgili eğilim skoru da dahil olmak üzere) rastgele bir kayıt seçildi, böylece daha sonra eğilim skoru eşleştirmesiyle analiz edilen tek bir son veri seti oluşturuldu.

Sorumlarım şunlardır: Birden fazla değerlendirmeden sonra eğilim puanları eşleştirmesini gerçekleştirmenin geçerli bir yolu var mı? Bunu yapmanın alternatif yolları var mı?

Bağlam için: Yeni projemde, 2 tedavi yönteminin etkilerini eğilim skoru eşleştirmesini kullanarak karşılaştırmayı hedefliyorum. Eksik veriler var ve MICEeksik değerleri uygulamak, ardından twangeğilim puanları eşleştirmesini yapmak ve sonra lme4eşleşen verileri analiz etmek için paketi R'de kullanmak niyetindeyim .

Update1:

Farklı bir yaklaşım gösteren bu makaleyi buldum : Mitra, Robin ve Reiter, Jerome P. (2011) Yinelenen, sıralı çoklu emirlerle eksik değişkenlerle eşleşme eğilimi puanı [Çalışma Raporu]

Bu yazıda yazarlar tüm hesaplanan veri kümelerindeki eğilim puanlarını hesapladılar ve daha sonra bunları ortalama alarak havuza yerleştirdiler;

Özgeçmişinizdeki herhangi birinin bu 2 farklı yaklaşımla ve / veya başka herhangi bir yorumla ilgili bir yorumda cevap vermesi gerçekten iyi olurdu.

Yanıtlar:


20

Söylenecek ilk şey, benim için, yöntem 1'in (örneklemenin) çok değersiz olduğu görünüyor - çoklu emperyalliğin faydalarını atıyor ve Stas tarafından belirtildiği gibi her gözlem için tek emeleye indirgiyor. Kullanmanın hiçbir avantajı göremiyorum.

Hill (2004): Hill, J.'de “Eksik Verilerden Etkilenen Gözlemsel Çalışmalarda Tedavi Etkisi Tahmininde Önyargıyı Azaltma” ( ISERP Çalışma Kağıtları, 2004). burada .

Belge, birden fazla değerlendirme (ve aynı zamanda eksik verilerle uğraşmanın diğer yöntemlerini) ve eğilim puanlarını kullanmaya yönelik iki yaklaşımı ele almaktadır:

  • çoklu değerlendirmeden sonra eğilim puanlarının ortalaması, ardından nedensel çıkarım (yukarıdaki yazınızda 2. yöntem)

  • Nedensel tahminlerin ortalaması alınarak takip edilen çoklu impurasyonlardan her bir eğilim puanları kümesi kullanarak nedensel çıkarım.

Ek olarak, makale, çıkarım modelinde sonucun öngörücü olarak dahil edilip edilmemesi gerektiğini ele almaktadır.

Hill, birçok verimin eksik verilerle başa çıkmadaki diğer yöntemlere tercih edilmesine karşın, genel olarak bir öncül olmadığını ileri sürmektedir.Bu tekniklerden birini diğerine tercih etme nedeni. Bununla birlikte, özellikle belirli eşleştirme algoritmaları kullanılırken eğilim puanlarının ortalamasını tercih etmenin nedenleri olabilir. Hill aynı makalede bir simülasyon çalışması yaptı ve sonuç çıkarımından önce eğilim puanlarının ortalamalarının alınmasının, sonuç modeline dahil edildiğinde, ortalama kare hatası açısından en iyi sonuçları verdiğini ve ilk puanların ortalamasını aldıklarını ancak sonuçların sonuçlarının alınmadığını buldu. Değerlendirme modelinde ortalama yanlılık açısından en iyi sonuçları üretti (tahmini ve gerçek tedavi etkisi arasındaki mutlak fark). Genel olarak, sonucun imparatorluk modeline dahil edilmesi önerilir (örneğin, buraya bakınız ).

Öyleyse, yöntem 2’nin gideceği yol bu.


1
2 numaralı yöntemi anlıyorum, ama bunu R'de nasıl uygulayacağımı bilemiyorum. Herhangi biri beni işaret edecek referansları var mı?
sam

2
Her iki yönteme ait R kodu, skeçte cobalt"Karmaşık Verilerle Kobalt Kullanımı" başlıklı paket için verilmiştir . Buradan erişebilirsiniz: CRAN.R-project.org/package=cobalt
Noah

13

İki paradigmanın çatışması olabilir. Çoklu empoze ağır model tabanlı Bayesçi bir çözümdür: doğru empoze kavramı temel olarak verilerin iyi tanımlanmış posterior dağılımından numune almanız gerektiğini belirtir, aksi halde mahvolursunuz. Öte yandan, eğilim puanları eşleştirmesi yarı parametrik bir işlemdir: eğilim puanınızı hesapladıktan sonra (nasıl olursa olsun, bir çekirdek yoğunluğu tahmini kullanmış olsaydınız, mutlaka bir logit model kullanmazsanız), gerisini yapabilirsiniz. diğer değişkenler için kontrol eden hiçbir model kalmadığından, şimdi parametrik olmayan aynı eğilim puanına sahip tedavi edilmiş ve tedavi edilmemiş gözlemler arasındaki farkları basitçe alarak. YaparımAbadie ve Imbens (2008) , bazı eşleşme durumlarında standart hataları doğru bir şekilde almayı imkansız hale getirdiğini tartışmıştır). Ters eğilim ile ağırlıklandırma gibi yumuşak yaklaşımlara daha fazla güvenirim. Bu konudaki en sevdiğim referans, “Empirikist Bir Arkadaş” olarak adlandırılan ve ekonomistlere yönelik “Çoğunlukla Zararsız Ekonometri” dir , ancak ekonomistlere yöneliktir, ancak bu kitabın diğer sosyal bilimciler, çoğu biyoistatistikci ve biyo olmayan istatistikçiler için de gerekli bir okuma olması gerektiğini düşünüyorum. Diğer disiplinlerin veri analizine nasıl yaklaştığını bildiklerini

Her halükarda, gözlem başına 15 benzetilmiş tam veri hattından sadece bir tanesini kullanmak, tek bir imparatorluğa eşdeğerdir. Sonuç olarak, tamamlanan 15 veri setine kıyasla verimliliği kaybedersiniz ve standart hataları doğru bir şekilde tahmin edemezsiniz. Bana her açıdan, eksik bir prosedür gibi görünüyor.

Tabii ki, halının altında, hem çoklu emirlik modelinin hem de eğilim modelinin, doğru değişkenlerin tüm doğru işlevsel biçimlerde olması anlamında doğru olduğu varsayımını memnuniyetle taradık. Bunu kontrol etmenin küçük bir yolu var (her iki yöntem için de teşhis önlemleri hakkında aksini duymaktan mutlu olmama rağmen).


(+1) Özellikle , eşleştirmenin gerçek anlamdaki uygulamasının getirdiği süreksizliklere karşı kendimi iyi hissetmiyorum (kontrolü eğilim eğilim puanının en yakın değerine sahip bul ve kalanını görmezden gel) . Eğilim puanlaması zaten her zaman oldukça zor bir prosedür oldu.
kardinal

@cardinal, güncellemeye bakın.
StasK

Aslında IPTW'nin diğer yöntemlerle eşleştirdiğimden daha fazla eleştirisini gördüm (okumam gerekecek). Eğilim puanlarına göre gerileme ağırlıklarına bakınız ( Freedman ve Berk, 2008 ) ve uygulamalı bir örnek için bkz. Bjerk, 2009 . Burada yanıt olarak neden Harmless Econometrics'i önerdiğinizden emin değilim , ancak gözlemsel çalışmalar ile ilgilenen herkes için hiç olmadığı kadar iyi bir öneri.
Andy

@Andy, Freedman ve Berk parçası, her şeyi bir lojistik regresyonda modelleyebildiğiniz zaman çok daha basit bir durumla başa çıkıyor. Anladığım kadarıyla, PSM gibi yöntemler çok daha fazla ortak değişkeniniz olduğunda çok daha karmaşık durumlarda uygulanır ve doğru bir şekilde belirtildiğini varsaymak için modele yeterince güvenmezsiniz. Durumun ağırlıklandırma için uygun olduğunu fark ettiler, ancak modelin diğer olası yöntemlere göre daha uygun olduğunu düşünüyorum.
StasK

2
Çünkü verileriniz kimliği belirsizdir ve ters Hessian'ın eşitliği ve degradenin dış ürünü ile ilgili en büyük olasılık olasılığı teoremi artık geçerli değildir ve bunların hiçbiri tutarlı bir sapma tahmini değildir. Sandviç varyans tahmincisi, anket istatistiklerinde aka doğrusallaştırma tahmincisi, ekonometride beyaz sağlam tahmin edici kullanılması gerekiyor.
StasK

10

Sorunun teorik yönleriyle gerçekten konuşamam, ancak PS / IPTW modellerini ve çoklu emirleri kullanarak deneyimimi vereceğim.

  1. Tek bir veri seti oluşturmak için çoklu çarpımlı veri kümeleri ve rastgele örnekleme kullanan birisini hiç duymadım. Bu mutlaka yanlış olduğu anlamına gelmez, ancak kullanımı garip bir yaklaşımdır. Veri seti, zaman ve hesaplama için sadece bir tane yerine 3-5 model çalıştırırken yaratıcılık kazanmanız için yeterince büyük değil.
  2. Rubin'in kuralı ve havuzlama yöntemi oldukça genel bir araçtır. Birleştirilmiş olarak göz önüne alındığında, çarpıtılmış sonuç yalnızca varyans ve tahminler kullanılarak hesaplanabilir, projeniz için kullanılamamasının bir nedeni yoktur - hesaplanan verileri oluşturma, her kümede analiz gerçekleştirme ve sonra havuzlama. Yaptığım şey, yaptığım şeydi ve yapmama konusunda özel bir gerekçeniz yoksa, daha egzotik bir şeyle gitmek için gerçekten bir neden göremiyorum - özellikle de ne olduğunu anlamıyorsanız yöntemi ile devam ediyor.

+1 Bu, çok özel bir makale gibi göründüğü için iyi bir cevap vermenin zor olduğu bir sorudur. Ancak, önceki benzer bir soruda ödülünü kaybetme iddiasına ek olarak, OP, metaya taşınan çözümler için yalvaran bir soru ekledi. Buradaki cevabımda sizinkine benzer yorumlar yaptım. Özellikle çarpılan emsalli veri setinden örnekleme konusunda şüpheliyim.
Michael R. Chernick

Teşekkürler ! Yöntem 2'nin kullanıldığı yerler için referansınız var mı?
Joe King

@JoeKing Ne yazık ki, başımın üstünden değil.
Fomite
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.