Araçların olmadığı durumlarda gözlemsel verilerdeki modeller hakkında ne söyleyebiliriz?


10

Geçmişte, regresyonların (ve panel modelleri veya GLM'ler gibi ilgili modellerin) gözlemsel verilerde (yani kontrollü deney tarafından üretilmeyen veriler) kullanıldığı bir dizi alanda yayınlanmış makalelerle ilgili olarak bana sorulan bir dizi sorum vardı. , birçok durumda - ancak her zaman değil - zaman içinde gözlemlenen veriler), ancak enstrümantal değişkenleri tanıtmak için hiçbir girişimde bulunulmadığında.

Yanıt olarak bir takım eleştiriler yaptım (önemli değişkenler eksik olduğunda önyargı ile ilgili sorunları tanımlamak gibi), ancak buradaki diğer insanlar şüphesiz bu konuda benden çok daha bilgili olacağından, soracağımı düşündüm:

  1. Bu gibi durumlarda ilişkilerle ilgili sonuçlara varmaya çalışmanın başlıca sorunları / sonuçları nelerdir (özellikle de nedensel sonuçlarla sınırlı değildir)?

  2. Enstrüman yokluğunda bu modellere uyan çalışmalarla faydalı bir şey yapılabilir mi?

  3. Böyle bir modellemeyle ilgili konularda bazı iyi referanslar (kitaplar veya makaleler) (tercihen sonuçların net teknik olmayan motivasyonu ile, çünkü genellikle soran insanlar, bazılarının çok fazla istatistik içermeyen) çeşitli arka planlarına sahiptirler. Kağıt? Önlemlerin / sorunların araçlarla tartışılması da yararlı olacaktır.

(Enstrümantal değişkenlerle ilgili temel referanslar buradadır , ancak orada eklemek için herhangi bir şeyiniz varsa, bu da yardımcı olacaktır.)

Enstrüman bulma ve kullanma konusunda iyi pratik örneklere işaret etmek bir bonus olacaktır, ancak bu sorunun merkezinde yer almaz.

[Bu tür sorular bana geldiği için başkalarını burada iyi yanıtlara yönlendireceğim. Onları alırken bir veya iki örnek ekleyebilirim.]

Yanıtlar:


8

Dolayısıyla, alanımın büyük çoğunluğu (en çok çalıştığım kısım olmasa da) sadece bununla ilgilidir - GLM tipi modellerin gözlemsel verilere uyması. Çoğunlukla, enstrümantal değişkenler, tekniğe aşina olmadığından veya en önemlisi iyi bir enstrümanın eksikliğinden dolayı nadirdir. Sorularınızı sırayla ele almak için:

  1. Asıl mesele, elbette, hem maruz kalma hem de sonuçla ilişkili olan gözlemlenmemiş bir değişken tarafından bir tür artık karışıklıktır. Düz dil sürümü, cevabınızın yanlış olabileceği, ancak nasıl veya neden olduğunu bilmediğiniz anlamına gelmez. Bu bilgilere ilişkin verilen kararlar (belirli bir tedavinin kullanılıp kullanılmayacağı, ortamdaki X olayının tehlikeli olup olmadığı vb.) Yanlış bilgiler kullanılarak alınan kararlardır.

  2. Bunun cevabının evet olduğunu iddia ediyorum çünkü çoğunlukla bu çalışmalar mutlaka iyi bir enstrümanın bulunmadığı veya randomizasyonun imkansız olduğu bir şeye ulaşmaya çalışıyor. Yani, aşağıya gelince, alternatif "Sadece tahmin et". Bu modeller, başka bir şey değilse, düşüncelerimizin resmileştirilmesi ve cevaba yaklaşmaya yönelik sağlam bir girişimdir ve bununla uğraşmak daha kolaydır.

Örneğin, cevabınızı niteliksel olarak değiştirmek için önyargının ne kadar ciddi olması gerektiğini sorabilirsiniz (örneğin, "Evet, X sizin için kötü ...") ve bilinmeyen bir faktör olduğu makul olup olmadığını değerlendirebilirsiniz verilerinizin dışında gizlenen o gücün

Örneğin, HPV enfeksiyonunun serviks kanseri ile son derece güçlü bir şekilde ilişkili olduğu bulgusu önemli bir bulgudur ve sıfır değerine kadar tüm yolların şaşırtıcı derecede güçlü olması gerektiğini saptayan ölçülemeyen bir faktörün gücüdür.

Ayrıca, bir aletin bunu düzeltmediğine dikkat edilmelidir - sadece bazı ölçülmemiş ilişkilendirmeler olmadığı için çalışırlar ve hatta randomize çalışmalar bile problemlerden muzdariptir (tedavi ve kontroller arasındaki diferansiyel ayrılma, randomizasyon sonrası herhangi bir davranış değişikliği, gerçekliğe genelleştirilebilirlik) hedef popülasyon) da biraz fazla parlıyor.

  1. Rothman, Grönland ve Lash, modern Epidemiyolojinin en son baskısını yazdı. Bu kitap aslında bunları en iyi şekilde yapmaya çalışmak için ayrılmış bir kitap.

8

Epidemiyolog tarafından Fomite tarafından gösterilen görüşün aksine, enstrümantal değişkenler ekonomide oldukça erken öğretilen önemli bir araç setidir. Bunun nedeni, günümüzde ekonomik araştırmalarda nedensel soruları cevaplamaya çalışmak üzerine yoğun bir odaklanılmasıdır; Temel sınırlama, ekonominin rastgele deneyler yapmak zor olsa da bir alandır. Erken bir ebeveyn ölümünün çocuğun uzun dönem eğitim sonuçları üzerindeki etkisini bilmek istersem, çoğu insan bunu randomize bir kontrol yolu ile yapmaya itiraz eder - ve haklı olarak. Bu bildiri bir MİT dersten sayfa deneylerle vardır başka hangi konuların 3-5 özetliyor.

Her noktayı sırayla ele almak için:

  1. Yanıtlanacak soruya bağlı olarak, deneysel olmayan yöntemler kullanılmadan gözlemsel veriler üzerinde yapılan analizleri geçersiz kılabilen değişkenler atlanmaz. Seçim sorunları, ölçüm hatası, ters nedensellik veya eşzamanlılık aynı derecede önemli olabilir. Ana sorun , veri analistinin bu ayarın sınırlamalarının farkında olması gerektiğidir. Bu, esas olarak iş örneğini ifade eder, çünkü akademik bir senaryoda bu hızlı bir şekilde ortaya çıkacaktır. Bazen bir müşteriyi bilgilendirmek için fiyat esnekliğini tahmin etmek isteyen piyasa analistlerini görüyorum (örneğin, fiyatları artırdığımızda talep ne kadar azalır)x%), böylece bir talep denklemi tahmin ederler ve talep ve arzın aynı anda belirlendiği ve birinin diğerini etkilediği gerçeğini tamamen unutur veya görmezden gelirler. Bu nedenle sonuçlar , araştırmacının / veri analistinin verilerin kendisinden ziyade verilerin sınırlamaları konusunda farkındalığına bağlıdır, ancak ortaya çıkan sonuçlar, önemsiz bir şeyden insanların yaşamlarını olumsuz yönde etkilediği bir alana kadar değişebilir.

  2. Dbengözlemlenen tedavi etkisini açıklamak için bu tedavinin etkisini hesaplayabilir, gözlemlenemeyen maddeler için aynısını yapabilir ve gözlemlenemeyen maddelerdeki kaymanın ne kadar büyük olması gerektiğini sorabilirsiniz. Gözlenmemiş kayma çok büyük olursa, bulgularımıza karşı biraz daha güvenilir olabiliriz. Bunun referansı Altonji, Elder ve Taber'dir (2000) .
  3. Muhtemelen uygulanan herhangi bir ekonomist Angrist ve Pischke (2009) "Çoğunlukla Zararsız Ekonometri" yi tavsiye eder. Bu kitap esas olarak lisansüstü öğrenciler ve araştırmacılar için tasarlanmış olsa da, matematik bölümlerini atlamak ve sadece güzel açıklanmış sezgiyi almak mümkündür. İlk önce deneysel bir ortam fikrini ortaya koyarlar, daha sonra OLS ve atlanan değişkenlerden endojenlik, eşzamanlılık, seçim vb. Ayrıca zayıf enstrümanlar gibi enstrümantal değişkenlerle ilgili sorunları tartışırlar veya çok fazla kullanırlar. Angrist ve Krueger (2001) ayrıca enstrümantal değişkenlere ve potansiyel tuzaklara teknik olmayan bir genel bakış sunar ve ayrıca çeşitli çalışmaları ve enstrümanlarını özetleyen bir tabloya sahiptir.

Muhtemelen tüm bunlar, burada olması gereken tipik bir cevaptan çok daha uzundu ancak soru çok geniştir. Sadece enstrümantal değişkenlerin (genellikle bulmak zor olan) cebimizdeki tek mermi olmadığı noktasını vurgulamak istiyorum. Gözlemsel verilerden nedensel etkileri farklılıklar, regresyon süreksizlik tasarımları, eşleştirme veya sabit etkiler regresyonu gibi (ortaya çıkanlar zamanla değişmezse) ortaya çıkarmak için deneysel olmayan başka yöntemler de vardır. Bunların hepsi Angrist ve Pischke'de (2009) ve başlangıçta bağlantılı olan çalışma kâğıdında tartışılmıştır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.