İkili enstrüman ve ikili endojen değişken ile enstrümantal değişken regresyonunda ikinci evre katsayısı nasıl yorumlanır?


11

(oldukça uzun yazı, özür dilerim. Çok fazla arka plan bilgisi içerir, bu yüzden alttaki soruya atlamaktan çekinmeyin.)

Giriş: İkili bir endojen değişkenin ( sürekli bir sonuç üzerindeki etkisini tanımlamaya çalıştığımız bir proje üzerinde çalışıyorum , . Rastgele olduğu gibi atandığına kesinlikle inandığımız bir araç geliştirdik .x1yz1

Veriler: Verilerin kendisi, 1000 birime yayılmış yaklaşık 34.000 gözlem ve yaklaşık 56 zaman periyodu içeren bir panel yapısındadır. yaklaşık 700 (% 2) gözlem için 1 değerini alır ve bunu yaklaşık 3000 (% 9) için alır. 111 (% 0.33) gözlem her ikisi üzerinde 1 puan ve ilgili ve bir gözlem üzerinde 1 puan için o kadar büyük olasılıkla iki kat de puanları 1 ise üzerine .x1z1z1x1x1z1

Tahmin: Stata'nın ivreg2 prosedürü ile aşağıdaki 2SLS modelini tahmin ediyoruz:

x1=π0+π1z1+Zπ+v
y=β0+β1x1+Zβ+u

Burada diğer dışsal değişken bir vektördür, tahmin edilen değer ilk aşamasından ve ve hata terimlerdir.Zx1x1uv

Sonuçlar: Her şey iyi çalışıyor gibi görünüyor; tahmini ilk aşamada oldukça önemlidir ve tahmini ikinci aşamada oldukça önemlidir. Diğer eksojen değişkenler için olanlar da dahil olmak üzere tüm işaretler beklendiği gibidir. Ancak sorun şu ki, - faiz katsayısı - tahmini büyüktür (ya da en azından yorumladığımız şekle göre).π1β1β1

y , ortalama 2 ve ortalama 17 ile yaklaşık 2 ila yaklaşık 26 arasındadır, ancak tahmini 30 ila 40 arasındadır (spesifikasyona bağlı olarak)!β1

Zayıf IV: İlk düşüncemiz, bunun enstrümanın çok zayıf olmasıydı; yani, endojen değişkenle çok fazla ilişkili değildir, ancak durum böyle görünmemektedir. Enstrümanın zayıflığını incelemek için , panel verisine sahip olduğumuz ve birim seviyesi).i.i.d.

AR testlerine göre, ikinci aşama katsayısı için% 95 güven aralığının alt sınırı 16 ile 29 arasındadır (yine spesifikasyona bağlı olarak). Reddetme olasılığı sıfıra yakın herhangi bir yerde tüm değerler için pratik olarak 1'dir.

Etkili gözlemler: Her bir birim ayrı ayrı kaldırılmış, her bir gözlem ayrı ayrı kaldırılmış ve birim kümeleri kaldırılmış olarak modeli tahmin etmeye çalıştık. Gerçek bir değişiklik yok.

Önerilen çözüm: Birisi, enstrümanlı orijinal metriğinde (0-1) tahmini etkisini , ancak öngörülen sürümünün metriğinde özetlememizi önerdi . ortalama ve medyan yaklaşık 0.02 ve SD yaklaşık 0.018 ile -0.01 ila 0.1 arasında değişmektedir. Biz tahmini etkisini özetlemek olsaydı bir tek SD artış, diyelim ki, tarafından , olurdu (diğer özellikler hemen hemen aynı sonuçları verir). Bu çok daha makul (yine de önemli) olacaktır. Mükemmel bir çözüm gibi görünüyor. Hiç kimsenin bunu yapmadığını görmedim; herkes ikinci aşama katsayıyı orijinal endojen değişkenin metriğini kullanarak yorumluyor.x1x1x1x10.01830=0.54

Soru: Bir IV modelinde, endojen değişkente bir artışın tahmini etkisini (gerçekten LATE) tahmin edilen versiyonunun metriğini kullanarak özetlemek doğru mu? Bizim durumumuzda, bu metrik olasılık tahmin edilmektedir.

Not: İkili bir endojen değişkenimiz olsa bile (ilk aşamayı LPM yapıyor) 2SLS kullanıyoruz. Angrist & Krueger (2001): “Enstrümantal Değişkenler ve Tanımlama Araması: Arz ve Talepten Doğal Deneylere”) Adams, Almeida ve Ferreira'da (2009) kullanılan üç aşamalı prosedürü de denedik: “ Kurucu-CEO'lar ile firma performansı arasındaki ilişkiyi anlamak ”. Bir probit modelinin ardından 2SLS'den oluşan ikinci yaklaşım, daha küçük ve daha duyarlı katsayılar verir, ancak 0-1 metrikte (yaklaşık 9-10) yorumlandığında hala çok büyüktür. Cerulli'nin ivtreatreg'indeki probit-2sls-opsiyonu ile yaptığımız manuel hesaplamalarla aynı sonuçları elde ediyoruz.


Denedin etregress/treatregmi
Dimitriy V. Masterov

Merhaba Dimitriy, cevap için teşekkürler! Şimdi etregress'i denedim ve biraz benzer sonuçlar veriyor. Ancak, Stata kitapçığını ve Wooldridge (2002): "Kesit ve panel verilerinin ekonometrik analizi" Bu tür bir tedavi-regresyon modelinin tedavinin cahilliğini üstlendiği izlenimini edindim. Yani, gözlemlenen değişkenlere bağlı olarak, bir birimin tedavi edilip edilmediği, hem tedavi hem de kontrol altındaki (potansiyel) sonucundan bağımsızdır.
Bertel

(devam) Verilerimizde, bu varsayımı gerçekten sürdüremeyiz; sadece rastgele bir varyasyon kaynağımız varx. Bu nedenle, IV uygun seçenek gibi görünüyor. Eğer varsayımları doğru yaparsam, neyse.
Bertel

Ham grafikler ve artıklar gibi bazı grafikler, örneğin dağılım grafikleri veya çekirdek yoğunluğu grafikleri olması gerçekten yararlı olacaktır. β^1=β1+Cov(z1,u)Cov(z1,x1), cihaz ve hata terimi arasındaki küçük bir korelasyon bile, β1!
Arne Jonas Warnke

Yanıtlar:


2

Bu eski bir soru, ancak gelecekte tökezleyen herkes için sezgisel olarak 2SLS tahmini β1 dır-dir α1 "indirgenmiş form" regresyonundan

y=α0+α1z1+Zα+u

bölü π1 "ilk aşama" regresyonundan

x1=π0+π1z1+Zπ+v

Yani 2SLS, β1 "inanılmaz derecede büyük", OLS tahminlerini kontrol edin α1 ve π1.

Eğer α1 tahminler "makul", sorun şu olabilir π1tahminler "çok küçük". Bölmeα^1 "çok küçük" π^1 "inanılmaz derecede büyük" üretebilir β^1.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.