Farklılıklardaki farklılıkların (DiD) hoş bir özelliği aslında panel verilerine ihtiyaç duymamanızdır. Tedavinin bir çeşit toplamada gerçekleştiği göz önüne alındığında (vaka şehirlerinizde), tedaviden önce ve sonra şehirlerden rastgele bireyleri örneklemeniz yeterlidir. Bu, yi tahmin
ve tedavinin nedensel etkisini, kontrol için beklenen post-öncesi sonuç farkı eksi.
yist=Ag+Bt+βDst+cXist+ϵist
İnsanların bir tedavi göstergesi yerine bireysel sabit etkiler kullandıkları bir durum vardır ve bu, tedavinin gerçekleştiği iyi tanımlanmış bir toplama seviyesine sahip olmadığımız zamandır. Bu durumda,
burada , tedavi sonrası dönem için bir gösterge tedaviyi aldı (örneğin, her yerde gerçekleşen bir iş piyasası programı). Bu konuda daha fazla bilgi için Steve Pischke'nin bu ders notlarına bakınız.
yit=αi+Bt+βDit+cXit+ϵit
Dit
Ortamınızda, bireysel sabit efektler eklemek, nokta tahminlerine göre hiçbir şeyi değiştirmemelidir. Tedavi göstergesi sadece bireysel sabit etkiler tarafından emilecektir. Bununla birlikte, bu sabit etkiler kalan varyansın bir kısmını emebilir ve bu nedenle potansiyel olarak DiD katsayınızın standart hatasını azaltabilir.Ag
İşte durumun böyle olduğunu gösteren bir kod örneği. Stata kullanıyorum, ancak bunu istediğiniz istatistik paketinde çoğaltabilirsiniz. Buradaki "bireyler" aslında ülkelerdir, ancak hala bazı tedavi göstergelerine göre gruplandırılmaktadır.
* load the data set (requires an internet connection)
use "http://dss.princeton.edu/training/Panel101.dta"
* generate the time and treatment group indicators and their interaction
gen time = (year>=1994) & !missing(year)
gen treated = (country>4) & !missing(country)
gen did = time*treated
* do the standard DiD regression
reg y_bin time treated did
------------------------------------------------------------------------------
y_bin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
time | .375 .1212795 3.09 0.003 .1328576 .6171424
treated | .4166667 .1434998 2.90 0.005 .13016 .7031734
did | -.4027778 .1852575 -2.17 0.033 -.7726563 -.0328992
_cons | .5 .0939427 5.32 0.000 .3124373 .6875627
------------------------------------------------------------------------------
* now repeat the same regression but also including country fixed effects
areg y_bin did time treated, a(country)
------------------------------------------------------------------------------
y_bin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
time | .375 .120084 3.12 0.003 .1348773 .6151227
treated | 0 (omitted)
did | -.4027778 .1834313 -2.20 0.032 -.7695713 -.0359843
_cons | .6785714 .070314 9.65 0.000 .53797 .8191729
-------------+----------------------------------------------------------------
Böylece, bireysel sabit efektler dahil edildiğinde DiD katsayısının aynı kaldığını görürsünüz (Stata'daki areg
mevcut sabit etki tahmin komutlarından biridir). Standart hatalar biraz daha sıkıdır ve orijinal tedavi göstergemiz bireysel sabit etkiler tarafından absorbe edildi ve bu nedenle regresyona düştü.
Yoruma yanıt olarak, insanların bir tedavi grubu göstergesi yerine bireysel sabit etkiler kullandıklarını göstermek için Pischke örneğinden bahsettim. Ayarınız iyi tanımlanmış bir grup yapısına sahiptir, bu nedenle modelinizi yazma şekliniz mükemmeldir. Standart hatalar şehir düzeyinde, yani tedavinin gerçekleştiği toplama seviyesinde kümelenmelidir (bunu örnek kodda yapmadım, ancak DiD ayarlarında standart hataların Bertrand ve ark. Belgesinde gösterildiği gibi düzeltilmesi gerekiyor. ).
Ev sahipleri ile ilgili olarak, burada oynayacakları bir rolleri yoktur. Tedavi göstergesi bir muamele şehir içinde yaşayan insanlar için 1'e eşit olduğu tedavi sonrası dönem içinde . DiD katsayısını hesaplamak için, aslında sadece dört koşullu beklentiyi, yani
Dstst
c=[E(yist|s=1,t=1)−E(yist|s=1,t=0)]−[E(yist|s=0,t=1)−E(yist|s=0,t=0)]
Dolayısıyla, tedavi gören bir şehirde ilk iki için yaşayan ve daha sonra geri kalan iki dönem için bir kontrol şehrine taşınan bir kişi için 4 tedavi sonrası döneminiz varsa, bu gözlemlerin ilk ikisi hesaplanmasında kullanılacaktır. ve son iki . Tespitin neden zaman içinde grup farklılıklarından geldiğini açıklamak için bunu basit bir grafikle görselleştirebilirsiniz. Sonuçtaki değişikliğin gerçekten sadece tedavi nedeniyle olduğunu ve çağdaş bir etkiye sahip olduğunu varsayalım. Tedavi başladıktan sonra tedavi edilen bir şehirde yaşayan ancak daha sonra bir kontrol şehrine taşınan bir bireyiniz varsa, sonuçları tedavi edilmeden önceki haline geri dönmelidir. Bu, aşağıdaki stilize grafikte gösterilmiştir.E ( y i s t | s = 0 , t = 1 )E(yist|s=1,t=1)E(yist|s=0,t=1)
Yine de başka nedenlerle taşınma hakkında düşünmek isteyebilirsiniz. Örneğin, tedavinin kalıcı bir etkisi varsa (yani, birey hareket etmesine rağmen hala sonucu etkiler)