Bağımlı değişkenin gecikmesini bir regresyon modeline ne zaman eklemek gerekir ve hangi gecikme?


14

Bağımlı değişken olarak kullanmak istediğimiz veriler şöyle görünür (sayım verisidir). Döngüsel bir bileşen ve trend yapısına sahip olduğu için regresyonun bir şekilde önyargılı olduğu ortaya çıkıyor.

resim açıklamasını buraya girin

Yardımcı olması durumunda negatif bir binom regresyonu kullanacağız. Veriler, kişi başına bir kukla (durum) olan dengeli bir paneldir. Gösterilen görüntü, tüm durumlar için bağımlı değişkenin toplamını gösterir, ancak çoğu durumun benzer bir davranışı vardır. Sabit bir etki modeli düşünüyoruz. Bağımlı değişkenler çok güçlü bir şekilde ilişkili değildir, araştırmanın bir kısmı bu değişkenler arasında beklenmedik bir ilişki bulmaktır, bu nedenle zayıf bir ilişki aslında iyi bir şeydir.

  1. Bağımlı değişkenin gecikme değişkenini dahil etmemenin kesin tehlikeleri nelerdir?
  2. Birini dahil etmek gerekiyorsa, hangisini (hangilerini) bilmek için bir test var mı?

Uygulama R'de yapılıyor.

Not : Ben okudum bu yazı ama bizim sorununa 'yardım etmedi.

Yanıtlar:


14

Cinayetler için göze yönelik bir misilleme modeliniz varsa dinamik bir panel modeli mantıklı olabilir. Örneğin, cinayet oranı büyük ölçüde çeteler tarafından yönetiliyorsa, zamanındaki cinayetler ölümlerin veya diğer gecikmelerin bir fonksiyonu olabilir . tt1

Sorularınızı arızalı olarak cevaplayacağım. DGP varsayalım

yit=δyit1+xitβ+μi+vit,

burada ve hataları birbirinden ve kendi aralarından bağımsızdır. (soru 2) olup olmadığını test etmekle ilgileniyorsunuz .μvδ=0

Eğer EKK kullanırsanız, o kadar görmek kolaydır hiçbir seri korelasyon olduğunda bile önyargılı EKK ve tutarsız hale ilişkilidir yanılma ilk bölümünü, . Testi yapmak için daha karmaşık bir şeye ihtiyacımız var.yit1v

Deneyebileceğiniz bir sonraki şey, her bir birimin ortalama , her bir gözlemden çıkararak verileri dönüştürdüğünüz iç dönüşüm ile sabit etki tahmin . Üzerinden Bu silme bezleri , fakat bu tahmin uğrar Nickell önyargı gözlem sayısı gitmez eğilim, geniş tutarsız yani, büyüdükçe ve küçük panel. Ancak, büyüdükçe, ve tutarlılığı elde edersiniz . Judson ve Owen (1999) ve ile bazı simülasyonlar yapmaktadıryy¯iμNNTTδβN=20,100T=5,10,20,30ve sapmanın arttığını ve azaldığını buldu . Bununla birlikte, için bile , sapma gerçek katsayı değerinin kadar olabilir . Bu kötü haber ayılar! Dolayısıyla, panelinizin boyutlarına bağlı olarak, FE tahmincisinden kaçınmak isteyebilirsiniz. Eğer sürekliliği bu yüzden, yan, negatif göz ardı edilmektedir. Regresörler gecikme ile ilişkiliyse, da önyargılı olacaktır.δTT=3020%δ>0yβ

Başka bir basit FE yaklaşım birinci fark sabitlenmiş etkisini kaldırmak için verileri ve kullanımı için alete . Ayrıca kullanmak kendisi için bir araç olarak. Anderson ve Hsiao (1981) kanonik referanstır. Bu tahminci tutarlıdır (açıklayıcı önceden belirlendiği ve orijinal hata terimleri seri olarak ilişkili olmadığı sürece), ancak mevcut tüm moment koşullarını kullanmadığı ve hatanın terim şimdi farklıdır. Bu muhtemelen ilk tercihim olacaktır. Eğer öyle düşünüyorsanyit2Δyit1=yit1yit2xitxit1XvAR (1) sürecini takip eder, bunun yerine üçüncü ve dördüncü gecikmelerini kullanabilir .y

Arellano ve Bond (1991) , bazı varsayımları gevşeterek o zamandan bu yana genişletilen daha etkin bir genelleştirilmiş momentler (GMM) tahmincisi türetmektedir. Baltagi'nin panel kitabının 8. Bölümü , bu literatürün iyi bir araştırmasıdır, ancak söyleyebildiğim kadarıyla gecikme seçimi ile ilgilenmemektedir. Bu son teknoloji ölçümler, ancak teknik olarak daha zorlu.

Sanırım R'deki plmpakette bunlardan bazıları var. Dinamik panel modelleri, sürüm 10'dan beri Stata'da ve SAS en azından GMM sürümüne sahip . Bunların hiçbiri sayım veri modelleri değildir, ancak verilerinize bağlı olarak bu çok önemli olmayabilir. Ancak, burada Stata'daki GMM dinamik Poisson paneli modeline bir örnek .

İlk sorunuzun cevabı daha spekülatif. Gecikmiş ve ilk farkı dışarıda bırakırsanız , varyans artık daha büyük olduğu için hala tutarlı bir şekilde tahmin edilebileceğine inanıyorum . Önem verdiğiniz parametre buysa, bu kabul edilebilir. Kaybettiğiniz şey, X bölgesinde çok fazla cinayet olup olmadığını söyleyememeniz çünkü geçen ay çok fazla ya da X bölgesi şiddet eğilimi taşıyor. Devlet bağımlılığı ile gözlemlenmeyen heterojenliği ayırt etme yeteneğinden vazgeçersiniz (soru 1). yβ


Yani seviyeleri farklı bir dizi olduğunda bir araç olarak, ve seviyeleri bir dizi olduğunda farklılıklar ?
Andy W

Damlama simge, ya kullanabilir ya da fark için araç olarak . Arellano (1989), ilk yaklaşımın çok çeşitli parametre değerleri için bir tekillik noktasına ve büyük varyanslara sahip olduğunu göstermektedir. Seviye enstrümanı da yok, bu yüzden tavsiye ettimΔ y t - 2 = y t - 2 - y t - 3 y t - 2 Δ y t - 1 = y t - 1 - y t - 2iΔyt2=yt2yt3yt2Δyt1=yt1yt2
Dimitriy V. Masterov
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.