Bu cevabında, ekonometri literatürünün rastgele etkiler tahmincisi olarak adlandırdığı konu hakkında GLS perspektifiyle ilgili Matthew'in +1 cevabını biraz incelemek istiyorum.
GLS perspektifi
Doğrusal modeli göz önünde bulundurun
Eğer tuttuysa , modeli panel veri yapısını görmezden gelmek ve tüm gözlemlerini bir araya araya toplanmış OLS ile tahmin edebiliriz. .
yit=α+Xitβ+uiti=1,…,m,t=1,…,T
E(uit|Xit)=0n=mT
Bu modeli kullanarak hata bileşenli modeliuit
uit=ηi+ϵit
Matris notasyonunda, model olarak yazılabilir,
burada ve tipik olarak vektörleridir elemanları ve , ve , kukla değişkenlerin bir (birim başına bir sütun) matrisidir. bir satır birimine ait bir gözlem tekabül ettiği takdirde şekildedir , o zaman sütununda bir birine sahiptir ve başka 0, .y ε n y ı t ε ı t D , n × m D ı d ı i = 1 , ... , m
y=αιmT+Xβ+Dη+ϵ
yϵnyitϵitDn×mDiDii=1,…,m
Ayrıca
E(ϵϵ′)=σ2ϵI
Bireye özgü etkiler , bağımsız olmalıdır . Sabit etkilerin aksine (yine, ekonometri terminolojisi) rastgele etkiler tahmincisi, bununla birlikte, ek olarak,
Bu varsayım altında toplanan daha güçlü bir varsayım gerektirir
OLS tarafsız olacaktır, ancak bir GLS tahmincisi türetebiliriz. ortalama Sıfır ve varyans ile IID olduğunu varsayalım .ηϵit
E(ηi|X)=0
ηiσ2η
Bu varsayım, rastgele etkiler teriminden sorumludur . Üstelik, iki hata bileşeninin bağımsız olduğunu varsayarsak, olduğunu görmek kolaydır.
Var(uit)Cov(uit,uis)Cov(uit,ujs)=σ2η+σ2ϵ=σ2η=0for all i≠j
Daha sonra aşağıdaki varyans-kovaryans matrisini :
İşte,
, bir vektörünü içerir. Bundan dolayı
GLS tahmincisi için
gerektirir . Bunun için ,n×nΩ
Ω=⎛⎝⎜⎜⎜⎜ΣO⋮OOΣ⋮O⋯⋯⋯OO⋮Σ⎞⎠⎟⎟⎟⎟
Σ=σ2ηιι′+σ2ϵIT
ιTΩ=σ2η(Im⊗ιι′)+σ2ϵ(Im⊗IT)
β^RE=(X′Ω−1X)−1X′Ω−1y
Ω−1JT=ιι′J¯T=JT/TET=IT−J¯T . Ardından,
veya aynı matrisler terimleri, toplama
arasında Idempotency ve sonra
burada .
Ω=Tσ2η(Im⊗J¯T)+σ2ϵ(Im⊗ET)+σ2ϵ(Im⊗J¯T)
Ω=(Tσ2η+σ2ϵ)(Im⊗J¯T)+σ2ϵ(Im⊗ET)
P=Im⊗J¯TQ=Im⊗ETΩ−1=1σ21P+1σ2ϵQ=−σ2ησ21σ2ϵ(Im⊗ιι′)+1σ2ϵ(Im⊗IT),
σ21=Tσ2η+σ2ϵ
Rastgele bir etki tahmin yararlı olabilir neden, eğer çok sayıda panel veri uygulamalarında çok büyük toplanmış OLS veya sabit etkiler verilen varsayımlar altında (Resim daha etkili bir tahmin edici olduğunu olarak Gauss-Markov mantık daha sonra, açıklar gerçekten de ilişkili değildir). Kısacası, GLS daha verimlidir, çünkü bu hata kovaryansı matrisi bu modelde homoskedastik değildir.ηi
Biri GLS tahmininin kısmen verilerde OLS çalıştırılmasıyla elde edilebileceğini gösterebilir:
burada . İçin , bir tahmin ( "içinde"), sabit bir etki alır. İçin biri "arasında" tahmin edicisi alır. GLS tahmincisi, ikisi arasında ağırlıklı bir ortalamadır. ( için havuzlanmış OLS tahmincisi kullanılır.)
(yit−θy¯i⋅)=(Xit−θX¯i⋅)β+(uit−θui⋅),
θ=1−ση/σ1θ=1θ→−∞θ=0
Uygulanabilir GLS
Bir FGLS yaklaşımını pratik yapmak için, ve tahmin edicilerine ihtiyacımız var . Baltagi, Panel Verilerinin Ekonometrik Analizi, s. 16 (3. basımdan alıntı yaparak), nasıl devam edileceğine ilişkin aşağıdaki seçenekleri tartışır.σ21σ2ϵ
İlk önce gözlemlediğimizi varsayın . Sonra,uit
σ^21=T1m∑i=1mu¯2i⋅
ve
, parametrelerinin iyi tahmin edicileri olur; , birimin gözlemlerine karşılık gelen zaman ortalamasını alır. .
σ^2ϵ=1m(T−1)∑i=1m∑t=1T(uit−1m∑i=1mu¯i⋅)2
u¯i⋅i
Wallace ve Hüseyin (1969) yaklaşımı yerine oluşur (sonuçta, hala tarafsız ve mevcut varsayımlar altında tutarlıdır) bir havuz EKK regresyon rezidüelleri.u
Amemiya (1971) yaklaşımı FE (veya LSDV) yerine artıklarıyla önerir. Hesaplamalı bir mesele olarak, olan boş değişken tuzağı atlatmak için kısıtlamasını uygulayarak ile , ve üzerinde büyük ortalamaları gösterir ve LSDV artıkları için .∑iηi=0α^=y¯⋅⋅−X¯′⋅⋅β^FE⋅⋅itu^=y−α^−Xβ^FE
Varsayılan Swamy ve Arora (1972) yaklaşımı, tahminini tahmin eder.
ve
Burada, .
σ^2ϵ=[y′Q(I−X(X′QX)−1X′Q)y]/[m(T−1)−K]
σ^21=[y′P(I−Z(Z′PX)−1Z′P)y]/[m−K−1]
Z=(ιmTX)
Nerlove (1971) yaklaşımı tahminleri den burada , sabit etkiler regresyonundan gelen aptallar ve , bu regresyondan kalan karelerin toplamı içinde, paydada ile tahmin edilir .σ2η∑mi=1(η^i−η^¯)2/(m−1)η^iσ^2ϵmT
Bunların Randel'in hesaplamalarında gösterildiği gibi çok büyük bir fark yaratmalarına da çok şaşırdım!
DÜZENLE:
Farklılıklara ilişkin olarak, hata bileşenlerinin tahminleri plmpakete geri alınabilir ve gerçekten de büyük ölçüde farklı sonuçlar döndürür, bu, için nokta tahminlerindeki farkı açıklar (@ Randel'in cevabına göre, denemediğim bir hata atar). ) düzeltmek:βamemiya
> ercomp(stackY~stackX, data = paneldata, method = "walhus")
var std.dev share
idiosyncratic 21.0726 4.5905 0.981
individual 0.4071 0.6380 0.019
theta: 0.06933
> ercomp(stackY~stackX, data = paneldata, method = "swar")
var std.dev share
idiosyncratic 0.6437 0.8023 0.229
individual 2.1732 1.4742 0.771
theta: 0.811
> ercomp(stackY~stackX, data = paneldata, method = "nerlove")
var std.dev share
idiosyncratic 0.5565 0.7460 0.002
individual 342.2514 18.5000 0.998
theta: 0.9857
Hata bileşenlerinin tahmin edicilerinin , münferit efektlerin ve ilişkili olduğu verileri kullanarak FE ve RE arasındaki farkları göstermeyi hedeflediğim kardeşim örneğindeki örneğimle de tutarlı olmadığını düşünüyorum . (Aslında, olamazlar, çünkü sonuçta RE tahminini, FE'nin FE ağırlıklı bir ortalaması olduğu ve hata bileşeni tahminleri tarafından belirlenen ağırlıklarla yapılan tahminler arasındaki FE tahmininden uzaklaştırırlar. Tutarlı, nihayetinde bu tahminlere bağlı olması gerekir.)X
Bu örneğin "rahatsız edici" özelliğini değiştirirseniz,
alpha = runif(n,seq(0,step*n,by=step),seq(step,step*n+step,by=step))
basitçe söylemek gerekirse,
alpha = runif(n)
ile ilişkili olmayan rastgele etkiler , hata bileşenlerini tahmin etmenin tüm değişkenleri için için RE noktası tahminlerini gerçek değere çok yakın bir değerde alırsınız .Xββ=−1
Referanslar
Amemiya, T., 1971, Varyans bileşenleri modelinde varyansların tahmini , International Economic Review 12, 1-13.
Baltagi, BH, Panel Verilerinin Ekonometrik Analizi, Wiley.
Nerlove, M., 1971a, Dinamik ekonomik ilişkilerin zaman kesiti dizisinden tahminlerine ilişkin ilave kanıtlar , Econometrica 39, 359-382.
Swamy, PAVB ve SS Arora, 1972, Hata bileşenleri regresyon modellerinde katsayı tahmin edicilerin kesin sonlu örnek özellikleri , Econometrica 40, 261-275.
Wallace, TD ve A. Hussain, 1969, Kesit ve zaman serisi verilerinin birleştirilmesinde hata bileşenleri modellerinin kullanımı , Econometrica 37, 55–72.