Ekonometride “rastgele etki modeli”, ekonometri dışındaki karma modellerle tam olarak nasıl ilişkilidir?


56

Ekonometride "rastgele etki modelinin" ekonometri dışında "rastgele engelli karma bir model" e karşılık geldiğini düşünmüştüm, ama şimdi emin değilim. Yapar?

Ekonometri, "sabit efektler" ve "rastgele efektler" gibi terimleri karma modellerle ilgili literatürden biraz farklı kullanır ve bu kötü bir kafa karışıklığına neden olur. Bize basit bir durum düşünelim doğrusal bağlıdır ama ölçümlerin farklı gruplarda farklı bir yolunu kesmek ile:yx

yit=βxit+ui+ϵit.

Burada her birim / grup farklı zaman noktalarında gözlenir . Ekonometristler buna "panel verileri" diyorlar.it

  • Karışık model terminolojisinde sabit bir etki veya rastgele bir etki olarak ele alabiliriz (bu durumda, rastgele engelleme). Sabit olarak tedavi etmek, kare hatasını en aza indirmek için ve anlamına gelir (örn. OLS regresyonunu kukla grup değişkenleriyle çalıştırmak). Rastgele olarak ele almak, ek olarak olduğunu ve her yerine ve uyması için maksimum olasılık kullandığımız . Bu, "kısmi havuzlama" etkisine neden olur; burada tahminler , ortalama doğru .puiu ı u ı ~ N- ( u 0 , σ 2 u ) u 0 σ 2 u u ı u ı u 0β^u^iuiN(u0,σu2)u0σu2uiu^iu^0

    R formula when treating group as fixed:    y ~ x + group
    R formula when treating group as random:   y ~ x + (1|group)
    
  • Ekonometri terminolojisinde, bu modelin tamamını sabit etkiler modeli veya rastgele etkiler modeli olarak ele alabiliriz. İlk seçenek yukarıdaki sabit etkiye eşittir (ancak ekonometriğin, bu durumda olarak adlandırılan kendi tahmin etme yolu vardır ). İkinci seçeneğin yukarıdaki rastgele efekte eşdeğer olduğunu düşünürdüm; Örneğin, @JiebiaoWang'a yaptığı son cevaplandırılmış cevapta rastgele etkiler-, sabit etkiler- ve marjinal model arasındaki fark nedir? diyor ki β"within" estimator

    Ekonometride, rastgele etkiler modeli sadece biyoistatistikte olduğu gibi rastgele engelleme modelini ifade edebilir.

Tamam --- bu anlayışın doğru olup olmadığını test edelim. İşte @ChristophHanck tarafından oluşturulan sabit rastgele etki, rastgele etki ve karma etki modelleri arasındaki fark nedir? ( Verileri burada kullanmayanlar için pastebin üzerine koydum ):

görüntü tanımını buraya girin

@Christoph, ekonometrik yaklaşımları kullanarak iki kişiyi uyar:

fe <- plm(stackY~stackX, data = paneldata, model = "within")
re <- plm(stackY~stackX, data = paneldata, model = "random")

Birincisi, birincisine eşit beta değerini verir -1.0451, ikincisine 0.77031(evet, pozitif!). Onu lmve ile çoğaltmaya çalıştım lmer:

l1 = lm(stackY ~ stackX + as.factor(unit), data = paneldata)
l2 = lmer(stackY ~ stackX + (1|as.factor(unit)), data = paneldata)

Birincisi -1.045, yukarıdaki tahmin ediciler ile mükemmel bir uyum içerisindedir. Güzel. Ancak ikinci verim -1.026, rastgele etki tahmincisinden mil uzakta. Heh? Ne oluyor? Aslında, ne plmbile yapıyor , ne zaman birlikte denilen model = "random"?

Her ne yapıyorsa, karma modeller perspektifinden bir şekilde anlaşılabilir mi?

Ve ne yapıyorsa arkasındaki sezgi nedir? Birkaç ekonometri yerinde, rastgele etkiler tahmincisinin, sabit etkiler tahmincisi arasında ağırlıklı bir ortalama "between" estimatorolduğunu ve modelde hiç grup kimliği içermemesi durumunda aşağı yukarı regresyon eğimi olduğunu okudum (bu tahmin, bu konuda kesinlikle olumlu case, around 4.) Eg @Andy burada yazıyor :

Rasgele efekt tahmincisi daha sonra verilerinizin varyasyonu içindeki ve içindeki matris ağırlıklı bir ortalama kullanır. [...] Bu rastgele efektleri daha verimli hale getirir. [.]

Neden? Neden bu ağırlıklı ortalamayı istiyoruz? Özellikle de neden karışık bir model yürütmek yerine bunu isteyelim?


8
Vay, 20'den fazla oy ve 24 saatten az bir sürede altı aydınlatıcı cevap, ancak hepsi düşünmenin ekonometrik yüzüne odaklanıyor. Cevap yok, şimdiye kadar karışık modellerle bağlantı kuruyor.
amip diyor Reinstate Monica,


Yanıtlar:


16

Özet: Ekonometride "rasgele etki modeli" ve "rastgele engelli karma model" aynı modellerdir, ancak farklı şekillerde tahmin edilirler. Ekonometrik yöntem FGLS kullanmak, karışık model yol ML kullanmaktır. FGLS yapmanın farklı algoritmaları vardır ve bazıları (bu veri setinde) ML'ye çok yakın sonuçlar verir.


1. Tahmin yöntemleri arasındaki farklar plm

@ChristophHanck tarafından oluşturulan verileri kullanarak plm(..., model = "random")ve yaptığım testlerle cevap vereceğim lmer().

Göre PLM paketi manuel , dört seçenek vardır random.methodrasgele etkiler modelinde varyans bileşenleri için tahmin yöntemi:. @ amoeba varsayılanı kullandı swar(Swamy ve Arora, 1972).

Rastgele efekt modelleri için, dönüşüm parametresinin dört tahmincisi random.metod değerini "swar" (Swamy ve Arora (1972)) (varsayılan), "amemiya" (Amemiya (1971)), "walhus" (Amayiya (1971)) 'a ayarlayarak kullanılabilir. Wallace ve Hussain (1969)) veya "sinir" (Nerlove (1971)).

Tüm dört seçeneği de aynı verileri kullanarak test ettim, hataamemiya mesajı alıp, değişken için tamamen farklı üç katsayısı tahmin ettim stackX. random.method='nerlove''Amemiya' kullanan ve kullananlar lmer(), -1.029 ve -1.025 ile -1.026 arasındaki değerlere neredeyse eşdeğerdir . Ayrıca -1.045 "sabit etkiler" modelinde elde edilenden çok da farklı değillerdir.

# "amemiya" only works using the most recent version:
# install.packages("plm", repos="http://R-Forge.R-project.org")

re0 <- plm(stackY~stackX, data = paneldata, model = "random") #random.method='swar'
re1 <- plm(stackY~stackX, data = paneldata, model = "random",  random.method='amemiya')
re2 <- plm(stackY~stackX, data = paneldata, model = "random",  random.method='walhus')
re3 <- plm(stackY~stackX, data = paneldata, model = "random",  random.method='nerlove')
l2  <- lmer(stackY~stackX+(1|as.factor(unit)), data = paneldata)

coef(re0)     #    (Intercept)   stackX    18.3458553   0.7703073 
coef(re1)     #    (Intercept)   stackX    30.217721   -1.025186 
coef(re2)     #    (Intercept)   stackX    -1.15584     3.71973 
coef(re3)     #    (Intercept)   stackX    30.243678   -1.029111 
fixef(l2)     #    (Intercept)   stackX    30.226295   -1.026482 

Maalesef şu anda zamanım yok, ancak ilgilenen okuyucular tahmin prosedürlerini kontrol etmek için dört referansı bulabiliyorlar. Neden böyle bir fark yarattıklarını anlamak çok yararlı olacaktır. Bazı durumlarda, dönüştürülen verileri plmkullanan tahmin prosedürünün, kullanılan lm()maksimum olabilirlik prosedürüne eşdeğer olması gerektiğini bekliyorum lmer().

2. GLS ve ML arasındaki karşılaştırma

plmPaketin yazarları, makalelerinin 7. bölümünde yer alan ikisini karşılaştırdılar: Yves Croissant ve Giovanni Millo, 2008, R: The plm paketi Panel Veri Ekonometrisi .

Ekonometri çoğunlukla deneysel olmayan verilerle ilgilidir. Spesifikasyon prosedürlerine ve hatalı şartname testine büyük önem verilir. Bu nedenle, model özellikleri çok basit olma eğilimindedir; ancak, regresörlerin içselliği, hatalardaki bağımlılık yapıları ve tahmin edicilerin normallikten sapmalar altındaki tahmin edicilerin sağlamlığı konularına büyük önem verilmektedir. Tercih edilen yaklaşım çoğu zaman yarı veya parametrik değildir ve heteroskedastisite tutarlı teknikler hem tahmin hem de testte standart bir uygulama haline gelmektedir.

Bütün bu nedenlerden dolayı [...] ekonometride panel model tahmini çoğunlukla Aitken'in Teoremine dayanan genelleştirilmiş en küçük kareler çerçevesinde gerçekleştirilir [...]. Aksine, uzunlamasına veri modelleri nlmeve lme4(sınırlı veya sınırsız) maksimum olabilirlik ile tahmin edilmektedir. [...]

Ekonometrik GLS yaklaşımı, standart lineer cebir ile hesaplanabilen kapalı form analitik çözümlere sahiptir ve ikincisi bazen makinede hesaplamalı olarak ağırlaşsa da, tahmin ediciler için ifadeler genellikle oldukça basittir. Uzunlamasına modellerin ML tahmini, aksine, doğrusal olmayan fonksiyonların kapalı form çözümleri olmadan sayısal olarak optimizasyonuna dayanır ve bu nedenle yaklaşımlara ve yakınsama kriterlerine bağlıdır.


3. Karışık modellerde güncelleme

@ ChristophHanck'ın random.methodkullanılan dördü hakkında kapsamlı bir giriş sağladığını plmve tahminlerinin neden bu kadar farklı olduğunu açıkladığını takdir ediyorum . @Amoeba tarafından talep edildiği gibi, karışık modeller (olasılık tabanlı) ve bunun GLS ile bağlantısı hakkında bazı düşünceler ekleyeceğim.

Olabilirlik temelli yöntem genellikle hem rastgele etki hem de hata terimi için bir dağılım varsaymaktadır. Normal bir dağıtım varsayımı yaygın olarak kullanılır, ancak normal olmayan bir dağılım olduğunu varsayan bazı çalışmalar da vardır. @ ChristophHanck'ın rastgele bir kesişme modeli için gösterimlerini takip edeceğim ve dengesiz veriye izin vereceğim, hadi .T=ni

Model , .

yit=xitβ+ηi+ϵiti=1,,m,t=1,,ni
ηiN(0,ση2),ϵitN(0,σϵ2)

Her , Yani log-olabilirlik işlevii

yiN(Xiβ,Σi),Σi=ση21ni1ni+σϵ2Ini.
const12ilog|Σi|12i(yiXiβ)Σi1(yiXiβ).

Tüm değişkenler bilindiğinde, Laird ve Ware (1982) 'de gösterildiği gibi, MLE GLS , @ChristophHanck tarafından türetilmiştir. Dolayısıyla, temel fark, varyansların tahminindedir. Kapalı form çözümü olmadığına göre, birkaç yaklaşım vardır:

β^=(iXiΣi1Xi)1(iXiΣi1yi),
β^RE
  • optimizasyon algoritmaları kullanarak log-olasılık fonksiyonunun doğrudan maksimize edilmesi;
  • Beklenti-Maksimizasyon (EM) algoritması: kapalı formda çözümler vardır, ancak için tahmin edici , rastgele engellemenin deneysel Bayesian tahminlerini içerir;β
  • Yukarıdaki iki Beklenti / Koşullu Maksimize Etme (ECME) algoritmasının bir kombinasyonu (Schafer, 1998; R paketi lmm). Farklı bir parametreleştirme ile, (yukarıdaki gibi) ve için kapalı form çözümleri vardır. İçin bir çözüm olarak yazılabilir olarak tanımlanır ve bir EM çerçevesinde tahmin edilebilir.βσϵ2σϵ2Karsılıkσ2η/σ2ε
    σϵ2=1inii(yiXiβ^)(ξ^1ni1ni+Ini)1(yiXiβ^),
    ξση2/σϵ2

Özet olarak, MLE'nin dağıtım varsayımları vardır ve yinelemeli bir algoritmayla tahmin edilir. MLE ve GLS arasındaki temel fark, varyansların tahminindedir.

Kruvasan ve Millo (2008) dikkat çekti

Normallik altında, homoskedastisite ve hataların seri korelasyonu yoktur, OLS aynı zamanda maksimum olasılık tahmincisidir, diğer tüm durumlarda önemli farklılıklar vardır.

Benim düşünceme göre, dağıtım varsayımı için, parametrik ve parametrik olmayan yaklaşımlar arasındaki fark gibi, varsayım geçerli olduğunda MLE daha verimli olurken, GLS daha sağlam olacaktır.


Hata mesajıyla ilgili sorunun bir şekilde değişkenler olarak vektörler üretmemle ilgili olduğundan şüpheliyim. Belki de plm verilerin farklı saklanmasını tercih ediyor?
Christoph Hanck,

1
nerloveBurada iyi çalışıyor, ancak son panelden 1 gözlemi silerek ve tüm yöntemleri çalıştırmaya çalıştığım gibi, dengesiz paneller için uygulanmıyor.
amip diyor Reinstate Monica

2
@ChristophHanck @amoeba Buradaki plmhata , modelde yalnızca bir ortak değişken olduğunda , matris biçimini korumak yerine random.method="amemiya"büyük olasılıkla kullanmaları gerektiği sonucuna varıyor . Her neyse, formüle standart bir normal değişken ekleyerek bunun üstesinden gelmeye çalıştım. sonucu -1.02 tahminiyle yeniden üretir ve dengesiz veriler için de işe yarar. X[, -1, drop=FALSE]X[, -1]X[, -1]amemiya
Randel

3
@ jiebiao-wang @ChristophHanck @amoeba, plm'nin şu anki geliştirme sürümü şu şekilde çalışıyor random.method="amemiya": var std.dev hisselendokratik 0.6360 0.7975 0.002 bireysel 313.6510 17.7102 0.998 theta: 0.9841
Helix123

1
Merhaba @JiebiaoWang. Güncellemenizden sonra cevabınızın soruma tatmin edici bir şekilde cevap verdiğini düşündüm. Bazı düzenlemeler yapma ve amemiyaML vs GLS hakkında bir güncelleme ve fiyat teklifi ekleme özgürlüğünü kullandım . Kabul edildi olarak işaretliyorum ve ona bir ödül vereceğim. Şerefe.
amip diyor Reinstate Monica

17

Bu cevap karışık modeller hakkında yorum yapmıyor, ancak rasgele etki tahmincisinin ne yaptığını ve neden bu grafikte berbat ettiğini açıklayabilirim.

Özet: rastgele etki tahmincisi , bu örnekte geçerli olmayan olduğunu varsayar .E[uix]=0


Rastgele efekt tahmincisinin ne işi var?

Modelimiz olduğunu varsayalım:

yit=βxit+ui+ϵit

İki varyasyon boyutuna sahibiz: ve zaman grupları . tahmin etmek için şunları yapabiliriz:itβ

  1. Yalnızca bir grup içindeki zaman serisi varyasyonunu kullanın . Sabit etki tahmincisinin yaptığı şey budur (ve bu nedenle de genellikle tahmin edici olarak da adlandırılır).
  2. rastgele olursa , zaman serisi gruplarının araçları arasında yalnızca kesitsel farklılıkları kullanabiliriz. Bu, tahmin ediciler arasında bilinir .ui

    Spesifik olarak, her bir grubu için , yukarıdaki panel veri modelinin zaman içindeki ortalamasını alarak aşağıdakileri elde edin:i

    y¯i=βx¯i+vi where vi=ui+ϵ¯i

    Bu regresyonu çalıştırırsak, tahmin edicinin arasını alırız. etkilerinin ile ilişkili olmayan rastgele beyaz gürültü olması durumunda tutarlı bir tahmin edici olduğunu gözlemleyin ! Eğer durum buysa, grup değişkenliği arasındaki farkı tamamen ayarlamak (sabit etkiler tahmin edicisinde olduğu gibi) yetersizdir.uix

Ekonometriğin rastgele etki tahmincisi, tahmin edicideki (1) (yani sabit etki tahmincisi) ve (2) tahmin edici arasındaki verimi en üst düzeye çıkaracak şekilde birleştirir. Genelleştirilmiş en küçük karelerin bir uygulamasıdır ve temel fikir ters varyans ağırlıklandırmadır . Verimliliği en üst düzeye çıkarmak için, rasgele etki tahmincisi değerini tahmin edicinin içindeki ve tahmin edicinin ağırlıklı ortalaması olarak hesaplar .β^

Bu grafikte neler oluyor ...

Sadece grafiğe göz atarken, neler olduğunu açıkça görebilirsiniz:

  • Her bir grup içinde (aynı renkteki, yani noktalar), daha yüksek bir düşük ilişkiliixityit
  • yüksek bir grup , daha .ix¯iui

Rastgele etkiler, değerinin açıkça karşılanmadığını . Grup etkileri karşı ortogonal değildir (bir istatistik anlamda) yerine, grup etkisi ile açık bir pozitif ilişki .E[uix]=0uixx

Tahmin edicisi arasındaki . Tahminci arasında, "elbette pozitif yaparak uygulayabilirim !" .E[uix]=0E[uix]=0β^

Sonra sırayla, rasgele etkiler tahmincisi kapalıdır, çünkü tahmin edicinin ve tahmin edici arasındaki ağırlıklı bir ortalamadır.


+1, teşekkürler Matthew. Birinin neden cevabını düşürdüğünden emin değilim. Karışık modellerle bağlantı kurarken bir cevap arıyorum, bu yüzden sizinkini kabul etmiyorum, ama yine de bu tartışma için yararlı buluyorum. GLS ve ters varyans ağırlıklarının burada nasıl uygulandığı ve hesaplandığını biraz genişletebilirseniz, çok faydalı olacaktır.
Amip Reinstate Monica,

16

Bu cevabında, ekonometri literatürünün rastgele etkiler tahmincisi olarak adlandırdığı konu hakkında GLS perspektifiyle ilgili Matthew'in +1 cevabını biraz incelemek istiyorum.

GLS perspektifi

Doğrusal modeli göz önünde bulundurun Eğer tuttuysa , modeli panel veri yapısını görmezden gelmek ve tüm gözlemlerini bir araya araya toplanmış OLS ile tahmin edebiliriz. .

yit=α+Xitβ+uiti=1,,m,t=1,,T
E(uit|Xit)=0n=mT

Bu modeli kullanarak hata bileşenli modeliuit

uit=ηi+ϵit

Matris notasyonunda, model olarak yazılabilir, burada ve tipik olarak vektörleridir elemanları ve , ve , kukla değişkenlerin bir (birim başına bir sütun) matrisidir. bir satır birimine ait bir gözlem tekabül ettiği takdirde şekildedir , o zaman sütununda bir birine sahiptir ve başka 0, .y ε n y ı t ε ı t D , n × m D ı d ı i = 1 , ... , m

y=αιmT+Xβ+Dη+ϵ
yϵnyitϵitDn×mDiDii=1,,m

Ayrıca

E(ϵϵ)=σϵ2I

Bireye özgü etkiler , bağımsız olmalıdır . Sabit etkilerin aksine (yine, ekonometri terminolojisi) rastgele etkiler tahmincisi, bununla birlikte, ek olarak, Bu varsayım altında toplanan daha güçlü bir varsayım gerektirir OLS tarafsız olacaktır, ancak bir GLS tahmincisi türetebiliriz. ortalama Sıfır ve varyans ile IID olduğunu varsayalım .ηϵit

E(ηi|X)=0
ηiση2

Bu varsayım, rastgele etkiler teriminden sorumludur . Üstelik, iki hata bileşeninin bağımsız olduğunu varsayarsak, olduğunu görmek kolaydır.

Var(uit)=ση2+σϵ2Cov(uit,uis)=ση2Cov(uit,ujs)=0for all ij

Daha sonra aşağıdaki varyans-kovaryans matrisini : İşte, , bir vektörünü içerir. Bundan dolayı GLS tahmincisi için gerektirir . Bunun için ,n×nΩ

Ω=(ΣOOOΣOOOΣ)
Σ=ση2ιι+σϵ2IT
ιT
Ω=ση2(Imιι)+σϵ2(ImIT)
β^RE=(XΩ1X)1XΩ1y
Ω1JT=ιιJ¯T=JT/TET=ITJ¯T . Ardından, veya aynı matrisler terimleri, toplama arasında Idempotency ve sonra burada .
Ω=Tση2(ImJ¯T)+σϵ2(ImET)+σϵ2(ImJ¯T)
Ω=(Tση2+σϵ2)(ImJ¯T)+σϵ2(ImET)
P=ImJ¯TQ=ImET
Ω1=1σ12P+1σϵ2Q=ση2σ12σϵ2(Imιι)+1σϵ2(ImIT),
σ12=Tση2+σϵ2

Rastgele bir etki tahmin yararlı olabilir neden, eğer çok sayıda panel veri uygulamalarında çok büyük toplanmış OLS veya sabit etkiler verilen varsayımlar altında (Resim daha etkili bir tahmin edici olduğunu olarak Gauss-Markov mantık daha sonra, açıklar gerçekten de ilişkili değildir). Kısacası, GLS daha verimlidir, çünkü bu hata kovaryansı matrisi bu modelde homoskedastik değildir.ηi

Biri GLS tahmininin kısmen verilerde OLS çalıştırılmasıyla elde edilebileceğini gösterebilir: burada . İçin , bir tahmin ( "içinde"), sabit bir etki alır. İçin biri "arasında" tahmin edicisi alır. GLS tahmincisi, ikisi arasında ağırlıklı bir ortalamadır. ( için havuzlanmış OLS tahmincisi kullanılır.)

(yitθy¯i)=(XitθX¯i)β+(uitθui),
θ=1ση/σ1θ=1θθ=0

Uygulanabilir GLS

Bir FGLS yaklaşımını pratik yapmak için, ve tahmin edicilerine ihtiyacımız var . Baltagi, Panel Verilerinin Ekonometrik Analizi, s. 16 (3. basımdan alıntı yaparak), nasıl devam edileceğine ilişkin aşağıdaki seçenekleri tartışır.σ12σϵ2

İlk önce gözlemlediğimizi varsayın . Sonra,uit

σ^12=T1mi=1mu¯i2
ve , parametrelerinin iyi tahmin edicileri olur; , birimin gözlemlerine karşılık gelen zaman ortalamasını alır. .
σ^ϵ2=1m(T1)i=1mt=1T(uit1mi=1mu¯i)2
u¯ii

Wallace ve Hüseyin (1969) yaklaşımı yerine oluşur (sonuçta, hala tarafsız ve mevcut varsayımlar altında tutarlıdır) bir havuz EKK regresyon rezidüelleri.u

Amemiya (1971) yaklaşımı FE (veya LSDV) yerine artıklarıyla önerir. Hesaplamalı bir mesele olarak, olan boş değişken tuzağı atlatmak için kısıtlamasını uygulayarak ile , ve üzerinde büyük ortalamaları gösterir ve LSDV artıkları için .iηi=0α^=y¯X¯β^FEitu^=yα^Xβ^FE

Varsayılan Swamy ve Arora (1972) yaklaşımı, tahminini tahmin eder. ve Burada, .

σ^ϵ2=[yQ(IX(XQX)1XQ)y]/[m(T1)K]
σ^12=[yP(IZ(ZPX)1ZP)y]/[mK1]
Z=(ιmTX)

Nerlove (1971) yaklaşımı tahminleri den burada , sabit etkiler regresyonundan gelen aptallar ve , bu regresyondan kalan karelerin toplamı içinde, paydada ile tahmin edilir .ση2i=1m(η^iη^¯)2/(m1)η^iσ^ϵ2mT

Bunların Randel'in hesaplamalarında gösterildiği gibi çok büyük bir fark yaratmalarına da çok şaşırdım!

DÜZENLE:

Farklılıklara ilişkin olarak, hata bileşenlerinin tahminleri plmpakete geri alınabilir ve gerçekten de büyük ölçüde farklı sonuçlar döndürür, bu, için nokta tahminlerindeki farkı açıklar (@ Randel'in cevabına göre, denemediğim bir hata atar). ) düzeltmek:βamemiya

> ercomp(stackY~stackX, data = paneldata, method = "walhus")
                  var std.dev share
idiosyncratic 21.0726  4.5905 0.981
individual     0.4071  0.6380 0.019
theta:  0.06933  
> ercomp(stackY~stackX, data = paneldata, method = "swar")
                 var std.dev share
idiosyncratic 0.6437  0.8023 0.229
individual    2.1732  1.4742 0.771
theta:  0.811  
> ercomp(stackY~stackX, data = paneldata, method = "nerlove")
                   var  std.dev share
idiosyncratic   0.5565   0.7460 0.002
individual    342.2514  18.5000 0.998
theta:  0.9857  

Hata bileşenlerinin tahmin edicilerinin , münferit efektlerin ve ilişkili olduğu verileri kullanarak FE ve RE arasındaki farkları göstermeyi hedeflediğim kardeşim örneğindeki örneğimle de tutarlı olmadığını düşünüyorum . (Aslında, olamazlar, çünkü sonuçta RE tahminini, FE'nin FE ağırlıklı bir ortalaması olduğu ve hata bileşeni tahminleri tarafından belirlenen ağırlıklarla yapılan tahminler arasındaki FE tahmininden uzaklaştırırlar. Tutarlı, nihayetinde bu tahminlere bağlı olması gerekir.)X

Bu örneğin "rahatsız edici" özelliğini değiştirirseniz,

alpha = runif(n,seq(0,step*n,by=step),seq(step,step*n+step,by=step))

basitçe söylemek gerekirse,

alpha = runif(n)

ile ilişkili olmayan rastgele etkiler , hata bileşenlerini tahmin etmenin tüm değişkenleri için için RE noktası tahminlerini gerçek değere çok yakın bir değerde alırsınız .Xββ=1


Referanslar

Amemiya, T., 1971, Varyans bileşenleri modelinde varyansların tahmini , International Economic Review 12, 1-13.

Baltagi, BH, Panel Verilerinin Ekonometrik Analizi, Wiley.

Nerlove, M., 1971a, Dinamik ekonomik ilişkilerin zaman kesiti dizisinden tahminlerine ilişkin ilave kanıtlar , Econometrica 39, 359-382.

Swamy, PAVB ve SS Arora, 1972, Hata bileşenleri regresyon modellerinde katsayı tahmin edicilerin kesin sonlu örnek özellikleri , Econometrica 40, 261-275.

Wallace, TD ve A. Hussain, 1969, Kesit ve zaman serisi verilerinin birleştirilmesinde hata bileşenleri modellerinin kullanımı , Econometrica 37, 55–72.


4
+1. Teşekkürler Christoph, bu yararlı ve nihayet bu konudaki bazı matematiksel detayları görmekten mutluyum. plmRandel tarafından uygulanan ve listelenen dört yöntemin nasıl çalıştığını görmek ve cevabınızı bu konudaki bazı yorumlar ile güncellemek harika olurdu. Ayrıntılı açıklamalar değilse, en azından ne olup bittiğiyle ilgili kısa notlar. Bakabileceğini düşünüyor musun? Bunun için bir ödül teklif etmekten mutluyum :-) Naif yaklaşımım her iki sigmayı da sabit etkiler çözümünden tahmin etmek olacaktır. "Adlandırılmış" yöntemlerden birine karşılık mı geliyor?
amip diyor Reinstate Monica,

@ amoeba, hata bileşen modelindeki varyansları nasıl tahmin edebileceğimize dair bazı yorumları dahil ettim. Ardından öneriniz, Amemiya ile yakından alakalı görünüyor.
Christoph Hanck,

Çok hoş teşekkürler. Nerlove ayrıca aptallarla regresyon kullanmıyor mu? Aslında, Amemiya ve Nerlove arasındaki farkın ne olduğunu tam olarak anlamadım. Benim "saf" önerim kukla regresyona uymak, artık varyansı bir tahmini olarak kullanmak ve kukla katsayıların varyansını bir tahmini olarak kullanmaktı . Nerlove'un yaptığı gibi görünüyor. Amemiya'nın ne yaptığını ve nasıl farklı olduğunu anladığımdan emin değilim. (Ve aşırı ağrıyan sorunun, bu yöntemlerin neden bu durumda böyle bir fark yarattığı konusunda kaldığı konusunda hemfikirim.)σϵση
Amip, Reinstate Monica 'nın

Evet, her ikisi de aptallarla regresyon kullanıyor. Anladığım kadarıyla, Amemiya ve Nerlove arasındaki bir fark, serbestlik derecesi için paydadır. Bir diğeri, tahmini kukla katsayıların varyansının, artıkların varyansıyla aynı olduğundan emin olmadığımdır. Bir diğer önemli bir Nerlove direkt olarak tahmin etmeyi amaçlamaktadır olmasıdır sen ile tahminine geri gerekir ise, üç diğerleri ve bunların bilinen bir dezavantajı, bunların olumsuz olmadığının garantisi bulunmamasıdır. ( σ 2 1 - σ 2 ε ) / Tση2(σ^12σ^ϵ2)/T
Christoph Hanck,

1
Teşekkürler. için daha açık bir formül sağlamak üzere bir düzenleme yaptım , iki kez kontrol etmek isteyebilirsiniz (ama doğru olduğunu düşünüyorum). Cevabınıza ödüllendireceğim bir ödül başladım. Bununla birlikte, karışık modellerle bağlantı kuracak, GLS'yi MLE'ye zıt kılacak ve neden hangi yaklaşımı tercih edeceğini açıklayacak bir cevap arıyorum (mevcut cevapların hiçbiri bunu yapmıyor, bu yüzden şu anda cevap yok. "kabul edildi" olarak işaretleyin). MLE'nin (uygulandığı gibi ), Nerlove'ye çok yakın olan varyans tahminleri vermesi ilginçtir. Ω1lmer
amip diyor Reinstate Monica

11

Kodunuz hakkında yorum yapacak kadar R hakkında yeterince bilgi sahibi değilim, ancak basit rastgele engellemeli karışık model, toplam değerinin küçük olması ve RE GLS tahmincisine çok yakın olması gerekir. veriler dengesiz. Umarım, bu sorunu teşhis etmede faydalı olacaktır. Tabii ki, bunların tümü RE tahmincisinin uygun olduğunu varsaymaktadır.N=iTi

İşte denkliği gösteren bir miktar Stata (gerektirir esttabve eststoSSC'den):

set more off
estimates clear
webuse nlswork, clear
eststo, title(mixed): mixed ln_w grade age c.age#c.age ttl_exp tenure c.tenure#c.tenure || id: // Mixed estimator
eststo, title(MLE): xtreg ln_w grade age c.age#c.age ttl_exp tenure c.tenure#c.tenure, i(id) mle // MLE RE estimator 
eststo, title(GLS): xtreg ln_w grade age c.age#c.age ttl_exp tenure c.tenure#c.tenure, i(id) re // GLS RE estimato
esttab *, b(a5) se(a5) mtitle 

İşte son satırın çıktısı:

. esttab *, b(a5) se(a5) mtitle 

------------------------------------------------------------
                      (1)             (2)             (3)   
                    mixed             MLE             GLS   
------------------------------------------------------------
main                                                        
grade            0.070790***     0.070790***     0.070760***
              (0.0017957)     (0.0017957)     (0.0018336)   

age              0.031844***     0.031844***     0.031906***
              (0.0027201)     (0.0027202)     (0.0027146)   

c.age#c.age   -0.00065130***  -0.00065130***  -0.00065295***
             (0.000044965)    (0.000044971)    (0.000044880)   

ttl_exp          0.035228***     0.035228***     0.035334***
              (0.0011382)     (0.0011392)     (0.0011446)   

tenure           0.037134***     0.037134***     0.037019***
              (0.0015715)     (0.0015723)     (0.0015681)   

c.tenure#c~e   -0.0018382***   -0.0018382***   -0.0018387***
             (0.00010128)    (0.00010128)    (0.00010108)   

_cons             0.14721***      0.14721***      0.14691** 
               (0.044725)      (0.044725)      (0.044928)   
------------------------------------------------------------
lns1_1_1                                                    
_cons            -1.31847***                                
               (0.013546)                                   
------------------------------------------------------------
lnsig_e                                                     
_cons            -1.23024***                                
              (0.0046256)                                   
------------------------------------------------------------
sigma_u                                                     
_cons                             0.26754***                
                              (0.0036240)                   
------------------------------------------------------------
sigma_e                                                     
_cons                             0.29222***                
                              (0.0013517)                   
------------------------------------------------------------
N                   28099           28099           28099   
------------------------------------------------------------
Standard errors in parentheses
* p<0.05, ** p<0.01, *** p<0.001

Verilerinizde, RE tahmincisini kullanma varsayımları tatmin edici değildir, çünkü grup etkisi x ile açıkça ilişkilidir, bu yüzden çok farklı tahminler alırsınız. GLS RE tahmincisi aslında tahmin ediciler arasında ve tahmin ediciler arasında matris ağırlıklı bir ortalama olan genel bir moment (GMM) tahmincisi yöntemidir. Burada tahmin edicinin içi düzelecek, ancak aradakiler, X'in büyük olumlu etkilerini gösterecek şekilde derinlemesine vidalanacak. Dolayısıyla, GLS çoğunlukla tahmin edici arasında olacak. MLE RE, rastgele etkiler modelinin olasılığını maksimize eden bir MLE'dir. Artık aynı cevabı üretmeleri beklenmiyor. Burada karışık tahmin edici FE "Within" tahmincisine çok yakın bir şey veriyor:

. esttab *, b(a5) se(a5) mtitle 

----------------------------------------------------------------------------
                      (1)             (2)             (3)             (4)   
                    mixed             GLS             MLE          Within   
----------------------------------------------------------------------------
main                                                                        
x                -1.02502***      0.77031**       3.37983***     -1.04507***
               (0.092425)       (0.26346)       (0.20635)      (0.093136)   

_cons             30.2166***      18.3459***      0.49507         30.3492***
                (5.12978)       (2.31566)             (.)       (0.62124)   
----------------------------------------------------------------------------
lns1_1_1                                                                    
_cons             2.87024***                                                
                (0.20498)                                                   
----------------------------------------------------------------------------
lnsig_e                                                                     
_cons            -0.22598**                                                 
               (0.077195)                                                   
----------------------------------------------------------------------------
sigma_u                                                                     
_cons                                             2.40363                   
                                                (1.28929)                   
----------------------------------------------------------------------------
sigma_e                                                                     
_cons                                             4.23472***                
                                                (0.37819)                   
----------------------------------------------------------------------------
N                      96              96              96              96   
----------------------------------------------------------------------------
Standard errors in parentheses
* p<0.05, ** p<0.01, *** p<0.001

Yukarıdaki tablo için Stata kodu:

clear
set more off
estimates clear

input int(obs id t) double(y x)
1      1           1  2.669271  0.5866982
2      1           2  1.475540  1.3500454
3      1           3  4.430008  0.6830919
4      1           4  2.162789  0.5845966
5      1           5  2.678108  1.0038879
6      1           6  3.456636  0.5863289
7      1           7  1.769204  2.3375403
8      1           8  3.413790  0.9640034
9      2           1  4.017493  1.5084121
10     2           2  4.218733  2.8982499
11     2           3  4.509530  3.2141335
12     2           4  6.106228  2.0317799
13     2           5  5.161379  2.1231733
14     2           6  2.724643  4.3369017
15     2           7  4.500306  1.9141065
16     2           8  4.119322  2.8667938
17     3           1  9.987779  2.3961969
18     3           2  7.768579  3.5509275
19     3           3  9.379788  3.3284869
20     3           4 10.035937  2.2997389
21     3           5 11.752360  2.8143474
22     3           6  9.500264  2.1825704
23     3           7  8.921687  5.0126462
24     3           8  8.269932  3.4046339
25     4           1 12.101253  3.2928033
26     4           2 11.482337  3.1645218
27     4           3 10.648010  4.8073987
28     4           4  9.687320  5.3394193
29     4           5 12.796925  3.1197431
30     4           6  9.971434  4.6512983
31     4           7 10.239717  4.7709378
32     4           8 12.245207  2.7952426
33     5           1 18.473320  5.8421967
34     5           2 19.097212  4.9425391
35     5           3 19.460495  4.9166172
36     5           4 18.642305  4.9856035
37     5           5 17.723912  5.0594425
38     5           6 16.783248  4.8615618
39     5           7 16.100984  6.2069167
40     5           8 18.851351  3.8856152
41     6           1 19.683171  7.5568816
42     6           2 21.104231  6.7441900
43     6           3 22.115529  6.4486514
44     6           4 22.061362  5.3727434
45     6           5 22.457905  5.8665798
46     6           6 21.424413  6.0578997
47     6           7 23.475946  4.4024323
48     6           8 24.884950  4.1596914
49     7           1 25.809011  7.6756255
50     7           2 25.432828  7.7910756
51     7           3 26.790387  7.3858301
52     7           4 24.640850  8.2090606
53     7           5 26.050086  7.3779219
54     7           6 25.297148  6.8098617
55     7           7 26.551229  7.6694272
56     7           8 26.669760  6.4425772
57     8           1 26.409669  8.3040894
58     8           2 26.570003  8.4686087
59     8           3 29.018818  7.2476785
60     8           4 30.342613  4.5207729
61     8           5 26.819959  8.7935557
62     8           6 27.147711  8.3141224
63     8           7 26.168568  9.0148308
64     8           8 27.653552  8.2081808
65     9           1 34.120485  7.8415520
66     9           2 31.286463  9.7234259
67     9           3 35.763403  6.9202442
68     9           4 31.974599  9.0078286
69     9           5 32.273719  9.4954288
70     9           6 29.666208 10.2525763
71     9           7 30.949857  9.4751679
72     9           8 33.485967  8.1824810
73    10           1 36.183128 10.7891587
74    10           2 37.706116  9.7119548
75    10           3 38.582725  8.6388290
76    10           4 35.876781 10.8259279
77    10           5 37.111179  9.9805046
78    10           6 40.313149  7.7487456
79    10           7 38.606329 10.2891107
80    10           8 37.041938 10.3568765
81    11           1 42.617586 12.1619185
82    11           2 41.787495 11.1420338
83    11           3 43.944968 11.1898730
84    11           4 43.446467 10.8099599
85    11           5 43.420819 11.2696770
86    11           6 42.367318 11.6183869
87    11           7 43.543785 11.1336555
88    11           8 43.750271 12.0311065
89    12           1 46.122429 12.3528733
90    12           2 47.604306 11.4522787
91    12           3 45.568748 13.6906476
92    12           4 48.331177 12.3561907
93    12           5 47.143246 11.7339915
94    12           6 44.461190 13.3898768
95    12           7 46.879044 11.4054972
96    12           8 46.314055 12.3143487
end

eststo, title(mixed): mixed y x || id:, mle // Mixed estimator
eststo, title(GLS): xtreg y x, i(id) re     // GLS RE estimato
eststo, title(MLE): xtreg y x, i(id) mle    // MLE RE estimator 
eststo, title(Within): xtreg y x, i(id) fe  // FE Within estimator 
eststo, title(Between): xtreg y x, i(id) be // Between estimator 

esttab *, b(a5) se(a5) mtitle 

+1. Sağol Dimitriy, Stata'nın çıktısını aynı oyuncak veri setinde görmek kesinlikle faydalı. MLE tahmincisi hakkında bir sorum var. Ben (karma modeli yaklaşımı düşünülmektedir mixedStata ve lmerR), maksimum olabilirlik ya da bazen "kısıtlı maksimum olabilirlik" (Benim hem kullanabilirsiniz da lmerayarlayarak çağrı REML=Tveya REML=Fonlar neredeyse aynı sonuçları verir). Bununla birlikte, karışık model yaklaşımı çok mantıklı ve doğru bir sonuç verirken, Stat'ın "MLE" dediği şey bu durumda saçma bir sonuç veriyor. Fark ne? Stat'ün "MLE" si tam olarak neyi kastediyor?
amip diyor Reinstate Monica

2
@amoeba Hem mixed, mleve xtreg, mleMLE tahmin edicileri, ancak olasılık fonksiyonları biraz farklıdır. Bkz burada eski için, ve burada ikincisi için. mixedModelin neden bu kadar sağlam olduğunu tam olarak anlamadım .
Dimitriy V. Masterov

xtmixed, Stata'nın eski sürümlerinde karma denilen şeydi. Verileriniz için, bu eşdeğerlik el kitabımın önerdiği gibi verilerim için geçerliyken açıkça geçerli değildir.
Dimitriy V. Masterov

ssc install estoutHer ne kadar hatırlamam farklı sürümlerde farklı işlevlere sahip olmasına rağmen geriye dönük olarak uyumlu olmamıştır.
StasK

1
@StasK beni Stata teknik desteği ile temasa geçirdi ve bunun bir hata olduğunu söylediler xtreg, mle. “Genelde sonuç aynı olmalıdır [...]. Bu tür farklılıklar normalde modelin parametrelerinin tahmininde tanımlama sorunları olduğunda ortaya çıkar. [...] Ben aslında varyansın durum numarasını kontrol ettim. Her iki hesaplamadan kaynaklanan kovaryans matrisi ve bu sayı temelde -xtreg için sonsuzdur, mle- ve karışımları için 4000'den fazla mle-. […] sabit bir kod gereklidir. "
amip diyor Reinstate Monica,

9

İşleri daha da karıştırmama izin ver:

EKONOMETRİ - SABİT ETKİLER YAKLAŞIMI
Panel verisi için ekonometrideki "sabit etkiler" yaklaşımı, eğim katsayılarını (beta), bireysel etki değişkeninin varlığını " , , tahmin etmenin bir yoludur. “sabit” veya “rasgele” olup olmadığına dair herhangi bir varsayımda bulunmak. Bu, “İlk Fark” tahmincisinin (verilerin ilk farklarını kullanarak) ve “İçeri” tahmincisinin (zaman ortalamalarından sapmaları kullanarak) yaptığı şeydir: sadece betaları tahmin etmeyi başarırlar.αi

Tek tek efektleri ("engeller") sabit olarak açıkça ele alan daha geleneksel bir yaklaşım için, Notu için de tahminler sağlayan En Küçük Kareler Kukla Değişken (LSDV) Tahmincisi : Üç tahmin edici, betalar için üretilen tahminler açısından cebirsel olarak çakışmaktadır - ancak yalnızca doğrusal modelde.αi

Tartışma (kısmen sınıf notlarından çıkarılmıştır)

“Sabit etkiler yaklaşımının temel avantajı, bireysel etkilerin doğası hakkında herhangi bir varsayımda bulunmamız gerekmemesidir. Bu durumun, bu durumdan beri bir veya daha fazla sayıda regresörle ilişkili olduğunu düşündüğümüzde uygulamamız gerekir. Bu tür bir korelasyonun varlığını göz ardı etmek ve havuzlanmış modelde saf bir şekilde OLS uygulamak, tutarsız tahminciler üretir.Bir bireysel etkiler için yapmamız gereken asgari varsayımlar temelinde temyiz edilmesine rağmen, sabit etkiler yaklaşımının belirli kısıtlamaları vardır. değişmez regresörler tahmin edilemez, çünkü bu değişkenler gözlemlenemeyen bireysel etkilerle birlikte farklılık gösterir.bireysel etkiler (LSDV tahmincisini kullanmamız durumunda) tutarlı bir şekilde tahmin edilemez (zaman boyutunun sonsuzluğa gitmesine izin vermemiz hariç). "

EKONOMETRİ - RANDOM ETKİLERİ YAKLAŞIMI
"Geleneksel" ekonometrik Rastgele Etkiler yaklaşımında , "olağan" hata terimlerinin "geçici" hata bileşenleri olduğu " bireysel" ilişkilerin " " "sürekli rastgele bileşenler" olduğunu varsayıyoruz .αi

İlginç bir uzantıda, ek rasgelelik , tüm çapraz kesitler için ortak olan fakat sabit (sabit) bir bireysel etki ve hata terimiyle birlikte zamanla değişen rastgele bir zaman etkisinin varlığından kaynaklanmaktadır . Bu "zaman etkisi" örneğin, ekonomideki bütün haneleri eşit derecede etkileyen toplam şoku temsil edebilir. Bu tür toplu bozulmalar gerçekten gözlenir ve bu nedenle gerçekçi bir modelleme seçeneği gibi görünmektedir.

Burada "Rastgele Etkiler" Tahmincisi, verim artışı için Genelleştirilmiş En Küçük Kareler (GLS) tahmincisidir.

Şimdi, bir tane daha tasarlanan tahmin edici olan "Arasında" Tahmin Edici, zaman ortalaması alınan gözlemlerde OLS'yi gerçekleştirir. Bir cebir konusu olarak, GLS tahmin edicisinin, ağırlıkların keyfi olmadığı, ikisinin VCV matrisleriyle ilgili olduğu, İç ve Arasındaki tahmin edicilerin ağırlıklı bir ortalaması olarak elde edilebileceği gösterilmiştir.

... ve ayrıca “İlişkisiz Rastgele Etkiler” ve “İlişkili Rastgele Etkiler” modellerinin varyantları da var.

Yukarıdakilerin "karışık efektler" modelleri ile kontrast oluşturmasına yardımcı olacağını umuyorum.


+1, teşekkürler Alecos. Bu yardımcı olur, ancak bunların hepsinin karma modeller yaklaşımı ile ilişkisi bana açık değildir. Belki hiçbir şekilde bir ilişki olmadığını düşünmeye başladım. Tahmin ediciler arasındaki ve içindeki (ve içerisindeki sınıfın aptallarına eşittir) bu arada açıktır; kafam karışıyor sadece rastgele etkiler yaklaşımı ile ilgili.
amip diyor Reinstate Monica,
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.