Otokorelasyon testi: Ljung-Box ve Breusch-Godfrey'e karşı


35

Ham verilerde veya model kalıntılarında otokorelasyon testi için oldukça sık kullanılan Ljung-Box testini görmeye alışkınım. Breusch-Godfrey testi gibi başka bir otokorelasyon testi olduğunu neredeyse unutmuştum.

Soru: Ljung-Box ve Breusch-Godfrey testlerinin temel farklılıkları ve benzerlikleri nelerdir ve biri diğerine ne zaman tercih edilmelidir?

(Referanslar bekliyoruz. Her ne kadar bir kaç ders kitabına bakıp çevrimiçi materyal aradığım halde iki test arasında herhangi bir karşılaştırma bulamadım. Her testin tanımlarını ayrı ayrı bulabildim , ancak ilgilendiğim şey şu: karşılaştırma edilenidir.)

Yanıtlar:


36

Ekonometri toplumda bazı güçlü sesler vardır karşı Ljung-Box geçerliliği Q de otoregresif modelin (yani regresör matris içinde gecikmeli bağımlı değişkenli), özellikle bkz gelen artıklar dayalı otokorelasyon için testler için -statistic Maddala (2001) "Ekonometriye Giriş (3d edition), ch 6.7 ve 13. 5 s 528. Maddala, bu testin yaygın olarak kullanılmasına gerek duymamakta, bunun yerine Breusch ve Godfrey" Langrange Çarpanı "testini uygun görmektedir.

Maddala'nın Ljung-Box testine karşı argümanı, başka bir omnipresent oto-korelasyon testine, "Durbin-Watson" a karşı yükseltilenle aynıdır: regresör matrisinde bağımlı değişkenlerin gecikmesiyle, test, sıfır hipotezini korumanın lehine önyargılıdır. "oto-korelasyon yok" (@javlacalle'da elde edilen Monte-Carlo sonuçları bu gerçeği yansıtıyor). Maddala ayrıca testin düşük gücünden de bahseder, bakınız örneğin Davies, N. ve Newbold, P. (1979). Zaman serisi modelinin özelliklerinin bir portmanteau testi bazı güç çalışmaları. Biometrika, 66 (1), 153-155 .

Hayashi (2000) , ch. 2.10 "Seri korelasyon testi" , birleşik bir teorik analiz sunar ve konuyu açıklığa kavuşturduğuna inanıyorum. Hayashi sıfırdan başlar: Ljung-Box için -statistic asimptotik bir ki-kare olarak dağıtılmak üzere, bu durumda olmalıdır işlem { z t } (herhangi bir Z olan örnek otokorelasyon biz istatistik besleniyorsa temsil eder), , hiçbir otokorelasyonun boş hipotezi altında, bir martingale-fark dizisi, yani tatmin ediciQ{zt}z

E(ztzt1,zt2,...)=0

ve ayrıca “kendi” koşullu eşcinselliği sergiler

E(zt2zt1,zt2,...)=σ2>0

Bu koşullar altında, Ljung-Box - statik (orijinal Box-Pierce Q - statik olanın sonlu örnekleri için düzeltilmiş bir varyantıdır ), asimptotik olarak bir chi-kare dağılımına sahiptir ve kullanımı asimptotik bir gerekçeye sahiptir. QQ

Şimdi otoregresif bir model belirlediğimizi varsayalım (bu, bağımlı değişkenlere ek olarak belki de bağımsız regresörleri de içerebilir),

yt=xtβ+ϕ(L)yt+ut

ϕ(L)ztu^t

Q

E(xtus)=0,E(ytus)=0t,s

t,ss=t1

E[ytut1]=E[(xtβ+ϕ(L)yt+ut)ut1]=

E[xtβut1]+E[ϕ(L)ytut1]+E[utut1]0

XE[ϕ(L)ytut1]

Q

Şimdi katı bir dışsallıktan daha zayıf bir koşulun sağlandığını, yani

E(utxt,xt1,...,ϕ(L)yt,ut1,ut2,...)=0

X

{u^t} R2

Bu istatistik "seri korelasyon için Breusch-Godfrey testi" dediğimiz yerde kullanılır .

Daha sonra, regresörler gecikmeli bağımlı değişkenler içerdiğinde (ve tüm otoregressif modellerde de), Ljung-Box testinin Breusch-Godfrey LM testi lehine terk edilmesi gerektiği anlaşılmaktadır . , çünkü "daha kötü performans gösterir", ancak asimptotik gerekçeye sahip olmadığı için. Oldukça etkileyici bir sonuç, özellikle de her zamanki mevcudiyetinden ve eskiden uygulamasından anlaşılıyor.

x


Çok etkileyici Alecos! Harika bir açıklama! Çok teşekkür ederim! (Umarım çok daha fazla kişi sonunda cevabınızı okur ve işlerinde veya çalışmalarında bundan faydalanır.)
Richard Hardy

+1 Çok ilginç. İlk tahminim, bir AR modelinde BG testinin dağılımının bozulabileceği, ancak açıkladığınız ve simülasyon uygulamasının önerdiği gibi, daha ciddi bir şekilde etkilenen LB testi olduğu yönünde.
javlacalle

xt

1
@Aksakal, Ayrıca, sorunun bir kısmı odağın burada ve oraya biraz atlaması olabilir. (1) Hangi testlerden hangisinin daha iyi olduğu (2) hangi test çalışmalarının hangi varsayımlar altında olduğu ve (3) hangi model için hangi test çalışmalarının (farklı model varsayımları nedeniyle) olduğu konularından ayrılmalıyız. İkincisi, uygulayıcılar için belki de en faydalı sorudur. Örneğin, Alecos’un gösterdiği gibi bir ARMA modelinin kalıntıları için LB kullanmıyorum. LB'nin hala ARMA modellerinin kalıntıları için kullanılabileceğini mi düşünüyorsunuz (bu, şu anda diğer konudaki temel sorudur).
Richard Hardy,

1
@Alexis Ve bu neredeyse gerçek olamayacak kadar büyük bir yorum. Teşekkür ederim.
Alecos Papadopoulos

12

varsayım

Bu testleri karşılaştıran hiçbir çalışma bilmiyorum. Açıklayıcı değişkenlerin bağımlı değişkenlerin gecikmesi olduğu ARIMA modelleri gibi zaman serisi modelleri bağlamında Ljung-Box testinin daha uygun olduğu konusunda şüphelerim vardı. Breusch-Godfrey testi, klasik varsayımların karşılandığı genel bir regresyon modeli için daha uygun olabilir (özellikle eksojen regresörler).

Benim düşünceme göre, Breusch-Godfrey testinin dağılımının (Artıkların En Küçük Kareler tarafından belirlenen bir regresyondan kalanlara dayanması), açıklayıcı değişkenlerin dışsal olmamasından etkilenebileceğidir.

Bunu kontrol etmek için küçük bir simülasyon alıştırması yaptım ve sonuçlar bunun tam tersini gösteriyor: Breusch-Godfrey testi, otoregressif bir modelin kalıntılarında otokorelasyon testi yapılırken Ljung-Box testinden daha iyi performans gösteriyor. Egzersizi çoğaltmak veya değiştirmek için detaylar ve R kodu aşağıda verilmiştir.


Küçük simülasyon alıştırması

Ljung-Box testinin tipik bir uygulaması, yerleşik bir ARIMA modelinden kalanlarda seri korelasyonu test etmektir. Burada bir AR (3) modelinden veri üretiyorum ve bir AR (3) modeline uyuyorum.

Artıklar otokorelasyonun boş hipotezini yerine getirirler, bu nedenle düzgün dağılmış p değerleri bekleriz. Boş hipotez, seçilen bir önem düzeyine yakın vakaların yüzdesi olarak, örneğin% 5 olarak reddedilmelidir.

Ljung-Box testi:

## Ljung-Box test
n <- 200 # number of observations
niter <- 5000 # number of iterations
LB.pvals <- matrix(nrow=niter, ncol=4)
set.seed(123)
for (i in seq_len(niter))
{
  # Generate data from an AR(3) model and store the residuals
  x <- arima.sim(n, model=list(ar=c(0.6, -0.5, 0.4)))
  resid <- residuals(arima(x, order=c(3,0,0)))
  # Store p-value of the Ljung-Box for different lag orders
  LB.pvals[i,1] <- Box.test(resid, lag=1, type="Ljung-Box")$p.value
  LB.pvals[i,2] <- Box.test(resid, lag=2, type="Ljung-Box")$p.value
  LB.pvals[i,3] <- Box.test(resid, lag=3, type="Ljung-Box")$p.value
  LB.pvals[i,4] <- Box.test(resid, lag=4, type="Ljung-Box", fitdf=3)$p.value
}
sum(LB.pvals[,1] < 0.05)/niter
# [1] 0
sum(LB.pvals[,2] < 0.05)/niter
# [1] 0
sum(LB.pvals[,3] < 0.05)/niter
# [1] 0
sum(LB.pvals[,4] < 0.05)/niter
# [1] 0.0644
par(mfrow=c(2,2))
hist(LB.pvals[,1]); hist(LB.pvals[,2]); hist(LB.pvals[,3]); hist(LB.pvals[,4])

Ljung-Box testi p değerleri

Sonuçlar, sıfır hipotezin çok nadir durumlarda reddedildiğini göstermektedir. % 5 düzeyinde, reddetme oranı% 5'ten çok daha düşüktür. P değerlerinin dağılımı, boş değerin reddedilmemesine karşı bir önyargı gösterir.

Düzenleme Prensip fitdf=3olarak her durumda ayarlanmalıdır. Bu, artıkları elde etmek için AR (3) modelini taktıktan sonra kaybolan serbestlik derecelerini hesaba katacaktır. Bununla birlikte, 4'ten düşük siparişte gecikmeler, bu negatif veya sıfır serbestlik derecelerine yol açar ve bu da testi uygulanabilir değildir. Belgelere göre ?stats::Box.test: Bu testler bazen ARMA (p, q) uyumundan kalanlara uygulanır, bu durumda referanslar boş hipotez dağılımına daha iyi bir yaklaşım fitdf = p+qgetirildiğini gösterir lag > fitdf.

Breusch-Godfrey testi:

## Breusch-Godfrey test
require("lmtest")
n <- 200 # number of observations
niter <- 5000 # number of iterations
BG.pvals <- matrix(nrow=niter, ncol=4)
set.seed(123)
for (i in seq_len(niter))
{
  # Generate data from an AR(3) model and store the residuals
  x <- arima.sim(n, model=list(ar=c(0.6, -0.5, 0.4)))
  # create explanatory variables, lags of the dependent variable
  Mlags <- cbind(
    filter(x, c(0,1), method= "conv", sides=1),
    filter(x, c(0,0,1), method= "conv", sides=1),
    filter(x, c(0,0,0,1), method= "conv", sides=1))
  colnames(Mlags) <- paste("lag", seq_len(ncol(Mlags)))
  # store p-value of the Breusch-Godfrey test
  BG.pvals[i,1] <- bgtest(x ~ 1+Mlags, order=1, type="F", fill=NA)$p.value
  BG.pvals[i,2] <- bgtest(x ~ 1+Mlags, order=2, type="F", fill=NA)$p.value
  BG.pvals[i,3] <- bgtest(x ~ 1+Mlags, order=3, type="F", fill=NA)$p.value
  BG.pvals[i,4] <- bgtest(x ~ 1+Mlags, order=4, type="F", fill=NA)$p.value
}
sum(BG.pvals[,1] < 0.05)/niter
# [1] 0.0476
sum(BG.pvals[,2] < 0.05)/niter
# [1] 0.0438
sum(BG.pvals[,3] < 0.05)/niter
# [1] 0.047
sum(BG.pvals[,4] < 0.05)/niter
# [1] 0.0468
par(mfrow=c(2,2))
hist(BG.pvals[,1]); hist(BG.pvals[,2]); hist(BG.pvals[,3]); hist(BG.pvals[,4])

Breusch-Godfrey testi p-değerleri

Breusch-Godfrey testinin sonuçları daha mantıklı görünüyor. P-değerleri eşit olarak dağılmıştır ve reddetme oranları anlamlılık seviyesine daha yakındır (sıfır hipotezi altında beklendiği gibi).


1
LB.pvals[i,j]j{1,2,3}j { 1 , 2 , 3 }j3fitdf=3j{1,2,3}

Ayrıca, ilk paragrafta söylediklerinizle ilgili olarak: belki bunu biraz daha genişletebilir misiniz? Buradaki ifadeleri oldukça önemli olarak algılıyorum, ancak ayrıntılar eksik. Çok fazla şey talep ediyor olabilirim - benim için şeyleri “sindirmek” - ama sizin için çok zor olmazsa, minnettar olurum.
Richard Hardy

1
İçimdeki his bu sorun, aşağıdaki ile ilgisi var olmasıdır: bir toplamı lineer bağımsız rastgele değişkenler olarak dağıtılır . doğrusal bağımlı bağımlı rasgele değişkenlerinin doğrusal kısıtlamalı olan toplamı olarak dağıtılır . Ne zaman bu hatalı tanımlanmış. Bunun gibi bir şeyin Ljung-Box testi bir AR ( ) modelinden kalan modellerde kullanıldığında olduğundan şüpheleniyorum . χ 2 ( 1 ) χ 2 ( n ) n χ 2 ( 1 ) k χ 2 ( n - k ) k n knχ2(1)χ2(n)nχ2(1)kχ2(nk)knk
Richard Hardy

1
Artıklar bağımsız değil, doğrusal olarak kısıtlanmıştır; ilk önce sıfıra geliyorlar; İkinci onların otokorelasyonlar ilk sıfır olan gecikmelerinin. Az önce yazdıklarım tam olarak doğru olmayabilir, ama fikir orada. Ayrıca, Ljung-Box testinin uygulanmaması gerektiğinin farkındaydım, sadece kaynağı hatırlamıyorum. Belki de bir derste prof tarafından duydum. Ruey S. Tsay, ya da ders notlarında bunu oku. Ama gerçekten hatırlamıyorum ...klag<fitdf
Richard Hardy

1
Kısacası, 4'ten düşük siparişte gecikmeler söz konusu olduğunda, bu olumsuz veya sıfır serbestlik derecelerine yol açacak, testi uygulanamaz hale getirecek, farklı bir sonuca varmanız gerektiğini düşünüyorum: testi bu gecikmeler için kullanmayın. fitdf=0Yerine koyarak devam fitdf=3ederseniz, kendinizi aldatıyor olabilirsiniz.
Richard Hardy

2

Greene (Ekonometrik Analiz, 7. Baskı, s. 963, bölüm 20.7.2):

"Godfrey-Breusch [GB] ve Box-Pierce [BP] testleri arasındaki temel fark, kısmi korelasyonların ( ve diğer değişkenleri kontrol eden) önceki ve basit korelasyonlarda kullanılmasıdır. Sıfır hipotezi altında. , otomatik korelasyon yoktur ve herhangi bir olayda ve arasında korelasyon yoktur , bu nedenle iki test asimptotik olarak eşdeğerdir, diğer taraftan, üzerinde , [BP] testi daha az güçlüdür [GB] boş hipotezin yanlış olduğu durumlarda, sezginin önerdiği gibi test edin. "Xetxtesxt

(Sorunun Ljung-Box ve yukarıdakilerle ilgili soruların Box-Pierce ile ilgili olduğunu biliyorum, ancak öncekiler basit bir ayrıntılandırmadır ve dolayısıyla GB ile BP arasındaki herhangi bir karşılaştırma GB ile LB arasındaki bir karşılaştırmaya da uygulanır.)

Diğer cevaplar çok daha titiz bir şekilde açıkladığından, Greene ayrıca Godfrey-Breusch'a karşı Ljung-Box'ı kullanmanın (belki de bazı hesaplama etkinliklerinden başka) elde etmenin hiçbir şey olmadığını, ancak potansiyel olarak kaybedecek bir şey olmadığını (testin geçerliliği) önerdiğini belirtti.


0

Görünüşe göre, Box-Pierce ve Ljung-Box testleri temel olarak tek değişkenli testlerdir, ancak lineer yapının zaman serisi regresyon kalıntıları (MA veya AR süreci) üzerinde geride bırakıldığında test edildiğinde Breusch-Godfrey testinin arkasında bazı varsayımlar vardır.

İşte tartışma bağlantısı:

http://www.stata.com/meeting/new-orleans13/abstracts/materials/nola13-baum.pdf


Dilbilgisi nedeniyle cümlenin anlamını tam olarak anlamadım. Tekrar yazar mısın?
Richard Hardy

0

Testler arasındaki temel fark şudur:

  • Breusch-Godfrey testi, (doğru olarak belirlenmiş) olabilirlik fonksiyonundan (ve böylece ilk prensiplerden) türetilen Lagrange Çarpan testi gibidir.

  • Ljung-Box testi, durağan bir işlemin artıklarının ikinci anlarına (ve dolayısıyla nispeten daha geçici bir yapıya) dayanmaktadır.

Breusch-Godfrey testi, üniform bir şekilde en güçlü teste eşdeğer olmayan Lagrange Multiplier testidir. Olabildiği gibi, ihmal edilen regülatörlerin alternatif hipotezi ile sadece asimptotik olarak en güçlü olanıdır (değişkenlerin değişip değişmediğine bakılmaksızın). Ljung-Box testinin güçlü noktası, çok çeşitli alternatif hipotezlere karşı gücü olabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.