Bir zaman serisinin Ljung-Box testinde kaç gecikme kullanılır?


20

Bir ARMA modeli bir zaman serisine uyduktan sonra, kalıntıları Ljung-Box portmanteau testi (diğer testlerin yanı sıra) yoluyla kontrol etmek yaygındır. Ljung-Box testi ap değerini döndürür. Test edilecek gecikme sayısı olan h parametresine sahiptir . Bazı metinler h = 20 kullanmanızı önerir ; diğerleri h = ln (n) kullanmanızı önerir ; çoğu ne h kullanacağını söylemez .

H için tek bir değer kullanmak yerine , tüm h <50 için Ljung-Box testini yaptığımı varsayalım ve sonra minimum p değerini veren h'yi seçin . Bu yaklaşım makul mü? avantajları ve dezavantajları nelerdir? (Bariz bir dezavantaj, hesaplama süresinin artmasıdır, ancak bu bir sorun değildir.) Bununla ilgili literatür var mı?

Hafifçe detaylandırmak için .... Test tüm h için p> 0.05 verirse , açık bir şekilde zaman serileri (artıklar) testi geçer. Sorum, h'nin bazı değerleri için p <0.05 ise diğer değerler için değil , testin nasıl yorumlanacağıyla ilgilidir .


1
@ user2875, cevabımı sildim. Gerçek şu ki, büyük için test güvenilir değildir. Yani cevap gerçekten hangi , . Ayrıca kesin değeri nedir? Biz eşiğini düşürmek durumunda , deney değişikliklerin sonucu mu? Şahsen çelişkili hipotezler durumunda, modelin iyi olup olmadığına dair başka göstergeler ararım. Model ne kadar iyi uyuyor? Model alternatif modellerle nasıl karşılaştırılır? Alternatif modelde aynı sorunlar var mı? Test başka hangi ihlallerde null değerini reddeder? hhp<0.05p0.01
mpiktas

1
@mpiktas, Ljung-Box testi, dağılımı asemptotik (h büyüdükçe) ki kare olan bir istatistiğe dayanmaktadır. H, n'ye göre büyüdükçe, testin gücü 0'a düşer. Dolayısıyla, h'yi dağılımın ki-kare'ye yakın, ancak yararlı güce sahip olacak kadar küçük olacak şekilde seçme arzusu. (H küçük olduğunda yanlış negatif riskinin ne olduğunu bilmiyorum.)
user2875

@ user2875, soruyu üçüncü kez değiştirdiğinizde. İlk önce en küçük değerle seçme stratejisini , sonra bazı değerleri için ise testi nasıl yorumlayacağınızı ve şimdi seçmek için en uygun ne olduğunu sorarsınız . Her üç sorunun da farklı cevapları vardır ve belirli bir sorunun bağlamına bağlı olarak farklı cevapları olabilir. p < 0.05 sa sahp<0.05hh
mpiktas

@mpiktas, sorular hep aynı, sadece farklı bakış açıları. (Belirtildiği gibi, tüm h için p> 0.05 ise, o zaman en küçük p'yi nasıl yorumlayacağımızı biliyoruz; optimal h'yi bilseydik - bilmiyoruz - o zaman en küçük p'yi seçmekle ilgilenmeyiz.)
user2875

Yanıtlar:


9

Cevap kesinlikle şunlara bağlıdır: Aslında testini ne için kullanmaya çalışıyorsunuz ?S

Yaygın nedeni: az ya da çok olması güvenen gecikme için hiçbir otokorelasyon kadar boş hipotezinin ortak istatistiksel anlamlılık hakkında (alternatif bir şey yakın olduğunu varsayarak zayıf beyaz gürültü ) ve inşa etmek parsimonious modeli, Little'ın olarak sahip parametre sayısı.h

Genellikle zaman serisi verileri doğal mevsimsel paterne sahiptir, bu nedenle pratik kural, bu değerin iki katına ayarlamak olacaktır . Bir diğeri, modeli tahmin ihtiyaçları için kullanırsanız tahmin ufukudur. Son olarak, sonraki gecikmelerde bazı önemli kalkışlar bulursanız, düzeltmeleri düşünmeye çalışın (bu bazı mevsimsel etkilerden kaynaklanıyor olabilir veya veriler aykırı değerler için düzeltilmemiş olabilir).h

H için tek bir değer kullanmak yerine, tüm h <50 için Ljung-Box testini yaptığımı varsayalım ve sonra minimum p değerini veren h'yi seçin.

Bu bir var müşterek önemi seçimi eğer öyleyse, deney veri tabanlı, neden ben az herhangi lag bazı küçük (ara sıra?) Kalkış önemsemeliyiz olan h çok az olduğunu varsayarak, n elbette (güç belirttiğiniz testin). Basit ama alakalı bir model bulmak için aşağıda açıklanan bilgi kriterlerini öneriyorum.hhn

Sorum , h'nin bazı değerleri için ise diğer değerler için değil , testin nasıl yorumlanacağıyla ilgilidir .p<0.05h

Dolayısıyla şimdiki zamandan ne kadar uzak olduğuna bağlı olacaktır. Uzak kalkışların dezavantajları: tahmin etmek için daha fazla parametre, daha az serbestlik derecesi, modelin daha kötü tahmin gücü.

Kalkışın gerçekleştiği gecikme noktasında MA ve \ veya AR bölümlerini içeren modeli tahmin etmeye çalışın VE ayrıca bilgi kriterlerinden birine (örnek boyutuna bağlı olarak AIC veya BIC) bakın, bu size hangi modelin daha fazla olduğuna dair daha fazla fikir verecektir cimri. Örnek dışı tahmin alıştırmaları da burada kabul edilir.


+1, bu anlatmaya çalıştığım ama yapamadım :)
mpiktas

8

Alışılmış tüm özelliklere sahip basit bir AR (1) modeli belirlediğimizi varsayalım,

yt=βyt-1+ut

Hata teriminin teorik kovaryansını şu şekilde belirtin:

γjE(utut-j)

Eğer biz hata terimini gözlemlemek olabilir, o zaman hata teriminin örneklem otokorelasyon olarak tanımlanır

ρ~jγ~jγ~0

nerede

γ~j1nΣt=j+1nutut-j,j=0,1,2 ...

Ancak uygulamada, hata terimini gözlemlemiyoruz. Dolayısıyla, hata terimiyle ilgili örnek otokorelasyon, tahminlerdeki kalıntılar kullanılarak tahmin edilecektir.

γ^j1nΣt=j+1nu^tu^t-j,j=0,1,2 ...

Box-Pierce Q-istatistiği (Ljung-Box Q sadece asimptotik olarak nötr ölçekli bir versiyonudur)

SBP=nΣj=1pρ^j2=Σj=1p[nρ^j]2d???χ2(p)

Bizim sorunumuz tam olarak bu modelde asemptotik olarak ki-kare dağılımına sahip olup olamayacağı (hata teriminde otokorelasyon yokluğunda sıfır) olup olmadığıdır. Bu nedenle, her ve herkes gerçekleşmesi için SBP
asimptotik standart Normal olmalıdır. Bunu kontrol etmenin bir yolunρ^j aynı asimptotik dağılımına sahiptirnρ^ (gerçek hatalar kullanılarak oluşturulmuştur ve bu nedenle null altında istenen asimtotik davranışa sahiptir).nρ~

Bizde var

u^t=yt-β^yt-1=ut-(β^-β)yt-1

burada β tutarlı tahmin edicisi. Yaniβ^

γ^j1nΣt=j+1n[ut-(β^-β)yt-1][ut-j-(β^-β)yt-j-1]

=γ~j1nt=j+1n(β^β)[utytj1+utjyt1]+1nt=j+1n(β^β)2yt1ytj1

Numunenin durağan ve ergodik olduğu varsayılır ve istenen sıraya kadar momentler olduğu varsayılır. Tahmincisi yana β tutarlıdır iki meblağlar sıfıra gitmek için, bu yeterlidir. Sonuç olarakβ^

γ^jpγ~j

Bu,

ρ^jpρ~jpρj

Ama bu otomatikman garanti etmez için yakınsak nρ^jnρ~j(dağılımda) (rasgele değişkenlere uygulanan dönüşümbağlı olduğu için burada sürekli eşleme teoreminin geçerli olmadığını düşünün). Bunun olabilmesi için ihtiyacımız varn

nγ^jdnγ~j

(payda -tilde veya hat- her iki durumda da hata teriminin varyansına yakınlaşacaktır, bu yüzden sorunumuz için tarafsızdır).γ0

Sahibiz

nγ^j=nγ~j-1nΣt=j+1nn(β^-β)[utyt-j-1+ut-jyt-1]+1nΣt=j+1nn(β^-β)2yt-1yt-j-1

Soru yani: tarafından şimdi çarpılır bu iki toplamları, do , olasılıkla sıfıra git, böylecenasimptotik olarak?nγ^j=nγ~j

İkinci toplamda

1nΣt=j+1nn(β^-β)2yt-1yt-j-1=1nΣt=j+1n[n(β^-β)][(β^-β)yt-1yt-j-1]

Beri rastgele değişken yakınsak ve β tutarlıdır bu sıfıra gider.[n(β^-β)]β^

İlk toplam için burada da o sahip bir rastgele değişkenin yakınsar, ve böylece [n(β^-β)]

1nΣt=j+1n[utyt-j-1+ut-jyt-1]pE[utyt-j-1]+E[ut-jyt-1]

İlk beklenen değer olan standart AR (1) modelinin varsayımları ile sıfırdır. Ancak bağımlı değişken geçmiş hatalara bağlı olduğundan beklenen ikinci değer değildir .E[utyt-j-1]

Yani aynı asimptotik dağılım olmaznρ^j. Ancak, ikincisinin asimptotik dağılımı standart Normal'dir, bu da rv'yi karelerken ki-kare dağılımına yol açar.nρ~j

Bu nedenle, saf zaman serisi modelinde Box-Pierce Q ve Ljung-Box Q istatistiğinin asimptotik ki-kare dağılımı olduğu söylenemez, bu nedenle test asimptotik gerekçesini kaybeder.

Bunun nedeni, tasarımın sağ tarafındaki değişkenin (burada bağımlı değişkenin gecikmesi) hata terimine kesinlikle dışsal olmaması ve BP / LB Q istatistiğinin sahip olması için böyle katı bir eksojenliğin gerekli olduğunu bulduk. varsayılan asimtotik dağılım.

Burada sağ taraftaki değişken sadece "önceden belirlenmiştir" ve Breusch-Pagan testi daha sonra geçerlidir. (asimptotik olarak geçerli bir test için gerekli koşulların tamamı için, bkz. Hayashi 2000, s. 146-149).


1
"Ancak bağımlı değişken geçmiş hatalara bağlı olduğundan beklenen ikinci değer değildir." Buna katı dışsallık denir . Bunun güçlü bir varsayım olduğunu kabul ediyorum ve sadece zayıf dışsallık kullanarak AR (p) çerçevesini onsuz oluşturabilirsiniz . Breusch-Godfrey testinin bir anlamda daha iyi olmasının nedeni budur : null doğru değilse, BL gücü kaybeder. BG zayıf eksojeniteye dayanmaktadır. Her iki test de bazı ortak ekonometrik uygulamalar için iyi değildir, bkz. Örneğin bu Stata'nın sunumu, s. 4/44.
Aksakal

3
@Aksakal Referansınız için teşekkürler. Asıl mesele, sıkı bir dışsallık olmadan, Box-Pierce / Ljung-Box'un asimtotik bir ki-kare dağılımına sahip olmaması, yukarıdaki matematiğin gösterdiği şeydir. Zayıf dışsallık (yukarıdaki modelde bulunur) onlar için yeterli değildir. Bu, bağlantı verdiğiniz sununun s. 3/44.
Alecos Papadopoulos

2
@AlecosPapadopoulos, inanılmaz bir yazı !!! Cross Validated'da burada karşılaştığım en iyi birkaç kişi arasında. Keşke bu uzun iş parçacığında yok olmaz ve birçok kullanıcı gelecekte bulabilir ve bundan yararlanabilir.
Richard Hardy

3

"Sağ" saatte sıfırlamadan önce (zor bir kuraldan çok bir görüş gibi görünüyor), "gecikmenin" doğru tanımlandığından emin olun.

http://www.stat.pitt.edu/stoffer/tsa2/Rissues.htm

Yukarıdaki bağlantıda Sayı 4'ün altındaki bölümden alıntı:

".... Ljung-Box istatistik grafiği için gösterilen p-değerleri yanlış çünkü p-değerlerini hesaplamak için kullanılan serbestlik derecesi gecikme yerine gecikme - (p + q). Yani, kullanılan prosedür artıkların uygun bir modelden olduğu gerçeğini hesaba katmaz ve EVET, en az bir R çekirdeği geliştiricisi bunu bilir .... "

Edit (01/23/2011): İşte Burns'ün yardımcı olabilecek bir makalesi:

http://lib.stat.cmu.edu/S/Spoetry/Working/ljungbox.pdf


@ bil_080'de OP, R'den bahsetmez ve R'deki Box.test için yardım sayfasından düzeltmeden bahseder ve manuel olarak sağlamanız gerekmesine rağmen düzeltmeye izin verecek bir argümana sahiptir.
mpiktas

@mpiktas, Hata! Haklısın. Bunun bir R sorusu olduğunu düşündüm. Yorumunuzun ikinci bölümüne gelince, Ljung-Box istatistiklerini kullanan birkaç R paketi var. Bu nedenle, kullanıcının paketin "gecikmesinin" ne anlama geldiğini anlamasını sağlamak iyi bir fikirdir.
bill_080

Teşekkürler - R kullanıyorum, ama soru genel bir soru. Sadece güvende olmak için, testi portlar paketindeki LjungBox işleviyle ve Box.test ile yapıyordum.
user2875

2

İplik "otokorelasyon için Test: Breusch-Godfrey karşı Ljung-Box" Ljung-Box testi de otoregresif modelin durumunda esasen geçerli olmadığından gösterilmektedir. Ayrıca bunun yerine Breusch-Godfrey testinin kullanılması gerektiğini gösterir. Bu, sorunuzun ve yanıtların alaka düzeyini sınırlar (her ne kadar cevaplar genel olarak iyi noktalar içerebilir).


LB testi ile ilgili sorun, otoregresif modellerin diğer regresörlere sahip olması, yani ARM modelleri değil ARMAX olmasıdır. OP, soruda ARMAX değil ARMA'yı açıkça belirtir. Dolayısıyla cevabınızın yanlış olduğunu düşünüyorum.
Aksakal

@Aksakal, Alecos Papadopoulos'un cevabından (ve altındaki yorumlarda) Ljung-Box testinin her iki durumda da uygulanamaz olduğunu, yani saf AR / ARMA ve ARX ​​/ ARMAX'ı açıkça görüyorum. Bu nedenle, sizinle aynı fikirde değilim.
Richard Hardy

Alecos Papadopoulos'un yanıtı iyi, ama eksik. Ljung-Box testinin katı dışsallık varsayımına dikkat çekiyor, ancak varsayımla ilgili sorun yaşarsanız, LB testinin kullanılmaya uygun olduğunu belirtmez. O ve ben LB'yi tercih ettiğimiz KŞ testi zayıf eksojeniteye dayanmaktadır. Testleri genel olarak daha zayıf varsayımlarla kullanmak daha iyidir. Bununla birlikte, BG testinin varsayımları bile çoğu durumda çok güçlüdür.
Aksakal

@Aksakal, Bu sorunun ayarı oldukça belirgindir - bir ARMA modelindeki kalıntıları dikkate alır. Burada önemli olan, BG testi işe yaramazken LB çalışmaz (buradaki Alecos postunda ve yukarıda belirtilen iplikte açıkça gösterildiği gibi). Tabii ki, diğer ortamlarda işler olabilir ( BG testinin varsayımları bile birçok durumda çok güçlüdür ) - ancak bu konudaki endişe bu değildir. Ayrıca, ne alamadım varsayım İfadende olduğunu sen varsayımıyla ediyoruz ince, daha sonra LB testi kullanımına Tamam ise . Bunun Alecos noktasını geçersiz kılması gerekiyor mu?
Richard Hardy

1

Escanciano ve Lobato , Pierce-Box testine ve iyileştirmelerine (Ljung-Box testini de içeren) dayalı otomatik, veri odaklı gecikme seçimi ile bir portmanteau testi yaptılar .

Yaklaşımlarının amacı, kullanılacak en uygun gecikme sayısını seçmek için - ARMA modellerinin tanımlanması ve tahmininde yaygın olan AIC ve BIC kriterlerini birleştirmektir . Girişlerinde, sezgisel olarak, `` BIC kriteri kullanılarak yapılan test, tip I hatasını düzgün bir şekilde kontrol edebildiğini ve seri korelasyon ilk sırada olduğunda daha güçlü olduğunu '' öneriyorlar. Bunun yerine, AIC tabanlı testler yüksek dereceli seri korelasyona karşı daha güçlüdür. Bu nedenle prosedürleri, otokorelasyonların küçük görünmesi ve sadece düşük sırada mevcut olması durumunda BIC tipi bir gecikme seçimi ve aksi takdirde AIC tipi bir gecikme bölümü seçer.

Test Rpakete uygulanır vrtest(fonksiyona bakınız Auto.Q).


1

min(20,T-1)lnTT

İlki Box, Jenkins ve Reinsel'in yazarlık kitabından olması gerekiyordu. Zaman Serisi Analizi: Tahmin ve Kontrol. 3. baskı. Englewood Cliffs, NJ: Prentice Hall, 1994 .. Ancak, s.314'teki gecikmeler hakkında söyledikleri: resim açıklamasını buraya girin

Hiçbir şekilde güçlü bir argüman ya da öneri değil, ama insanlar bunu bir yerden bir yere tekrarlıyorlar.

Gecikmenin ikinci ayarı Tsay, Finansal Zaman Serisinin RS Analizi'dir. 2. Baskı. Hoboken, NJ: John Wiley & Sons, Inc., 2005, işte s.33'te yazdığı:

Birçok m değeri sıklıkla kullanılır. Simülasyon çalışmaları, m ≈ ln (T) seçiminin daha iyi güç performansı sağladığını göstermektedir.

Bu biraz daha güçlü bir argüman, ancak ne tür bir çalışmanın yapıldığına dair bir açıklama yok. Yani, bunu bir yüz değerinde kabul etmem. Ayrıca mevsimsellik konusunda uyarıyor:

Bu genel kural, mevsimsellik katlarının gecikmeli otokorelasyonlarının daha önemli olduğu mevsimsel zaman serilerinin analizinde değişiklik yapılmasını gerektirir.

Özetlemek gerekirse, teste biraz gecikme yapmanız ve devam etmeniz gerekiyorsa, bu ayarlardan herhangi birini kullanabilirsiniz ve bu iyi, çünkü çoğu uygulayıcının yaptığı şey bu. Ya tembeliz ya da daha büyük olasılıkla bu şeyler için zamanımız yok. Aksi takdirde, ele aldığınız dizinin istatistiklerinin gücü ve özellikleri hakkında kendi araştırmanızı yapmanız gerekir.

GÜNCELLEME.

xt

yt=xt'β+φ(L)yt+ut

Ancak OP, ARMAX yaptığını belirtmedi, aksine, ARMA'dan açıkça bahsetti:

Bir ARMA modeli bir zaman serisine uyduktan sonra, kalıntıları Ljung-Box portmanteau testi ile kontrol etmek yaygındır.

LB testi ile ilgili potansiyel bir soruna işaret eden ilk bildirilerden biri Dezhbaksh, Hashem (1990) idi. “ Dinamik Doğrusal Modellerde Seri Korelasyon Testlerinin Uygunsuz Kullanımı ,” Ekonomi ve İstatistiklerin Gözden Geçirilmesi, 72, 126-132. İşte makaleden alıntı:

resim açıklamasını buraya girin

Gördüğünüz gibi, ARMA gibi saf zaman serisi modelleri için LB testi kullanmaya itiraz etmiyor. Ayrıca, standart ekonometri aracı EViews kılavuzundaki tartışmaya bakınız :

Seri, ARIMA tahmininden kalanları temsil ediyorsa, daha önce tahmin edilen AR ve MA terimlerinden daha az otokorelasyon sayısını temsil edecek şekilde uygun serbestlik dereceleri ayarlanmalıdır. Ayrıca, bir ARMAX spesifikasyonundan kalanlara uygulanan bir Ljung-Box testinin sonuçlarının yorumlanmasına da dikkat edilmelidir (bu ayarda testin sonlu örnek performansına dair simülasyon kanıtı için bkz. Dezhbaksh, 1990).

Evet, ARMAX modelleri ve LB testine dikkat etmelisiniz, ancak LB testinin tüm otoregresif seriler için her zaman yanlış olduğunu belirten kapsamlı bir açıklama yapamazsınız.

GÜNCELLEME 2

Alecos Papadopoulos'un cevabı, Ljung-Box testinin neden sıkı bir dışsallık varsayımı gerektirdiğini gösteriyor . Gönderiinde göstermiyor, ancak Breusch-Gpdfrey testi (başka bir alternatif test) elbette daha iyi olan zayıf eksojenliği gerektirir . Bu Greene, Ekonometri, 7nci baskı. testler arasındaki farklar üzerine diyor, s.923:

xtεsxt


Soruyu, son cevabım tarafından aktif konuların tepesine çarptığından cevaplamaya karar verdiğinizi düşünüyorum. İlginç bir şekilde, testin dikkate alınan ayarda uygunsuz olduğunu ve tüm iş parçacığını sorunlu hale getirdiğini ve içindeki cevapları özellikle böyle olduğunu iddia ediyorum. Sizce bu sorunu hiç bahsetmeden görmezden gelen başka bir cevap göndermenin iyi bir uygulama olduğunu düşünüyor musunuz (tıpkı önceki tüm cevapların yaptığı gibi)? Yoksa benim cevabımın mantıklı olmadığını mı düşünüyorsunuz (bu sizinki gibi bir cevap göndermeyi haklı çıkaracaktır)?
Richard Hardy

Güncelleme için teşekkürler! Ben bir uzman değilim, ancak Alecos Papadopoulos'un "Otokorelasyon testi: Ljung-Box'a karşı Breusch-Godfrey" ve onun cevabının altındaki yorumlarda Ljung-Box'ın gerçekten de saf ARMA'dan (ve ayrıca ARMAX) modelleri. İfadeler kafa karıştırıcıysa, oradaki matematiği kontrol edin, iyi görünüyor. Bence bu çok ilginç ve önemli bir soru, bu yüzden burada hepimiz arasında bir anlaşma bulmak istiyorum.
Richard Hardy

0

... h, koşullar altında LB testinin sahip olabileceği gücü korumak için mümkün olduğunca küçük olmalıdır. H arttıkça güç düşer. LB testi son derece zayıf bir testtir; çok fazla örneğiniz olmalı; n anlamlı olmak için ~> 100 olmalıdır. Maalesef daha iyi bir test görmedim. Ama belki biri var. Birini bilen var mı?

Paul3nt


0

Diğerlerinin verilerinize bağlı olacağını söylediği nedenlerden dolayı her durumda çalışan doğru bir cevap yoktur.

mbenn(n2-2,40)

Elbette tüm varsayılanlar yanlıştır ve bu bazı durumlarda kesinlikle yanlış olacaktır. Birçok durumda, bu başlamak için kötü bir yer olmayabilir.


0

Size R paketimizi önereyim . Herhangi bir ayarlama parametresi gerektirmeyen ve iyi istatistiksel boyut ve güce sahip olan Dalgacık tabanlı beyaz gürültü testleri uyguladı.

Ayrıca, yakın zamanda Rob Hyndman'ın konuyla ilgili mükemmel bir tartışma olan "Ljung-Box testi üzerine düşünceler" i buldum .

Güncelleme: Bu yazıda ARMAX ile ilgili alternatif tartışma göz önüne alındığında, hwwntest'e bakmak için bir başka teşvik de, ARMA (p, q) modelinin alternatif bir hipotezine karşı testlerden biri için teorik bir güç fonksiyonunun bulunmasıdır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.