Bir trend durağan serisi ARIMA ile modellenebilir mi?


12

ARIMA (X) ile modelleme için gereken sabit seriler hakkında bir sorum / karışıklığım var. Bunu daha çıkarsama (bir müdahalenin etkisi) olarak düşünüyorum, ancak çıkarımın karşıt tahmininin yanıtta herhangi bir fark yaratıp yaratmadığını bilmek istiyorum.

Soru:

Okuduğum tüm tanıtım kaynakları, serinin durağan olması gerektiğini, bu bana mantıklı geldiğini ve arimadaki "I" nin geldiği yer (farklı) belirtiyor.

Beni şaşırtan şey, ARIMA (X) 'daki trendlerin ve sapmaların kullanılması ve (varsa) sabit gereksinimler için çıkarımlarıdır.

Eksojen bir değişken olarak sabit / sürüklenme terimi ve / veya eğilim değişkeninin kullanılması (yani bir regresör olarak 't' eklenmesi) serilerin durağan olma gereksinimini ortadan kaldırıyor mu? Yanıt, serinin bir birim köküne (örneğin adf testi) sahip olup olmamasına veya belirleyici bir eğilime sahip olmasına rağmen birim köküne sahip olmasına bağlı olarak farklı mıdır?

VEYA

ARIMA (X) kullanmadan önce bir seri her zaman sabit olmalı, farklılaşma ve / veya dezavantajla yapılmalı mı?

Yanıtlar:


12

Yorumlara baktığımızda, deterministik veya stokastik bir eğilim arasında nasıl seçim yapılacağı sorusunu ele almadığımız anlaşılıyor. Yani, her davanın sonuçları veya özellikleri yerine pratikte nasıl ilerlenir.

Devam etmenin bir yolu şudur: ADF testini uygulayarak başlayın.

  • Birim kök null değeri reddedilirse işimiz biter. Eğilim (varsa), deterministik bir doğrusal eğilim ile temsil edilebilir.
  • ADF testinin null değeri reddedilmezse, KPSS testini uygularız (burada null hipotezi ters, durağanlık veya doğrusal bir eğilim etrafında durağanlıktır).

    o KPSS testinin null değeri reddedilirse, bir birim kök olduğu sonucuna varırız ve verilerin ilk farklarıyla çalışırız. Serinin ilk farkları üzerine, diğer regresörlerin önemini test edebilir veya bir ARMA modeli seçebiliriz.

    o KPSS testinin null değeri reddedilmezse, verilerin çok bilgilendirici olmadığını söylemek zorundayız çünkü null hipotezlerin hiçbirini reddedemedik. Bu durumda, serinin ilk farklarıyla çalışmak daha güvenli olabilir.

Önceki bir cevapta belirtildiği gibi, bu testlerin aykırı değerlerin varlığından (örneğin, verileri kaydederken bir hata nedeniyle tek bir zaman noktasında bir aykırı veya örneğin, belirli bir zaman noktasından itibaren). Bu nedenle, bu sorunların da kontrol edilmesi ve bazı potansiyel aykırı değerler için regresörler ekledikten sonra önceki analizi tekrarlamanız önerilir.


Müthiş! Yukarıdaki soru sorum doğru bir trendin neye benzediğini görürsek, trend içeren ADF testini kullandığım doğru mu (gönderdiğim bağlantıda # 3 seçenek)?
B_Miner

Son soru - bir ARIMA'ya uyduğunuz durum hakkında ne yapıyorsunuz, bir seriye ARIMA (0,1,1) deyin ve farkın ortalaması sıfır değil mi? Bu, modele bir sabit eklediğinize inanıyorum - bu da orijinal serideki doğrusal bir eğilimi temsil ediyor. Bu durum ne anlama geliyor? Orijinal serideki eğilim belirleyici midir, çünkü serileri farklılaştırma eğilimi ortadan kaldırmamıştır?
B_Miner

@B_Miner İlk yorumunuzla ilgili olarak, sadece bir engel ekleyerek başlardım. Eğilim biraz üstel görünüyorsa, doğrusal eğilimin eğim parametresini de ekleyebilir ve anlamlı olup olmadığını görebilirsiniz. Genel olarak, birkaç parametreli bir modelle başlamak daha iyidir ve kalıntıların teşhisi tatmin edici değilse, başka elementler eklemeyi düşünün.
javlacalle

@B_Miner İlk farkların alınması hem deterministik hem de stokastik bir eğilimi ortadan kaldırır. Kesişen bir modelde farklı serilerde bir eğilim görürseniz, tekrar fark almayı düşünmelisiniz (yani ikinci bir birim kökü test edin).
javlacalle

1
@pidosaurus ve ADF ve KPSS testleri arasında uzlaşma eksikliği, küçük örneklem büyüklüğü, aykırı değerlerin varlığı, doğrusal olmayan eğilim nedeniyle olabilir ... eğer daha fazla incelemeden sonra hangisinin daha uygun olduğu hala net değilse, düşünmek daha güvenli olabilir birim kök varlığı. Bana doğrusal olmayan bir eğilimin varlığını, formun bir kuadratik eğilim önerilen verilerinize hızlı bir görünümü olabilir uygun. bir1t+bir2t2
javlacalle

5

Unutmayın ki farklı durağanlık türleri ve onlarla nasıl başa çıkılacağının farklı yolları vardır. Dört yaygın olan:

1) Deterministik eğilimler veya eğilim durağanlığı. Diziniz bu tür bir eğilimden düşüyorsa veya regresyon / modelde bir zaman eğilimi içeriyorsa. Bu konuda Frisch – Waugh – Lovell teoremini kontrol etmek isteyebilirsiniz.

2) Seviye kaymaları ve yapısal kırılmalar. Bu durumda, her bir mola için bir kukla değişken eklemelisiniz veya numuneniz yeterince uzunsa, her rejimi ayrı ayrı modelleyin.

3) Değişen varyans. Örnekleri ayrı ayrı modelleyin veya değişen varyansı ARCH veya GARCH modelleme sınıfını kullanarak modelleyin.

4) Serinizde birim kök varsa. Genel olarak, değişkenler arasındaki eşbütünleşme ilişkilerini kontrol etmelisiniz, ancak tek değişkenli tahminle ilgilendiğiniz için, entegrasyon sırasına bağlı olarak bir veya iki kez fark vermelisiniz.

ARIMA modelleme sınıfını kullanarak bir zaman serisini modellemek için aşağıdaki adımlar uygun olmalıdır:

1) ACF ve PACF'ye serinin sabit olup olmadığını görmek için zaman serisi grafiğiyle birlikte bakın.

2) Serisi bir birim kök için test edin. Bu, en yaygın olanlardan bazıları ADF testi, Phillips-Perron (PP) testi, durağanlığa sahip olmayan KPSS testi veya en verimli olan DF-GLS testi ile geniş bir test yelpazesi ile yapılabilir. Yukarıda belirtilen testlerin NOT! Serinizin yapısal bir kırılma içermesi durumunda, bu testler bir birim kökün boşluğunu reddetmemeye eğilimlidir. Bu testlerin sağlamlığını test etmek istiyorsanız ve bir veya daha fazla yapısal kırılmadan şüpheleniyorsanız endojen yapısal kırılma testleri kullanmalısınız. İki yaygın olan, bir endojen yapısal kırılmaya izin veren Zivot-Andrews testi ve iki yapısal kırılmaya izin veren Clemente-Montañés-Reyes'dir. İkincisi iki farklı modele izin verir.

3) Seride birim kök varsa, seriyi fark etmelisiniz. Daha sonra ACF, PACF ve zaman serisi grafiğine bakmalı ve muhtemelen güvenli tarafta ikinci bir birim kök olup olmadığını kontrol etmelisiniz. ACF ve PACF, kaç AR ve MA terimini dahil etmeniz gerektiğine karar vermenize yardımcı olacaktır.

4) Seri bir birim kökü içermiyor, ancak zaman serisi grafiği ve ACF, serinin belirleyici bir eğilime sahip olduğunu gösteriyorsa, modeli takarken bir trend eklemeniz gerekir. Bazı insanlar, belirleyici bir eğilim içerdiğinde seriyi ayırmanın tamamen geçerli olduğunu iddia etseler de, süreçte bilgi kaybedilebilir. Daha az eklemeniz gereken AR ve / veya MA terimleri olduğunu görmek için fark etmek iyi bir fikirdir. Ancak bir zaman eğilimi geçerlidir.

5) Farklı modelleri takın ve her zamanki teşhis kontrolünü yapın, üzerine yerleştirdiğiniz örnek verilen en iyi modeli seçmek için bir bilgi kriteri veya MSE kullanmak isteyebilirsiniz.

6) En iyi monte edilmiş modellerde örnek tahmini yapın ve tahmin etmek için bunları kullanırken en iyi performansı görmek için MSE, MAPE, MAD gibi kayıp fonksiyonlarını hesaplayın, çünkü yapmak istediğimiz şey budur!

7) Patron gibi örnek tahmininizi yapın ve sonuçlarınızdan memnun olun!


Ve sorunuzu hızlı bir şekilde cevaplamak için. Evet yapabilir.
Plissken

Yeteri kadar üne sahip olmadığım için yukarıdaki yorum yapmama izin verilmedi, ancak beyaz bir gürültü sürecinin sabit olduğunu belirtmek istiyorum. Ortalama ve varyansı zaman içinde değişmez, bu yüzden sabittir!
Plissken

Dan, harika cevap! Burada son yorumunuzla ilgili olarak, durağan olan beyaz gürültü kalıntısı ile sonuçlanırsanız, o zaman seriyi yeterince modellenmiş olduğunuzu (yani durağanlık / düzgünce ilgili / uygun şekilde ele aldığınızı) söylüyor musunuz?
B_Miner

1
Evet kesinlikle. Genellikle Ljung-Box Q testi, rastgele olup olmadıklarını görmek için kalıntıları test etmek için kullanılır. Bu durumda model, verilerin yeterli bir temsilidir. Yukarıdaki cevapta bahsetmeyi unuttuğum bir şey de, modeli taktıktan sonra, takılan serinin artıklarının ACF ve zaman serisi grafiğine bakabilmenizdir. Bu, artıklarınızın beyaz gürültü olup olmadığı konusunda iyi bir gösterge verecektir (ACF'de önemli gecikmeler olmamalıdır). Her neyse, çoğu istatistiksel paketin Ljung-Box Q testi için bir komutu var.
Plissken

İşte Ljung-Box Q testi için wiki bağlantısı: en.wikipedia.org/wiki/Ljung%E2%80%93Box_test
Plissken

5

Trendin (veya mevsimsellik gibi başka bir bileşenin) deterministik veya stokastik olup olmadığının belirlenmesi, zaman serisi analizinde bulmacanın bir parçasıdır. Söylenenlere birkaç nokta ekleyeceğim.

1) Deterministik ve stokastik eğilimler arasındaki ayrım önemlidir, çünkü verilerde bir birim kök varsa (örn. Rastgele bir yürüyüş), çıkarım için kullanılan test istatistikleri geleneksel dağılımı izlemez. Bazı ayrıntılar ve referanslar için bu gönderiye bakın .

Rastgele bir yürüyüş simüle edebiliriz (ilk farklılıkların alınması gereken stokastik eğilim), deterministik eğilimin önemini test edebilir ve deterministik eğilimin null reddedildiği vakaların yüzdesini görebiliriz. R'de şunları yapabiliriz:

require(lmtest)
iter <- 10000
cval <- 0.05
n <- 120
rejections <- 0
set.seed(123)
for (i in seq.int(iter))
{
  x <- cumsum(rnorm(n)) # random walk
  fit <- lm(x ~ seq(n))
  if (coeftest(fit)[2,"Pr(>|t|)"] < cval)
    rejections <- rejections + 1
}
100 * rejections / iter
#[1] 88.67

% 5 önem düzeyinde, vakaların% 95'inde null değerini reddetmeyi bekleriz, ancak bu deneyde 10.000 simüle edilmiş rastgele yürüyüşten vakaların sadece ~% 89'unda reddedildi.

Bir birim kökü olup olmadığını test etmek için birim kök testleri uygulayabiliriz . Ancak, lineer bir eğilimin bir birim kökü null değerinin reddedilmemesine yol açabileceğinin farkında olmalıyız. Bununla başa çıkmak için, KPSS testi doğrusal bir eğilim etrafında durağanlığın sıfır olduğunu düşünmektedir.

2) Diğer bir konu, bir süreçteki deterministik bileşenlerin düzeyler veya ilk farklılıklar olarak yorumlanmasıdır. Bir kesişimin etkisi, rastgele bir yürüyüşte olduğu gibi doğrusal bir eğilime sahip bir modelde aynı değildir. İllüstrasyon için bu gönderiye bakın .

yt=μ+yt-1+εt,εt~N-benD(0,σ2).

yt-benyt

yt=μ+yt-1μ+yt-2+εt-1+εt=2μ+yt-2μ+yt-3+εt-2+εt-1+εt=3μ+yt-3+εt-2+εt-1+εt...

Biz geliyoruz:

yt=y0+μt+Σben=1tεben

y0μμμ

Bir serinin grafik gösterimi nispeten açık bir doğrusal eğilim gösteriyorsa, bunun deterministik bir doğrusal eğilimin varlığından mı yoksa rastgele bir yürüyüş sürecinde bir sapmadan mı kaynaklandığından emin olamayız. Tamamlayıcı grafikler ve test istatistikleri uygulanmalıdır.

Ünite kökü ve diğer test istatistiklerine dayanan bir analiz kusursuz olmadığından akılda tutulması gereken bazı uyarılar vardır. Bu testlerin bazıları, dış gözlemlerin veya seviye kaymalarının varlığından etkilenebilir ve her zaman kolay olmayan bir gecikme sırasının seçilmesini gerektirebilir.

Bu bulmacanın bir çözümü olarak, genel uygulamanın, seri durağan görünene kadar (örneğin sıfıra hızlı gitmesi gereken otokorelasyon fonksiyonuna bakmak) ve ardından bir ARMA modeli seçene kadar verilerin farklılıklarını almak olduğunu düşünüyorum.


Greta post- Bu site için kesinlikle büyük bir varlıksınız! Buraya ve diğer yazılarınıza bakmayı merak ettim - serideki seviyelerde bir eğilimin neyin deterministik veya stokastik olduğunu belirlemek için bir ADF veya KPSS testi kullanmak mümkün mü? Bunu buldum: dizide görsel olarak bir eğilim görüyorsanız bunu yapan, testin # 3 seçeneğini kullanın ve reddetmezseniz, faculty.smu.edu/tfomby/eco6375/BJ%20Notes/ADF%20Notes.pdf null, deterministik bir eğilim için kanıtınız var.
B_Miner

Dan'ın yorumuna dayanarak, beyaz gürültü kalıntıları alırsanız, bunların hiçbirinin önemli olmadığını düşünüyorum :)
B_Miner

5

Çok ilginç bir soru, başkalarının ne söyleyeceğini bilmek istiyorum. Ben bir istatistikçi değil, eğitim alan bir mühendisim, böylece birisi mantığımı kontrol edebilir. Mühendisler olarak simüle etmek ve denemek istiyoruz, bu yüzden sorunuzu simüle etmek ve test etmek için motive oldum.

Aşağıda ampirik olarak gösterildiği gibi, ARIMAX'ta bir trend değişkeni kullanmak fark ihtiyacını ortadan kaldırmış ve seri trendini sabit hale getirmiştir. Doğrulamak için kullandığım mantık burada.

  1. AR süreci simülasyonu
  2. Deterministik bir trend eklendi
  3. Dışsal değişken olarak trendle modellenmiş ARIMAX, yukarıdaki serileri farklılaşmadan kullanmak.
  4. Kalıntıları beyaz gürültü açısından kontrol etti ve tamamen rastgele

Aşağıda R kodu ve grafikleri:

set.seed(3215)

##Simulate an AR process
x <- arima.sim(n = 63,list(ar = c(0.7)));
plot(x)

## Add Deterministic Trend to AR
t <- seq(1, 63)
beta <- 0.8
t_beta <- ts(t*beta,frequency=1)
ar_det <- x+t_beta
plot(ar_det)

## Check with arima

ar_model <- arima(ar_det,order=c(1,0,0),xreg=t,include.mean=FALSE)

## Check whether residuals of fitted model is random

pacf(ar_model$residuals)

AR (1) Simüle Edilmiş Arsa resim açıklamasını buraya girin

Deterministik eğilim ile AR (1) resim açıklamasını buraya girin

ARIMAX Eksojen olarak trend olan artık PACF. Kalıntılar rastgele, desen kalmamış resim açıklamasını buraya girin

Yukarıda görülebileceği gibi, deterministik eğilimin ARIMAX modelinde ekzojen bir değişken olarak modellenmesi, farklılaşma ihtiyacını ortadan kaldırmaktadır. En az deterministik durumda çalıştı. Bunun tahmin edilmesi ya da modellenmesi çok zor olan stokastik bir trendle nasıl davranacağını merak ediyorum.

İkinci sorunuza cevap vermek için EVET ARIMAX dahil tüm ARIMA sabit hale getirilmelidir. En azından ders kitapları böyle söylüyor.

Ayrıca, yorumlandığı gibi bu makaleye bakın . Deterministik Trend ve Stokastik Trend ve eğilimi durağan hale getirmek için bunların nasıl kaldırılacağı hakkında çok net bir açıklama ve bu konuda çok güzel bir literatür araştırması. Sinir ağı bağlamında kullanırlar, ancak genel zaman serileri problemi için yararlıdır. Nihai tavsiyeleri, belirleyici eğilim olarak açıkça tanımlandığında, lineer detrending yapmak, zaman serisini sabit hale getirmek için farklılıklar uygulamaktır. Jüri hala orada, ancak bu makalede alıntılanan çoğu araştırmacı, doğrusal dezavantajın aksine farklılık öneriyor.

Düzenle:

Aşağıda, dışsal değişken ve fark arima kullanarak, sürüklenme stokastik süreci ile rastgele yürüyüş. Her ikisi de aynı cevabı veriyor gibi görünüyor ve özünde aynı.

library(Hmisc)

set.seed(3215)

## ADD Stochastic Trend to simulated Arima this is AR(1) with unit root with non zero mean

y = rep(NA,63)
y[[1]] <- 2


for (i in 2:63)  {
y[i] <-3+1*y[i-1]+ rnorm(1, mean = 0, sd = 1)
} 

plot(y,type="l")

y_ts <- ts(y,frequency=1)

## Lag to create Xreg

y_1 <- Lag(y,shift=1)


## Start from 2 value to avoid NA and make it equal length with xreg

y <- window(y_ts,start =2,end=63)
xreg1 <- y_1[-1]

## Check the values with ARIMA and xreg

g <- arima(y,order=c(0,0,0),xreg=xreg1)

pacf(g$residuals)

## Check the values with ARIM

g1 <- arima(y,order=c(0,1,0))

pacf(g1$residuals)

## 

ARIMA(0,0,0) with non-zero mean 

Coefficients:
      intercept   xreg1
         3.1304  0.9976
s.e.     0.2664  0.0025

Bu yardımcı olur umarım!


Ben de başkalarının görüşlerine ilgi duyuyorum - emin değilim, kalan beyaz gürültü, sabit olma serisinin gereksinimini karşılıyor mu - yani beyaz gürültüye ulaşırsanız memnun olabilir misiniz? Veya, eksojen değişkenin dahil edilmesi aslında "eğilimin giderilmesi" ve bu dizinin durağan hale gelmesi için etkili midir? Bu daha sonraki soruya bir kontrolün, eğer doğrusal regresyonla eğilimi kaldırırsanız ve daha sonra arima'ya (1,0,0) uyursanız aynı modeli (ar1 katsayısı, vb.) Elde edip etmediğinizi merak ediyorum ... Bunu yaptım ve sonuçlar yakın. Dolayısıyla, eksojen değişkenin eklenmesi detrending ile aynıdır.
B_Miner

Evet aynı, birkaç ay önce bir sinir ağı tahmin makalesinde karşılaştım. Eğer bulursam referans vereceğim.
tahminci

Birim kök olduğunda veya modelde sabit olduğunda durum hakkında herhangi bir fikir var mı?
B_Miner

Cevabımı referans verdiğim makale ile güncelledim.
tahminci

Sanırım kurtarmamış olabilirsiniz.
B_Miner
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.