Hareketli ortalama modeli hata terimleri


18

Bu Box-Jenkins MA modellerinde temel bir sorudur. Anladığım kadarıyla, bir MA modeli temelde zaman serisi değerleri Y önceki hata terimleri karşı doğrusal bir regresyonudur . . . , e t - net,...,etn . Yani, gözlemi Yilk olarak önceki değerlerine karşı gerilemektedir . . . , Y, t - nYt1,...,Ytn ve daha sonra bir veya daha fazla YY^ değerleri, MA modeli için hata terimi olarak kullanılır.

Ancak ARIMA (0, 0, 2) modelinde hata terimleri nasıl hesaplanır? MA modeli otoregresif bir parça olmadan kullanılır ve bu nedenle tahmini bir değer yoksa, muhtemelen bir hata terimi alabilir miyim?


1
Hayır, sanırım MA (n) modelinin tanımını karıştırıyorsunuz, burada regresyon sadece açısından , tahminiyle e t - ietieti verilerden tahmin edildiği tahminiyle karıştırıyorsunuz .
Xi'an

1
Sorunuzdaki temel sorun, MA modelinin temelde doğrusal bir regresyon olduğunu söylemenizdir. Hata terimlerini gözlemlemediğimizden bu doğru değildir.
mpiktas

Ben hata terimi düşünüyorum olduğunu aslında nerede, Y ise E ( Y | Y t , . . . , T - n ) veya basitçe Y t - Y t - 1 . Bu nedenle, bir MA modeli parametre tahmini, Y kısmi otokorelasyon fonksiyonunda tekrar eden bir kalıptan , yani artıkların davranışından türetilir . Bunun yerine AR parametresi tahmini, acf (Y) 'nin yinelenen bir modelini temel alır.YtYt^Y^E(Y|Yt,...,tn)YtYt1Y
Robert Kubrick

Yanıtlar:


20

MA Model Tahmini:

Şimdi 100 zaman noktası olan bir seri alalım ve bunun kesişmesiz MA (1) modeli ile karakterize edildiğini varsayalım. Sonra model tarafından verilir

yt=εtθεt1,t=1,2,,100(1)

Buradaki hata terimi gözlenmez. Bunu elde etmek için Box ve ark. Zaman Serisi Analizi: Tahmin ve Kontrol (3. Baskı) , sayfa 228 , hata teriminin,

εt=yt+θεt1

Yani için hata terimi , ε 1 = y 1 + θ ε 0 Şimdi θ değerini bilmeden bunu hesaplayamayız . Bu nedenle, bunu elde etmek için, modelin İlk veya Ön tahminini hesaplamamız gerekir, Box ve ark. söz konusu kitabın, Bölüm 6.3.2, sayfa 202 ,t=1

ε1=y1+θε0
θ

MA ( q ) işleminin ilk otokorelasyonunun sıfır olmadığı ve model parametreleri açısından ρ k = - θ k + θ 1 θ k + 1 + θ 2 θ k + 2 olarak yazılabileceği gösterilmiştir. + + θ q - k θ qqq yukarıda ifade ρ 1 , ρ 2, ρ q açısından İçeride ISTV melerin RWMAIWi'nin 1 , θ 2 , , θ q , malzeme q denklemler q bilinmeyen. Ön tahminleri θ s tahminleri değiştirilmesi ile elde edilebilir r k için ρ k yukarıdaki denklemde

ρk=θk+θ1θk+1+θ2θk+2++θqkθq1+θ12+θ22++θq2k=1,2,,q
ρ1,ρ2,ρqθ1,θ2,,θqqqθrkρk

rkθ=0.5

ε1=y1+0.5ε0
ε0tε1
  1. Koşullu Olasılık
  2. Koşulsuz Olasılık

Box ve ark. Bölüm 7.1.3 sayfa 227 , değerleriε0 olarak yaklaşık olarak sıfır ile değiştirilebilirnorta veya büyükse, bu yöntem Koşullu Olasılıktır. Aksi takdirde, Koşulsuz Olasılık kullanılır;ε0"Havalandırma" terimi, geri tahmin yoluyla elde edilir, Box vd. bu yöntemi önerin. Geri tahmin hakkında daha fazla bilgiyi Bölüm 7.1.4 sayfa 231'de bulabilirsiniz .

İlk tahminleri ve değerini aldıktan sonra ε0, son olarak, hata teriminin özyinelemeli hesaplamasına devam edebiliriz. Sonra son aşama modelin parametresini tahmin etmektir(1), bunun artık ön tahmin olmadığını unutmayın.

Parametreyi tahmin ederken θ, I use Nonlinear Estimation procedure, particularly the Levenberg-Marquardt algorithm, since MA models are nonlinear on its parameter.

Overall, I would highly recommend you to read Box et al. Time Series Analysis: Forecasting and Control (3rd Edition).


Can you explain what is rk?
Piyush Divyanakar

4

A Gaussian MA(q) model is defined (not only by Box and Jenkins!) as

Yt=i=1qϑieti+σet,etiidN(0,1)
so the MA(q) model is a "pure" error model, the degree q defining how far the correlation goes back.

1
I'm still not clear on where et comes from. Is et a random variable? I don't think so, otherwise why to bother looking for q correlations?
Robert Kubrick

1
Why is there a minus in your formula? Usually the minus is for AR models. Mathematically is not an issue, I'm just curious, since I've never seen minus in MA models.
mpiktas

3
@RobertKubrick, are you aware of Wold decomposition theorem? Each stationary process has its corresponding innovation process, that is from where terms et come.
mpiktas

1
@mpiktas Thanks, that gives some background on the error term, but I am still not clear on where the innovation process comes from, for an innovation to exist there's got to be a forecast somewhere (en.wikipedia.org/wiki/Innovation_(signal_processing)). Is the optimal Y forecast simply E(Y), that is the mean of the series?
Robert Kubrick

1

You say "the observation Y is first regressed against its previous values Yt1,...,Ytn and then one or more YY^ values are used as the error terms for the MA model." What I say is that Y is regressed against two predictor series et1 and et2 yielding an error process et which will be uncorrelated for all i=3,4,,,,t .We then have two regression coefficients: θ1 representing the impact of et1 and θ2 representing the impact of et2. Thus et is a white noise random series containing n-2 values. Since we have n-2 estimable relationships we start with the assumption that e1 and e2 are equal to 0.0 . Now for any pair of θ1 and θ2 we can estimate the t-2 residual values. The combination that yields the smallest error sum of squares would then be the best estimates of θ1 and θ2.


What are the 2 other predictor series? I am asking because when I look at the literature I have it's never clearly specified. Are these 2 other series unrelated to Y? I had the impression that all ARIMA formulation is limited to the Y series.
Robert Kubrick

1
The 2 predictors are the lags of the error terms. Since these are not known a priori since we do not know the error terms before we begin is why this has to be treated by non-linear estimation.The confusion you are having is that a model that is finite in the past ( i.e. an AR MODEL ) is potentially infinite in the errors AND a model that is finite in the errors ( i.e. an MA MODEL) is potentially infinite in the past of Y.The reason one selects an AR MODEL versus an MA MODEL is for parsimony. Sometimes we construct an ARMA MODEL which blends both the history of Y and the history of the errors.
IrishStat

1
As I commented in the other answer, what I am still missing is what's the optimal forecast for Y, which is used to calculate the innovation etn.
Robert Kubrick

1

See my post here for an explanation of how to understand the disturbance terms in a MA series.

You need different estimation techniques to estimate them. This is because you cannot first get the residuals of a linear regression and then include the lagged residual values as explanatory variables because the MA process uses the residuals of the current regression. In your example you are making two regression equations and using residuals from one into the other. This is not what an MA process is. It cannot be estimated with OLS.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.