R'deki ARIMA kalıntıları için Ljung-Box İstatistikleri: kafa karıştırıcı test sonuçları


15

Tahmin etmeye çalıştığım, mevsimsel ARIMA (0,0,0) (0,1,0) [12] modelini (= fit2) kullandığım bir zaman serim var. Auto.arima ile önerilen R'den farklıdır (R hesaplanan ARIMA (0,1,1) (0,1,0) [12] daha iyi bir uyum olurdu, buna fit1 adını verdim). Bununla birlikte, zaman serimin son 12 ayında modelim (fit2) ayarlandığında daha iyi bir uyum gibi görünüyor (kronik olarak önyargılıydı, kalan ortalamayı ekledim ve yeni uyum orijinal zaman serisinin etrafında daha rahat oturuyor gibi görünüyor Son 12 ayın örneği ve her iki uyum için de son 12 ay için MAPE:

fit1, fit2 ve orijinal veriler

Zaman serileri şöyle görünür:

orijinal zaman serisi

Çok uzak çok iyi. Her iki model için artık analiz yaptım ve işte karışıklık.

Acf (kalıntı (fit1)) harika görünüyor, çok beyaz-noisey:

uyum AC1

Bununla birlikte, Ljung-Box testi, örneğin 20 gecikme için iyi görünmüyor:

    Box.test(resid(fit1),type="Ljung",lag=20,fitdf=1)

Aşağıdaki sonuçları alıyorum:

    X-squared = 26.8511, df = 19, p-value = 0.1082

Anladığım kadarıyla, artıkların bağımsız olmadığının teyidi budur (p-değeri Bağımsızlık Hipotezi'nde kalmak için çok büyüktür).

Ancak, gecikme 1 için her şey harika:

    Box.test(resid(fit1),type="Ljung",lag=1,fitdf=1)

sonucu verir:

    X-squared = 0.3512, df = 0, p-value < 2.2e-16

Ya testi anlamıyorum ya da acf grafiğinde gördüğümle biraz çelişiyor. Otokorelasyon gülünç derecede düşüktür.

Sonra uygunluğu kontrol ettim2. Otokorelasyon fonksiyonu şuna benzer:

acf fit2

Birkaç ilk gecikmedeki bariz otokorelasyona rağmen, Ljung-Box testi bana 20 gecikmede uyumdan çok daha iyi sonuçlar verdi1:

    Box.test(resid(fit2),type="Ljung",lag=20,fitdf=0)

sonuç:

    X-squared = 147.4062, df = 20, p-value < 2.2e-16

oysa lag1'deki otokorelasyonu kontrol etmem de bana sıfır hipotezinin onayını verir!

    Box.test(resid(arima2.fit),type="Ljung",lag=1,fitdf=0)
    X-squared = 30.8958, df = 1, p-value = 2.723e-08 

Testi doğru anlıyor muyum? Kalıntı bağımsızlığının sıfır hipotezini doğrulamak için p değeri tercihen 0.05'ten küçük olmalıdır. Tahmin, fit1 veya fit2 için hangi uyum daha iyidir?

Ek bilgi: fit1 kalıntıları normal dağılım gösterir, fit2 kalıntıları göstermez.


2
P-değerlerini anlamıyorsunuz ve bunları yanlış şekilde yorumluyorsunuz.
Scortchi - Eski durumuna getir Monica

Evet, bu anlama meselesi olabilir. Lütfen genişletebilir misiniz? Örneğin, p değeri 0,5'ten büyükse tam olarak ne anlama gelir? P-değeri tanımını okudum (boş hipotezlerin sahip olduğu göz önüne alındığında en az test istatistiği kadar istatistik elde etme olasılığı). Ljung-Box testi için nasıl uygulanır? "En azından aşırı", "X kareden daha büyük" anlamına mı geliyor? Anlamlılık testi anlamam zor olduğu için verilerimle örnek için minnettar olurum.
zima

6
Ljung-Box test istatistiği ( X-squared), artıkların örnek oto-korelasyonları büyüdükçe (tanımına bakın) büyür ve p-değeri null altında gözlemlenenden daha büyük veya daha büyük bir değer elde etme olasılığıdır gerçek inovasyonların bağımsız olduğu hipotezi. Dolayısıyla küçük bir p değeri bağımsızlığa karşı bir delildir .
Scortchi - Eski durumuna getir Monica

@Scortchi, sanırım anladım. Ama bu da fit1 için lag = 1 testimi başarısız yapar. Bu nasıl açıklanabilir? Gecikme = 1'de otokorelasyon görmüyorum. Bu testin az sayıda gecikmeli (çok küçük örneklem) bir çeşit ekstremitesi var mı?
zima

3
Box-Ljung, belirttiğinize kadar tüm gecikmelerde omnibus bağımsızlık testidir. Kullanılan serbestlik derecesi hayır. gecikmeler eksi hayır. AR & MA parametreleri ( fitdf) böylece sıfır serbestlik derecesine sahip ki kare dağılımına karşı test ediyordunuz.
Scortchi - Eski durumuna getir Monica

Yanıtlar:


35

Testi yanlış yorumladınız. P değeri 0.05'ten büyükse, modelin doğru olmasını istediğimiz artıklar bağımsızdır. Aşağıdaki kodu kullanarak bir beyaz gürültü zaman serisini taklit ederseniz ve bunun için aynı testi kullanırsanız, p değeri 0.05'ten büyük olacaktır.

m = c(ar, ma)
w = arima.sim(m, 120)
w = ts(w)
plot(w)
Box.test(w, type="Ljung-Box")

3
Kısa ve temiz bir açıklama. Kod örneği için +1.
Dawny33

1
Yorumunuz da doğru değil. 0,05'lik bir p değeri, davanızdaki 1. sıraya kadar otomatik korelasyon olmayan sıfır hipotezini reddederseniz% 5 hata yapma şansınız olduğu anlamına gelir.
DJJ

8

Bazı sıfır hipotezi reddetmek için birçok istatistiksel test kullanılır. Bu özel durumda Ljung-Box testi bazı değerlerin bağımsızlığını reddetmeye çalışır. Bu ne demek?

  • Eğer p değeri <0.05 1 : Bir hata yapma% 5 şans varsayarak Sıfır hipotezini reddeder. Böylece değerlerinizin birbirine bağımlı olduğunu varsayabilirsiniz.

  • Eğer p değeri> 0,05 1 ise : Sıfır hipotezini reddetmek için yeterli istatistiksel kanıtınız yoktur. Böylece değerlerinizin bağımlı olduğunu varsayamazsınız. Bu, değerlerinizin zaten bağımlı olduğu veya değerlerinizin bağımsız olduğu anlamına gelebilir. Ancak, belirli bir olasılığı kanıtlamıyorsunuz, testinizin gerçekte söylediği şey, değerlerin bağımlılığını iddia edemeyeceğinizdir, değerlerin bağımsızlığını da iddia edemezsiniz.

Genel olarak, burada önemli olan p-değeri <0.05 null-hipotez reddetmek sağlar, ancak bir p-değeri> 0.05 olmadığını akılda tutmak olduğunu değil null-hipotezini teyit edelim.

Özellikle, Ljung-Box testini kullanarak Zaman Serilerinin değerlerinin bağımsızlığını kanıtlayamazsınız. Sadece bağımlılığı kanıtlayabilirsiniz.


α=0.05


α=0.05

0

ACF grafiklerine göre, açıklık 1'in daha iyi olduğu açıktır çünkü gecikme k (k> 1) 'deki korelasyon katsayısı keskin bir şekilde düşer ve 0'a yakındır.


0

ACF ile karar verirseniz, uyum 1 daha uygundur. Ljung testinde karıştırılmak yerine, fit1 ve fit2 arasındaki en iyi uyumu belirlemek için artıkların korelogramını kullanabilirsiniz.


1
Bu cevabı anlamıyorum.
Michael R.Chernick

Ljung kutusu istatistiklerini ziyaret ettiğimizde, model teşhis kontrolü Ie, model yeterliliği ile ilgilenebiliriz ... Bunu kullanmak kafa karıştırıcıysa, yukarıda belirttiğim model yeterliliğini kontrol etmenin başka yolları vardır. Sen O değil ...... o beyaz gürültü ise serinin sınırlarını kontrol daha sonra veri kalıntı ait korelogram Yani, ACF ve PACF çizmek ve olabilir Ljung kutu testi kullanmak gerekir
Vincent
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.