ARIMA modelimdeki gözlem 48'e yenilikçi bir aykırı değeri nasıl dahil edebilirim?


10

Bir veri kümesi üzerinde çalışıyorum. Bazı model tanımlama tekniklerini kullandıktan sonra bir ARIMA (0,2,1) modeliyle çıktım.

Orijinal veri setimin 48. gözleminde yenilikçi bir aykırı değer (IO) tespit etmek için R'deki detectIOpaketteki işlevi kullandım .TSA

Öngörme amacıyla kullanabilmem için bu aykırı değeri modelime nasıl dahil edebilirim? ARIMAX modelini kullanmak istemiyorum çünkü R'de bundan herhangi bir tahmin yapamayabilirim. Bunu yapmamın başka yolları var mı?

İşte değerleri sırayla:

VALUE <- scan()
  4.6  4.5  4.4  4.5  4.4  4.6  4.7  4.6  4.7  4.7  4.7  5.0  5.0  4.9  5.1  5.0  5.4
  5.6  5.8  6.1  6.1  6.5  6.8  7.3  7.8  8.3  8.7  9.0  9.4  9.5  9.5  9.6  9.8 10.0
  9.9  9.9  9.8  9.8  9.9  9.9  9.6  9.4  9.5  9.5  9.5  9.5  9.8  9.3  9.1  9.0  8.9
  9.0  9.0  9.1  9.0  9.0  9.0  8.9  8.6  8.5  8.3  8.3  8.2  8.1  8.2  8.2  8.2  8.1
  7.8  7.9  7.8  7.8

Aslında bu benim verilerim. 6 yıllık bir süre içinde işsizlik oranlarıdır. O zaman 72 gözlem var. Her değer en fazla bir ondalık basamaktır


6
Diğer tüm dönemlerde ve 0 için 1 olan bir kukla oluşturabilirsiniz . Ardından modeli yeniden tahmin edin. Bu, bu aykırı değerlerin tahmin edilmesini engelleyecektir. Aklınızdakiler bu değilse, ikinci paragrafta ayrıntılı olarak durmalısınız. t=48
Dimitriy V. Masterov

2
@Gen_b Haklısınız, bu muhtemelen çok farklı olduğu için sizi rahatsız etmeli, iptal eden bir MA (1) verir. Yanlış tanımlama, uygunsuz araçların kullanılmasından kaynaklanır.
IrishStat

2
İkinci farklarda, bir aykırı değer gibi görünen bir şey var, ancak görünüşe göre orijinal serideki 47 gözlemine küçük bir katkı atlaması neden oldu; Gözlem 47'deki (neredeyse mantıklı olan her şey) bu küçük efekti kaldırmak için basit bir şey yaparsanız, ikinci farkta hiçbir aykırı değer görünmez. Belki de orijinal ölçekte bir AO olarak bakıldığında daha iyi olduğunu söyleyebilirim.
Glen_b -Manica Monica

2
Bu veri kümesinde çok şey oluyor, ancak yerel geçici davranış (korelasyon, mevsimsellik, vb.) Bunun gibi verileri körü körüne bir sayı dizisi olarak analiz ettiğinizde, gülünç sonuçlar (veya daha kötüsü) üretme riskiyle karşı karşıya kalırsınız. Bu verilerin ne anlama geldiği hakkında bize ne söyleyebilirsiniz ? Belki bir izleme istasyonundaki bir şeyin ölçümleri midir? Ekonomik zaman serileri? Biyolojik büyüme grafiği? Temeldeki fenomenle ilgili bir şeyleri anlamak genellikle bir modeli tanımlamaya yardımcı olmak için istatistiksel yazılımlarla uğraşmaktan çok daha fazlasını yapar.
whuber

2
@whuber: 6 yıllık bir süre boyunca işsizlik oranları!
b2amen

Yanıtlar:


3

Eğer daha sonra .Y(t)=[θ/ϕ][A(t)+IO(t)]Y*(t)=[θ/ϕ][A(t)]+[θ/ϕ][IO(t)]

Eğer ve , örneğin ... oθ=1ϕ=[1.5B]
Y*(t)=[1/(1.5B)][A(t)]
+IO(t).5IO(t1)+.25IO(t2).125IO(t3).

Örneğin IO efektinin tahmini 10.0 ise burada için gösterge değişkeni 0 veya 1'dir.
Y(t)=[1/(1.5B)][A(t)] IO+10IO(t)5IO(t1)+2.5IO(t2)1.25IO(t3).
IO

Bu şekilde, anormalliğin etkisinin sadece anlık değil, aynı zamanda hafızası olduğunu da görebilirsiniz.

AUTOBOX (aşina olduğum) gibi yazılımlar IO etkilerini tanımlamaz (daha ziyade AO efektleri), periyodundan başlayarak 10, -5, 2.5, -1.25, ... değerlerine sahip bir dizi anormallik tanımlar .t

Kullanıcı bu nadir olayı gördükten sonra , bir IO ile aynı sonucu veren saf bir pay yapısından ziyade dinamik bir yapı ile AO müdahalesi arasındaki aktarımı yeniden başlatabilir. etkisi dahil edildi. [ w ( b ) ][w(b)/d(b)][w(b)]

Belleği her kullandığınızda, fark yaratan bir operatör veya ARMA yapısının bir sonucu olsun, atlanan nedensel seriler nedeniyle cahillik örtülü bir şekilde kabul edilir. Bu aynı zamanda Bakliyat / Seviye Kaymaları, Mevsimsel Bakliyat veya Yerel Zaman Eğilimleri gibi Müdahale deterministik serilerini dahil etme ihtiyacı için de geçerlidir. Bu kukla değişkenler, kullanıcı tarafından belirlenen belirlenmeyen nedensel değişkenler için neede bir proxy'dir. Çoğunlukla sahip olduğunuz tek şey bir dizi ilgi alanıdır ve hecelediğim niteleyiciler göz önüne alındığında, geleceği tam olarak analiz edilen verinin doğası hakkında bilgisiz olarak tahmin edebilirsiniz. Tek sorun, ilerideki yolu tahmin etmek için arka camı kullanmanızdır ... gerçekten tehlikeli bir şey.

veriler gönderildikten sonra ...

Makul bir model (1,1,0) 'dır resim açıklamasını buraya girinve AO anomalileri 39,41,47,21 ve 69 periyotlarında (periyot 48 değil) tanımlanmıştır. Bu modelin kalıntıları belirgin bir yapıdan yoksun gibi görünmektedir. resim açıklamasını buraya girinVE resim açıklamasını buraya girinAO faresi, zaman serisinin tarihinde olmayan aktivitenin yansıdığı aktivitenin optimal bir temsiline değer verir. OP'nin aşırı farklılık gösteren modelinin ACF'sinin model yetersizliğini yansıtacağını düşünürdüm. İşte model. resim açıklamasını buraya girin Yine sorun veya fırsat model tanımlama / revizyon / doğrulama alanında olduğu için teslim edilen R kodu yoktur. Son olarak, gerçek / gömülü ve öngörülen serilerin bir grafiği.


1
cevabın için teşekkürler; ama aslında benim model yerine bir R-Kodu istedim.
b2amen

1
@ b2amen Evet anladım ama Glen_b bazı şeyler istedim ve ona cevap vereceğimi düşündüm.
IrishStat

Düzenleme için teşekkürler. Sen ve ben iyi partnerleriz!
IrishStat

@ IrishStat: verilerim orijinal soruya dahil edildi. Umarım bana yardımcı olabilir.
Neyse

@IrishStat: Çıktınızı seviyorum. Bana çok düzgün gözüküyor. Hangi yazılımı kullandınız? Ancak bir AR'yi (2,1,0) nasıl tanımladığınızı açıklayabilir misiniz? Teşekkürler
b2amen
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.