ARIMA (5,1,2) modelini auto.arima()
R işlevini kullanarak taktım ve siparişe bakarak bunun tahmin edilmesi için en iyi model olmadığını söyleyebiliriz. Veri serilerinde aykırı değerler varsa, bu tür verilere bir model sığdırmanın yöntemi nedir?
ARIMA (5,1,2) modelini auto.arima()
R işlevini kullanarak taktım ve siparişe bakarak bunun tahmin edilmesi için en iyi model olmadığını söyleyebiliriz. Veri serilerinde aykırı değerler varsa, bu tür verilere bir model sığdırmanın yöntemi nedir?
Yanıtlar:
Michael Chernick sizi doğru yönde gösteriyor. Ruey Tsay'ın çalışmalarına bu bilgi kütlesine eklenen gibi de bakardım. Daha fazlasını burada görün .
Bugünün otomatik bilgisayar algoritmalarına karşı rekabet edemezsiniz. Düşünmediğiniz ve genellikle herhangi bir kağıtta veya kitapta belgelenmemiş zaman serilerine yaklaşmanın birçok yoluna bakarlar. Bir ANOVA'nın nasıl yapılacağı sorulduğunda, farklı algoritmalarla karşılaştırılırken kesin bir cevap beklenebilir. Örüntü tanımayı nasıl yapacağım sorusunu sorduğunda, sezgisel yöntemler söz konusu olduğundan birçok yanıt mümkündür. Sorunuz buluşsal yöntemlerin kullanımını içerir.
Verilerde aykırı değerler varsa bir ARIMA modeline uymanın en iyi yolu, olası doğa durumlarını değerlendirmek ve belirli bir veri kümesi için en uygun görülen yaklaşımı seçmektir. Olası bir doğa durumu, ARIMA sürecinin açıklanmış varyasyonun birincil kaynağı olmasıdır. Bu durumda, ARIMA sürecini acf / pacf fonksiyonu aracılığıyla "geçici olarak" tanımlayacak ve daha sonra kalıntıları olası aykırı değerler açısından inceleyecektir. Aykırı değerler Darbeler, yani bir kerelik olaylar VEYA belirli sıklıkta sistematik aykırılıklar tarafından kanıtlanan mevsimsel darbeler olabilir (örneğin aylık veriler için 12). Üçüncü tip bir aykırı değer, birinin her biri aynı işarete ve büyüklüğe sahip bitişik darbeler kümesine sahip olduğu, buna adım veya seviye kaydırma denir. Geçici ARIMA işleminden kalıntılar incelendikten sonra, geçici bir birleşik model oluşturmak için deneysel olarak belirlenen deterministik yapı geçici olarak eklenebilir. Ne de birincil varyasyon kaynağı 4 türden veya "aykırı değerlerden" biri ise, bunlara ab initio (ilk olarak) tanımlanarak ve daha sonra stokastik (ARIMA) yapıyı tanımlamak için bu "regresyon modelindeki" kalıntılar kullanılarak daha iyi hizmet edilir. . Şimdi bu iki alternatif strateji, ARIMA parametrelerinin zamanla değiştiği veya hata varyansının bir dizi olası nedenden dolayı, muhtemelen ağırlıklı en küçük karelere veya bir güç dönüşümü ihtiyacına bağlı olarak zaman içinde değiştiği bir "sorun" olduğunda biraz daha karmaşık hale gelir. günlükler / karşılıklılar vb. Başka bir komplikasyon / fırsat, bellek, nedensel ve ampirik olarak tanımlanmış kukla serileri içeren sorunsuz bir şekilde entegre edilmiş bir model oluşturmak için kullanıcı tarafından önerilen öngörücü serisinin katkısının nasıl ve ne zaman oluşturulacağıdır. Bu sorun, formun gösterge serileri ile en iyi modellenen trend serileri olduğunda daha da artar. veya ve gibi seviye kaydırma dizilerinin kombinasyonları . Bu tür prosedürleri R'de yazmak ve yazmak isteyebilirsiniz, ancak hayat kısa. Sorununuzu gerçekten çözmek ve bu durumda prosedürün nasıl çalıştığını göstermek için memnuniyet duyarım, lütfen verileri gönderin veya sales@autobox.com adresine gönderin
Döviz kuru için verileri / günlük verileri aldıktan / analiz ettikten sonra ek yorum / 1/1/2007 tarihinden itibaren 18 = 765 değer
Verilerin bir acf vardı:
formunun bir arma modelini ve bir dizi aykırı değeri belirledikten sonra, artıkların , acf değerleri çok küçük olduğu için rasgeleliği gösterir. AUTOBOX bir dizi aykırı değer tespit etti:
Son model:
kalıntılarda varyans değişikliklerinin tanımlandığı ve dahil edildiği bir TSAY la varyans stabilizasyonu arttırılması ihtiyacını içermiştir. Otomatik çalışmanızda yaşadığınız sorun, bir muhasebeci gibi kullandığınız prosedürün, Müdahale Tespiti (yani, Outlier Detection) ile verilere meydan okumak yerine verilere inanmasıydı. Burada tam bir analiz yayınladım .
R'de arima fonksiyonunu kullanmak için sağlam bir muadili yoktur (henüz) ; biri görünürse, burada listelenecektir . Belki bir alternatif, basit bir tek değişkenli aykırı algılama kuralı ile ilgili olan gözlemleri azaltmaktır, ancak ağırlıklı ARMA regresyonunu çalıştırmak için paketleri kullanmaya hazır görmüyorum. Olası başka bir alternatif de, dış noktaları Winsorize etmek olacaktır:
#parameters
para <- list(ar=c(0.6,-0.48), ma=c(-0.22,0.24))
#original series
y1 <- y0 <- arima.sim(n=100, para, sd=sqrt(0.1796))
#outliers
out <- sample(1:100, 20)
#contaminated series
y1[out] <- rnorm(20, 10, 1)
plot( y1, type="l")
lines(y0, col="red")
#winsorized series
y2 <- rep(NA, length(y1))
a1 <- (y1-median(y1)) / mad(y1)
a2 <- which(abs(a1)>3)
y2[-a2] <- y1[-a2]
for(i in 2:length(y2)){
if(is.na(y2[i])){ y2[i] <- y2[i-1] }
}
Sağlam zaman serisi modellerinde oldukça büyük bir literatür vardır. Martin ve Yohai en çok katkıda bulunanlar arasında. Çalışmaları 1980'lere dayanıyor. Kendimi zaman serilerinde aykırı değerleri tespit etmek için biraz çalıştım, ama Martin gerçekten zaman aykırı değerlerin veya aykırı değerlerin varlığında aykırı değerlerin ve parametre tahminlerinin belirlenmesine katkıda bulunan birçok kişiden biriydi.
modelinizin amacı tarihi tahmin etmek veya analiz etmek mi? bu tahmin için değilse ve bunların aykırı değerler olduğunu biliyorsanız , o tarihlerde 1 ve diğer tarihlerde 0 olan kukla değişkeni eklemeniz yeterlidir. bu şekilde kukla katsayılar aykırı değerlerle ilgilenecek ve modeldeki diğer katsayıları yorumlayabileceksiniz.
bu tahmin içinse, kendinize iki soru sormanız gerekir: bu aykırı değerler tekrar olacak mı? eğer yaparlarsa, onları hesaba katmak zorunda mıyım?
Diyelim ki Lehman kardeşler yere düştüğünde veri dizilerinizde aykırı değerler var. Açıkçası, tahmin etmenin hiçbir yolu olmayan bir olaydır, ancak bunu görmezden gelemezsiniz çünkü böyle bir şey gelecekte gerçekleşmek zorundadır. aykırı değerler için kukla atarsanız, bu olayın belirsizliğini hata varyansından etkili bir şekilde kaldırırsınız. tahmininiz kuyruk riskini hafife alacaktır - belki de risk yönetimi için iyi bir şey değil. Ancak, satışların temel tahminini üretecekseniz, kukla işe yarayacaktır, çünkü kuyrukla ilgilenmiyorsanız, büyük olasılıkla senaryolarla ilgileniyorsunuz - bu nedenle için öngörülemeyen olayı hesaba katmanıza gerek yok Bu amaç.
Bu nedenle, modelinizin amacı aykırı değerlerle başa çıkma şeklinizi etkiler.