Bir zaman serisinin durağan ya da durağan olmadığını nasıl bilebilirim?


30

Ben R kullanıyorum, ben Google'da arama öğrendik kpss.test(), PP.test()ve adf.test()zaman serilerinin durağanlık hakkında bilmek için kullanılır.

Ama sonuçlarını yorumlayabilen bir istatistikçi değilim.

> PP.test(x)

     Phillips-Perron Unit Root Test
data:  x 
Dickey-Fuller = -30.649, Truncation lag parameter = 7, p-value = 0.01

> kpss.test(b$V1)

  KPSS Test for Level Stationarity
  data:  b$V1 
  KPSS Level = 0.0333, Truncation lag parameter = 3, p-value = 0.1

Warning message:
In kpss.test(b$V1) : p-value greater than printed p-value
> adf.test(x)

    Augmented Dickey-Fuller Test

data:  x 
Dickey-Fuller = -9.6825, Lag order = 9, p-value = 0.01
alternative hypothesis: stationary

Warning message:
In adf.test(x) : p-value smaller than printed p-value

Binlerce zaman serisiyle uğraşıyorum, lütfen zaman serisinin durağanlığını nasıl nicel olarak kontrol edeceğimi söyleyeyim.

Yanıtlar:


22

Bir serinin durağan olmayanlara karşı durağan olup olmadığının test edilmesi, bir dizi alternatif hipotez düşünmenizi gerektirir. Her kiralanabilir Gauss varsayımı için bir tane. Gaussian Varsayımlarının tamamen hata süreci ile ilgili olduğunu ve değerlendirilmekte olan gözlemlenen seriyle ilgisi olmadığını anlamak gerekir. StasK tarafından doğru bir şekilde özetlendiği gibi, bu, durağanlık ihlallerini, ortalama değişim, varyans değişikliği gibi, zaman içinde modelin parametrelerindeki değişiklikleri içerebilir. Örneğin, yükselen bir trendler kümesi, Y'de sabit olmayan bir dizinin prima facie örneği olurken, uygun bir modelden kalanlar sabit bir ortalamaya sahip olarak tanımlanabilir. Dolayısıyla, orijinal seri ortalamada durağan değildir, ancak artık seri ortalama olarak durağandır. Atımlar, Seviye Kaymaları, Mevsimsel Atımlar ve / veya Yerel Zaman Eğilimleri gibi artık serilerde onaylanmamış ortalama ihlaller varsa, artık seriler (işlenmemiş) bir dizi gösterge değişkeni olabilirken ortalamada durağan olmama özelliği gösterilebilir. Model artıklarını ortalamada durağan kılmak için kolayca algılanabilir ve modele dahil edilebilir. Şimdi eğer orijinal serinin varyansı durağan olmayan bir varyans sergiliyorsa, sabit bir varyansa sahip bir hata işlemi yapmak için bir filtre / model sıkılaştırmak oldukça mantıklıdır. Benzer şekilde, bir modelden gelen artıklar, üç olası çözüm yolundan birini gerektiren sabit olmayan bir varyansa sahip olabilir - Mevsimsel Darbeler ve / veya Yerel Zaman Eğilimleri ardından artık seriler (işlenmemiş) ortalamada durağan olmamakla karakterize edilirken, bir dizi gösterge değişkeni modelde ortalamaları sabit hale getirmek için modele kolayca tespit edilebilir ve dahil edilebilir . Şimdi eğer orijinal serinin varyansı durağan olmayan bir varyans sergiliyorsa, sabit bir varyansa sahip bir hata işlemi yapmak için bir filtre / model sıkılaştırmak oldukça mantıklıdır. Benzer şekilde, bir modelden gelen artıklar, üç olası çözüm yolundan birini gerektiren sabit olmayan bir varyansa sahip olabilir - Mevsimsel Darbeler ve / veya Yerel Zaman Eğilimleri ardından artık seriler (işlenmemiş) ortalamada durağan olmamakla karakterize edilirken, bir dizi gösterge değişkeni modelde ortalamaları sabit hale getirmek için modele kolayca tespit edilebilir ve dahil edilebilir . Şimdi eğer orijinal serinin varyansı durağan olmayan bir varyans sergiliyorsa, sabit bir varyansa sahip bir hata işlemi yapmak için bir filtre / model sıkılaştırmak oldukça mantıklıdır. Benzer şekilde, bir modelden gelen artıklar, üç olası çözüm yolundan birini gerektiren sabit olmayan bir varyansa sahip olabilir - Şimdi eğer orijinal serinin varyansı durağan olmayan bir varyans sergiliyorsa, sabit bir varyansa sahip bir hata işlemi yapmak için bir filtre / model sıkılaştırmak oldukça mantıklıdır. Benzer şekilde, bir modelden gelen artıklar, üç olası çözüm yolundan birini gerektiren sabit olmayan bir varyansa sahip olabilir - Şimdi eğer orijinal serinin varyansı durağan olmayan bir varyans sergiliyorsa, sabit bir varyansa sahip bir hata işlemi yapmak için bir filtre / model sıkılaştırmak oldukça mantıklıdır. Benzer şekilde, bir modelden gelen artıklar, üç olası çözüm yolundan birini gerektiren sabit olmayan bir varyansa sahip olabilir -

  1. Ağırlıklı En Küçük Kareler (bazı analistler tarafından genel olarak göz ardı edilir)
  2. Beklenen değeri Box-Cox testi ve / veya
  3. Kare artıklarda belirgin olan bir ARIMA yapısını hesaba katan bir GARCH modeline olan ihtiyaç. Parametrelerin zaman içinde değişmesi durumunda VEYA modelin şekli zaman içinde değişiyorsa, devam etmekte olan kişi bu özelliği tespit etme ve onu veri bölümleme ya da bir TAR yaklaşımının la Tong kullanmasıyla çözme ihtiyacı ile karşı karşıya kalır.

34

Durağanlık, sürecin marjinal dağılımının zamanla değişmediği anlamına gelir. Zayıf bir form, ortalamanın ve varyansın zaman içinde aynı kaldığını belirtir. Bu yüzden, onu ihlal eden herhangi bir şey, aptalca nedenlerden dolayı, sabit sayılmaz. Örneğin, deterministikyt=günaht sabit değil, anlamı değişmeye devam ediyor, çünkü bunun karşısında, bu oldukça basit ve öngörülebilir bir süreç.

Düşündüğünüz tüm testlerin aklında belirli bir alternatif var: rastgele bir yürüyüş süreci

yt=yt-1+εt
veya bazı kolay modifikasyonlar (örneğin ilave gecikmeler dahil) yt-2, yt-3küçük katsayılar ile). Bu, fiyatlarda gelecekteki değişiklikleri tahmin etmek için hiçbir bilginin kullanılamayacağı, etkin bir finansal piyasa olan basit bir modeldir. Ekonomistlerin çoğu zaman serilerini ARIMA modellerinden geldiğini düşünüyor; Bu zaman serileri, olayların gerçekleştiği (ay, çeyrek veya yıl) zamanlarında iyi tanımlanmış dönemlere sahiptir, dolayısıyla nadiren onlar için entegre bir zaman serisinden daha kötü hale gelir. Dolayısıyla bu testler, ortalama etki, varyans değişikliği, otoregresif katsayılarda değişiklik, vb. Gibi daha karmaşık durağanlık ihlalleri için tasarlanmamıştır, ancak bu etkiler için testler açıkça geliştirilmiştir.

Mühendislik veya doğa bilimlerinde, uzun zaman aralığına bağımlılık, kesirli entegrasyon, pembe gürültü vb. Gibi daha karmaşık konularla zaman serileri ile karşılaşmanız daha olasıdır. iklim ne sıklıkta değişiyor?), genellikle frekans alanındaki verileri analiz etmek daha mantıklıdır (ekonomistler için, frekans alanı oldukça açıktır: yıllık mevsimsel döngüleri, ayrıca daha uzun 3-4-5 yıllık iş döngüleri vardır) (aksi takdirde birkaç sürpriz olabilir).

Yani temelde size neden yaptığınızı yapmak istemediğinizi söyledim. Zaman serisini anlamadıysanız, aptalca bir şey yaptığınız için projenizi mahvetmek yerine, bunu yapan ve danışmanlık ücreti ödeyen birini bulmaktan daha iyi olursunuz. Diyelim ki, probleminize biçimsel çözüm, verilen bir seri için en az bir testin geçerli olduğu bir durağan serinin boş hipotezini reddetmek olacaktır.p-Aşağıdaki değer 0.05/(3M) nerede M toplam seri sayısı, 3 üzerinde yaptığınız testlerin sayısı, 0.05% 5 anlamlılık seviyesidir ve tüm ifade çoklu testler için Bonferroni düzeltmesi olarak bilinir. Çıktı gösterilmiyorp-yüksek doğruluktaki değerler, bu nedenle bunları geri dönen sınıf üyeleri gibi çekmeniz gerekir pp.test(x)$p.value. Her halükarda bunu döngüde yapacaksınız, bu yüzden muhtemelen tüm çıktıyı bastırırsanız ve durağanlıktan başarısız olan değişken (ler) in isimlerini üretmeniz yeterli olacaktır.


4

Time series is stationary if its mean level and variance stay steady over time. You can read more on this topic (with specification of relevant tests in R), in our post.. http://www.statosphere.com.au/check-time-series-stationary-r/


1
Late comment, but what do you mean that mean and variance stay steady over time? For a given set of data the mean and variance are what they are, right? Or do you mean that the mean/var of all subsets of the data must be equal?
Erik Vesterlund

2
I took a look on the linked page. It is stated that "The Ljung-Box test examines whether there is significant evidence for non-zero correlations at lags 1-20. Small p-values (i.e., less than 0.05) suggest that the series is stationary." The conclusion is plain wrong. The null is that the observations are iid. Rejecting the null based on a small p-value indicates only that there is at least one significant lag. The conclusion on the website would mean, that stationarity requires significant autocorrelation for at least one lag. And that is not true.
random_guy
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.