Bir zaman serisi neden durağan olmak zorunda?


92

Durağan bir zaman serisinin, ortalamaları ve değişkenlikleri zaman içinde sabit olan bir seri olduğunu biliyorum. Birisi lütfen üzerinde farklı ARIMA veya ARM modelleri çalıştırmadan önce, veri setimizin sabit olduğundan emin olmak zorunda olduğumuzu açıklayabilir mi? Bu aynı zamanda otokorelasyon ve / veya zamanın bir faktör olmadığı normal regresyon modelleri için de geçerli midir?


2
ARM modelleri nelerdir? ARMA mı demek istediniz?
mpiktas

9
Durağanlık sabit ortalama ve varyanstan daha fazlasını gerektirir. Zayıf durağanlık, kovaryans fonksiyonu cov'nin (X_t, X_ {t + h}) t'yecov(Xt,Xt+h) bağlı olmamasını gerektirir . t
mpiktas,

11
AR MA modelini çalıştırmak için durağanlık gerekmez , çünkü sırası , açıkça durağandır. Ancak durağanlık, ARMA'nın bir varsayımıdır. ben ( ) > 0II()>0
Glen_b

1
Eğer kesinlikle bu sadece olsa sipariş yorum için 1, 'ın emri olduğu . Keyfi emirler için ARFIMA var{ 0 , 1 , 2 , . . . }I{0,1,2,...}
conjugateprior

@Glen_b ARIMA modelleri sabit olmayan herhangi bir seriye uygulanabilir mi? Ya da ARIMA cana'nın uygulandığı belirli bazı özel olmayan davalar var mı?
Nizar

Yanıtlar:


75

Durağanlık, bir tür bağımlılık yapısıdır.

verilerimiz olduğunu varsayalım . En temel varsayım, bağımsız olduğu, yani bir örneğimiz olduğu. Bağımsızlık güzel bir özelliktir, çünkü onu kullanırken çok yararlı sonuçlar elde edebiliriz. Sorun, bu özelliğin bazen (veya görünüme bağlı olarak sık sık) sahip olmamasıdır.X iX1,...,XnXi

Şimdi bağımsızlık benzersiz bir özelliktir, iki rastgele değişken yalnızca bir şekilde bağımsız olabilir, ancak çeşitli şekillerde bağımlı olabilirler. Yani durağanlık bağımlılık yapısını modellemenin bir yoludur. Bağımsız rastgele değişkenler (büyük sayılar yasası, merkezi limit teoremini isimlendirmek) için geçerli olan çok sayıda güzel sonucun durağan rastgele değişkenler için (kesinlikle diziler söylemeliyiz) ortaya çıktı. Ve elbette, birçok verinin durağan olduğu düşünülebilir, bu nedenle durağanlık kavramı bağımsız olmayan verilerin modellenmesinde çok önemlidir.

Durağanlığımız olduğunu belirlediğimizde, doğal olarak onu modellemek istiyoruz. İşte ARMA modelleri burada devreye giriyor . Wold ayrıştırma teoremi sayesinde, herhangi bir sabit verinin durağan ARMA modeline yaklaştırılabileceği ortaya çıkıyor . Bu yüzden ARMA modelleri çok popüler ve bu yüzden bu modelleri kullanmak için serinin durağan olduğundan emin olmamız gerekiyor.

Şimdi yine aynı hikaye bağımsızlık ve bağımlılık gibi. Durağanlık benzersiz olarak tanımlanır, yani veriler durağandır ya da durmaz, bu nedenle verilerin durağan olmasının tek yolu vardır, ancak durağan olmamanın birçok yolu vardır. Yine, belirli bir dönüşümden sonra birçok verinin sabit kaldığı ortaya çıkıyor. ARIMA modeli durağan olmama için bir modeldir. Verilerin farklılıktan sonra sabit kaldığı varsayılmaktadır.

Regresyon bağlamında durağanlık önemlidir, çünkü bağımsız veriler için geçerli olan aynı sonuçlar, eğer veriler sabitse de geçerlidir.


4
Cevabınızın bu kısmını koymanızı öneririm ("Bu, ARMA modellerinin geldiği yer. Wold ayrıştırma teoremi sayesinde herhangi bir sabit verinin, durağan ARMA modeline yaklaştırılabileceği ortaya çıkıyor. Bu yüzden, ARMA modelleri çok popüler ve bu yüzden bu modelleri kullanmak için serinin durağan olduğundan emin olmamız gerekiyor. ”
Poete Maudit

34

Bir zaman serisi üzerinde istatistiksel analiz yaptığımız zaman, genellikle hangi miktarlarla ilgileniyoruz? Bilmek istiyoruz

  • Beklenen değeri
  • Varyansı ve
  • Değerlerin korelasyonu ayrı bir set için süreler değerleri.ss

Bu şeyleri nasıl hesaplıyoruz? Birçok zaman dilimi boyunca ortalama kullanmak.

Birçok zaman dilimindeki ortalama, ancak beklenen değer bu zaman dilimlerinde aynı olduğunda yalnızca bilgi vericidir. Bu popülasyon parametreleri değişebilirse, zaman içinde ortalama alarak gerçekten ne tahmin ediyoruz?

(Zayıf) durağanlık, bu popülasyon miktarlarının zaman içinde aynı olmasını gerektirir, bu da örnek ortalamasını tahmin etmenin makul bir yoludur.

Buna ek olarak, durağan süreçler sahte gerileme sorununu da önler .


12

İstatistiksel öğrenmedeki temel fikir, bir deneyi tekrarlayarak öğrenebilmenizdir. Örneğin, bir raptiyenin başına gelme olasılığını öğrenmek için raptiyeyi çevirmeye devam edebiliriz.

Zaman serileri bağlamında, stokastik işlemin tekrarlanan çalışmalarından ziyade stokastik bir işlemin tek bir çalışmasını gözlemliyoruz. Birden fazla bağımsız deney yerine 1 uzun deney gözlemledik.

Durağanlık ve ergodikliğe ihtiyacımız var, bu yüzden stokastik bir sürecin uzun bir sürecini gözlemlemek, stokastik bir sürecin birçok bağımsız çalışmasını gözlemlemeye benzer.

Bazı (kesin olmayan) tanımlar

Let örnek uzayı olsun. Stokastik bir süreç , hem hem de sonuç nin bir fonksiyonudur .Ω{Yt}t{1,2,3,}ωΩ

  • Her zaman için, , (yani, bir işlev rasgele bir değişkendir , gerçek sayılar alan bazı boşluğuna).tYtΩ
  • Herhangi bir sonuç için bizde deterministik bir seridirωX(ω){Y1(ω),Y2(ω),Y3(ω),}

Zaman serilerinde temel bir konu

İstatistik 101, biz bağımsız aynen dağılma değişkenlerin bir dizi hakkında öğretilen , , ... Birden, özdeş deneyleri gözlemlemek vs bir yerde rastgele olduğunu seçildi ve bu, rasgele değişkeni hakkında bilgi edinmemizi sağlıyor . By Büyük Sayılar Kanunu , biz var neredeyse kesinlikle iç içe geçmekte olan .X1X2X3i=1,,nωiΩX1ni=1nXiE[X]

Zaman serisi ayarında temel bir fark , çoklu çizimleri yerine , zaman içinde birçok gözlemi gözlemlememizdir .tΩ

Genel durumda, hiçbir şeye yakınlaşmayabilir!1Tt=1TYt

Örnek alandan gelen çoklu çizimle benzer bir görevi başarmak için zaman içinde yapılan çoklu gözlemler için durağanlık ve ergodikliğe ihtiyacımız var .

Koşulsuz bir ortalama mevcutsa ve ergodik teorem için koşullar sağlanmışsa, zaman serileri, örnek ortalama birleşir koşulsuz ortalama için .E[Y]1Tt=1TYtE[Y]

Örnek 1: durağanlık yetersizliği

Let dejenere süreç . Biz görebilirsiniz sabit değildir (ortak dağılım zamanla değişmeyen değildir).{Yt}Yt=t{Yt}

Let zaman serisi numune kötü davranacak ve bu çok açık şey olmuyorsa olarak : . ortalaması mevcut değil ve gibi bir şeye yakınlaşmıyor .St=1ti=1tYiSttS1=1,S2=32,S3=2,,St=t+12YtStt

Örnek: ergodikliğin başarısızlığı

, tek bir jetonlu çevirmenin sonucu olsun . tüm için olsun , yani, veya .XYt=Xt{Yt}=(0,0,0,0,0,0,0,){Yt}=(1,1,1,1,1,1,1,

olsa bile , zaman serisi örneği vermez sen demek .E[Yt]=12St=1ti=1tYiYt


10

İyi ancak daha ayrıntılı olan diğer cevapların bazılarına üst düzey bir cevap eklemek için durağanlık önemlidir, çünkü yokluğunda, verileri tanımlayan bir model farklı zaman noktalarında doğrulukta farklılık gösterecektir. Bu nedenle, durağanlık, ilgilenilen tüm zaman noktalarındaki verileri doğru şekilde tanımlamak için ortalamalar, varyanslar ve korelasyonlar gibi örnek istatistikler için gereklidir.

Aşağıdaki zaman serilerine bakarken, (umarım) belirli bir zaman diliminin ortalama ve varyansının tüm durağan zaman serilerini temsil eden iyi bir iş yapıp, tüm durağan olmayan zaman serisini temsil eden göreceli olarak zayıf bir işi nasıl yapacağını görebilirsiniz. Örneğin, durağan olmayan zaman serilerinin ortalaması çok daha düşüktür ve varyansı bu aralıkta aralığından çok daha yüksektir .600<t<800200<t<400

görüntü tanımını buraya girin


8

Her şeyden önce, ARIMA (p, 1, q) süreçleri durağan değildir . Bunlara entegre seri denir, örneğin ARIMA (0,1,0) veya I (1) işlemi, ayrıca rasgele yürüyüş veya birim köküdür. Yani, hayır, hepsine sabit ihtiyacınız yok.xt=xt1+et

Ancak, genellikle durağanlığı ararız. Neden?

Tahmin problemini düşünün. Nasıl tahmin edersiniz? Eğer herşey 'ın farklı yarın o zaman tahmin etmek mümkün değil, her şey farklı olacak, çünkü. Yani tahmin anahtarıdır şey bulmak için aynı yarın olacak ve genişletmek olduğunu yarın. Bir şey bir şey olabilir bu. Size birkaç örnek vereceğim.

Yukarıdaki I (1) modelinde, hata dağılımının bugün ve yarının aynı olduğunu varsayıyoruz (veya umuyoruz): . Yani, bu durumda, yarın dağılımın hala normal olacağını ve bunun ortalama ve varyansının hala aynı 0 ve olacağını söylüyoruz . Bu henüz serinin durağan yapmamasını sağladı, ancak süreçteki değişmeyen kısmı bulduk . Sonra, ilk farka bakarsanız: - bu kedi sabittir. Bununla birlikte, amacın durağan diziyi bulmak olmadığını anlamaketN(0,σ2)σ2Δxtxtxt1=etΔxt, ancak değişmeyen bir şey bulmak, hataların dağılımıydı. Sadece, durağan seri içerisinde tanım gereği, koşulsuz ortalama ve varyans gibi değişmeyen kısımlar olacak şekilde gerçekleşir.

Başka bir örnek, gerçek dizinin şöyle olduğunu söyleyin: . Söyleyin, hatalarla ilgili bildiğimiz tek şey, ortalamalarının sıfır olduğu: . Şimdi tekrar tahmin edebiliriz! İhtiyacımız olan tek şey büyüme oranını tahmin etmek , değişmeyen ve hataların ortalaması budur. Ne zaman değişmez bir şey bulursan tahmin edebilirsin. E [ e t ] = 0 αxt=αt+etE[et]=0α

Tahmin için, serideki sabit (zamanla değişmeyen) bileşeni kesinlikle bulmamız gerekir, aksi halde tanım gereği tahmin etmek imkansızdır. Durağanlık değişmezliğin sadece özel bir halidir.


5

ARIMA çoğu zaman kendi başına gerileme gösterdiğinden, gereksiz bir şekilde güçlü bir eğilim veya mevsimsellikten etkilenecek bir tür kendi kendine uyarılan çoklu regresyon kullanır. Bu çoklu regresyon tekniği, önceki zaman serisi değerlerine, özellikle de en son dönemlerdeki değerlere dayanır ve gelecekteki bir değeri açıklamaya çalışan birden fazla geçmiş değer arasında çok ilginç bir "aralarındaki ilişki" çıkarmamıza olanak tanır.


2

Zaman Serileri, bir serinin değerlerinin önceki değerlere bağlı olma şeklinin analizi ile ilgilidir. SRKX'in önerdiği gibi, durağan olmayan bir seri oluşturmak için durağan olmayan bir seriyi farklılaştırabilir veya düşürebilir ya da anlamını kaldırabiliriz! ARMA analizi durağanlık gerektirir. dağılımı her ve için ile aynı ise, kesinlikle durağandır.( X t + 1 , ... , X t + k ) ( X 1 , ... , X k ) t kX(Xt+1,,Xt+k)(X1,,Xk)tk. Wiki'den: durağan bir süreç (ya da katı (ly) durağan süreç ya da güçlü (ly) durağan süreç), ortak olasılık dağılımı zaman ya da uzayda kaydırıldığında değişmeyen stokastik bir süreçtir. Sonuç olarak, eğer varsa, ortalama ve varyans gibi parametreler de zaman içinde veya pozisyonda değişmez. Ayrıca, Kardinal doğru bir şekilde işaret ettiğinden, otomatik korelasyon işlevi zamanla değişmez olmalıdır (bu, kovaryans işlevinin zamanla sabit olduğu anlamına gelir), tüm zaman aralıklarında değişmeyen / sabit olan ARMA modelinin parametrelerine dönüştürür.

ARMA modelinin durağanlık fikri, tersinirlik fikrine yakından bağlıdır.

biçiminde bir model düşünün . birim daire içinde kökleri olduğundan ve bu nedenle bir gereksinimi ihlal ettiği için bu model patlayıcıdır . Birim çemberin içinde kökleri olan bir model, "daha eski verilerin" elbette anlamlı olmayan "daha yeni veri" den daha önemli olduğu anlamına gelir.( 1 - 1,1 B )y(t)=1.1y(t1)(11.1B)


1
Biraz kelime oyunu: " , ilk iki anın zamanla değişmeyen olması durumunda ikinci derece durağandır " derken ne demek istediğinizi açık bir şekilde söyleyemezsiniz . Normalde, ikinci dereceden durağanlığı düşündüğümde, ortalamanın değişmezliğine ek olarak zamanla otokorelasyon işlevinin değişmez olduğunu düşünüyorum. Bu, elbette, belirttiğinizin (saf?) Yorumundan ( çok ) daha güçlü bir durumdur. X
kardinal

İkinci dereceden durağanlığın belirtilmesi, en son düzenlemenizde kaybolmuş görünüyor. Bu kasıtlı mıydı? (Benim orijinal yorumum, katı durağanlıktan ziyade ikinci dereceden durağanlığa yöneldi.)
kardinal

: kardinal Sanırım yorumunuzun önemli olduğunu hissettim ve neyin varsayıldığını daha net anladım. "İkinci mertebeden durağan" fikrinin netlik kattığını düşünüyorsanız, lütfen cevabıma basit ve basit bir İngilizceye ışık tutacak şekilde eklememe yardım edin.
IrishStat,

-2

ARMA ve ARIMA, serinin durağan olduğu varsayımıyla inşa edilmiştir. Seri değilse o zaman tahmin yanlış olacaktır.

Örnek istatistikler - ortalama, varyans, eş varyans - gelecekteki davranışların tanımlayıcıları olarak sadece seri durağan olduğunda faydalıdır. Örneğin, seri zaman içinde sürekli artıyorsa, numune ortalaması ve varyansı numunenin büyüklüğü ile büyüyecek ve gelecek dönemlerde ortalama ve varyansı her zaman hafife alacaktır. Durağan olmayan bir veriye yerleştirilmiş olan regresyon modellerini ekstrapolate etmeye çalışırken dikkatli olmak önemlidir.


-3

Benim görüşüme göre stokastik süreç, zamana göre değişken olması gereken üç istatistiksel özellik tarafından yönetilen süreçtir. Ortalama varyans ve otomatik korelasyon işlevidir. otomatik-korelasyon işlevi olan üçüncü özellik, bağımlılığın zaman ilerledikçe (gecikme) nasıl azaldığını söyleyen bir özellik olarak düşünülmelidir.


5
Bu, stokastik bir süreç olmak ve durağan olmakla karıştırıyor, bu yüzden temel bir hatayla başlıyor. Cevabınız daha önce yayınlanmış olanlara ne ekler?
Nick Cox,

-3

Her şeyi çözmek için, denklemleri statik kullanarak matematiksel olarak modellememiz gerekir.

  1. Bu gibi denklemleri çözmek için bağımsız ve sabit olması gerekir (hareket etmiyor)
  2. Durağan verilerde sadece çok amaçlı bilgiler almamız ve matematiksel işlemler yapabilmemiz (ortalama, varyans vb.) Olabilir.
  3. Sabit olmayanlarda veri almak zordur

Dönüşüm sürecinde bir eğilim ve mevsimsellik elde edeceğiz


2
Cevapların hiçbiri anlamlı değil. Sorunun öncülü yanlış. Pek çok zaman serisi hem teorik hem de gözlemsel olarak durağan sayılmaz. Örneğin bununla başa çıkmanın birçok yolu var! dizi veya mevsimsel farklılık serisi veya sinüs dalgaları gibi döngüsel bileşenler de dahil olmak üzere 2..
Michael Chernick

@MichaelChernick Farklılık ve mevsimsel farklılık sırasında durağan olmayan serileri durağan olmayan serilere dönüştürüyoruz. Pek çok zaman serisinin durağan olmadığını, matematiksel olarak çözmek için durağan bir sağa dönüştürmemiz gerektiğini kabul
ediyorum
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.