R mevsimsel zaman serisi


9

decomposeFonksiyonu kullanıyorum ve Raylık zaman serilerimin (trend, mevsimsel ve rastgele) 3 bileşenini buluyorum. Grafiği çizersem veya tabloya bakarsam, zaman serisinin mevsimsellikten etkilendiğini açıkça görebilirim.

Bununla birlikte, zaman serisini 11 mevsimsel kukla değişkene gerilediğimde, tüm katsayılar istatistiksel olarak anlamlı değildir, bu da mevsimsellik olmadığını gösterir.

Neden iki farklı sonuç bulduğumu anlamıyorum. Bu kimseye oldu mu? Yanlış bir şey mi yapıyorum?


Buraya bazı yararlı ayrıntılar ekliyorum.

Bu benim zaman serim ve buna karşılık gelen aylık değişim. Her iki grafikte de mevsimsellik olduğunu görebilirsiniz (ya da değerlendirmek istediğim şey budur). Özellikle, ikinci grafikte (serinin aylık değişimi) tekrarlayan bir model (yılın aynı aylarında yüksek puan ve düşük puan) görebiliyorum.

Zaman serisi

MonthlyChange

Aşağıda decomposeişlevin çıktısı verilmiştir . @RichardHardy'nin dediği gibi, fonksiyonun gerçek mevsimsellik olup olmadığını test etmediğini takdir ediyorum. Ama ayrışma ne düşündüğümü teyit ediyor gibi görünüyor.

ayrıştırmak

Bununla birlikte, 11 mevsim kukla değişkeninde (Ocak-Kasım, Aralık hariç) zaman serisine gerilediğimde aşağıdakileri bulurum:

    Coefficients:
                  Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 5144454056  372840549  13.798   <2e-16 ***
    Jan     -616669492  527276161  -1.170    0.248    
    Feb     -586884419  527276161  -1.113    0.271    
    Mar     -461990149  527276161  -0.876    0.385    
    Apr     -407860396  527276161  -0.774    0.443    
    May     -395942771  527276161  -0.751    0.456    
    Jun     -382312331  527276161  -0.725    0.472    
    Jul     -342137426  527276161  -0.649    0.520    
    Aug     -308931830  527276161  -0.586    0.561    
    Sep     -275129629  527276161  -0.522    0.604    
    Oct     -218035419  527276161  -0.414    0.681    
    Nov     -159814080  527276161  -0.303    0.763

Temel olarak, tüm mevsimsellik katsayıları istatistiksel olarak anlamlı değildir.

Doğrusal regresyonu çalıştırmak için aşağıdaki işlevi kullanıyorum:

lm.r = lm(Yvar~Var$Jan+Var$Feb+Var$Mar+Var$Apr+Var$May+Var$Jun+Var$Jul+Var$Aug+Var$Sep+Var$Oct+Var$Nov)

burada Yvar'ı aylık frekanslı bir zaman serisi değişkeni olarak ayarladım (frekans = 12).

Ayrıca, regresyona bir eğilim değişkeni de dahil olmak üzere zaman serisinin trend bileşenini dikkate almaya çalışıyorum. Ancak, sonuç değişmez.

                  Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 3600646404   96286811  37.395   <2e-16 ***
    Jan     -144950487  117138294  -1.237    0.222    
    Feb     -158048960  116963281  -1.351    0.183    
    Mar      -76038236  116804709  -0.651    0.518    
    Apr      -64792029  116662646  -0.555    0.581    
    May      -95757949  116537153  -0.822    0.415    
    Jun     -125011055  116428283  -1.074    0.288    
    Jul     -127719697  116336082  -1.098    0.278    
    Aug     -137397646  116260591  -1.182    0.243    
    Sep     -146478991  116201842  -1.261    0.214    
    Oct     -132268327  116159860  -1.139    0.261    
    Nov     -116930534  116134664  -1.007    0.319    
    trend     42883546    1396782  30.702   <2e-16 ***

Dolayısıyla sorum şu: regresyon analizinde yanlış bir şey mi yapıyorum?


1
@forecaster, işte sorunuza bir cevap (OP, decomposefonksiyonun Rkullanıldığını söylüyor ).
Richard Hardy

1
decomposeFonksiyonun yardım dosyasını okurken, fonksiyonun mevsimsellik olup olmadığını test etmediği görülmektedir. Bunun yerine, sadece her mevsim için ortalama elde eder, ortalamayı çıkarır ve bunu mevsimsel bileşen olarak adlandırır. Bu nedenle, gerçek mevsimsel bileşen ya da sadece gürültü olup olmadığına bakılmaksızın mevsimsel bir bileşen üretecektir. Bununla birlikte, mevsimsellik verilerin bir grafiğinden görülebileceğini söyleseniz de, bu, aptallarınızın neden önemsiz olduğunu açıklamaz. Numuneniz önemli mevsimsel mankenler elde etmek için çok küçük olabilir mi? Ortaklaşa anlamlılar mı?
Richard Hardy

3
Ölçeklere bakmanız gerekir, mevsimsel grafik mevsimsel değişimin -0.02 ile +0.04 arasında olduğunu gösterirken, gerçek değerler 4 milyar ila 6 milyar arasında değişmektedir. Ayrıştırma işlevi, verilerinizi bazı mevsimsellik göstermeye zorlar, bu nedenle ihmal edilebilir bir değer gösterir. Verilerinizde mevsimsellik yoktur.
tahminci

1
Mevsimselliğin, hareketin büyüklüğünden ziyade belirli bir "sabit" frekansa sahip hareketlerle ilgili olduğunu düşündüm. İlk grafik bir denge (pound cinsinden) ve ikincisi ise değişiklik (yüzde cinsinden ifade edilir) olduğu için ölçekler farklıdır. Sadece gerilemeyi yeniden çalıştırmayı denedim: eğer bir polinom eğilimini hesaba katarsam, bazı katsayılar anlamlı olmaya başlar. Sanırım @ danno'nun önerdiği gibi, eğilim çok önemli.
mattiace

1
Canova ve Hansen testi, verilerinizde mevsimsel bir paternin varlığı ve istikrarı hakkında daha fazla bilgi verebilir. Bu testin bazı uygulamalar için örneğin bkz Bu yayını da orijinal kağıda ve örnek kod bağlantısını verir.
javlacalle

Yanıtlar:


1

Trendi kaldırdıktan sonra veriler üzerinde gerileme mi yapıyorsunuz ? Olumlu bir trendiniz var ve Yvar'daki eğilimi hesaba katmadıkça mevsimsel imzanız muhtemelen regresyonunuzda maskeleniyor (trend veya hata nedeniyle varyans aydan daha büyük) ...

Ayrıca, zaman serilerinden çok emin değilim, ancak her bir gözlem bir ay atanmamalı ve regresyonunuz böyle bir şeye benzemeli mi?

lm(Yvar ~ Time + Month)

Bu mantıklı değilse özür dileriz ... Burada regresyon en mantıklı mı?


Bir Econometrics ders kitabında (Wooldridge) okudum, eğer regresyonda bir "zaman" faktörü sunarsanız, bu orijinal zaman dizinizin eğilimini azaltmak gibidir. "Zaman" faktörü için n = gözlem sayısına [1, 2, ..., n] gibi bir vektörü kastediyorum. İkinci noktanı gerçekten anlamadım. İkinci regresyonum şöyle: lm.r = lm (Yvar ~ VarTime+VarJan + VarFeb+...+VarKasım). Demek istediğin bu mu?
mattiace

Verilerinizin birkaç satırını görmenize yardımcı olur. Ancak, üç sütununuz olduğunu düşünüyorum, Time, Yvar, Month. Satırlar gözlemlerdir. Bu nedenle, lm () değerinizdeki faktörlerin Zaman ve Ay (Ayın faktör seviyeleri değil) olacağını düşünürüm. Ayrıca, zaman serisinde lm () ile ilgili bazı sorunlar olduğunu düşünüyorum ... gözlem bağımsız değildir - geçici olarak otokorelasyonlu.
danno

1

Zaman serilerinin grafiksel tasvirinde, "trend" in - zamandaki doğrusal bir bileşen - gerçekleşmenin en önemli katkısı olduğu açıktır. Bu zaman serisinin en önemli yönünün her ay istikrarlı yükseliş olduğunu söyleyebiliriz.

Bundan sonra, mevsimsel varyasyonun karşılaştırmalı olarak minik olduğunu yorumlayacağım. Bu nedenle, 6 yıldan fazla süren aylık önlemler (toplamda sadece 72 gözlem) ile, lineer regresyon modeli , 11 aylık kontrastların herhangi birini istatistiksel olarak anlamlı olarak tanımlama hassasiyetine sahip olamamaktadır . Ayrıca zaman etkisi olması şaşırtıcı değildir gelmez onların mevsimsel etkisi şartına tüm 72 gözlemleri üzerinde meydana gelen aynı Yaklaşık tutarlı doğrusal artış olduğu için, istatistiksel bir değişiklik.

11 aylık zıtlıkların herhangi biri için istatistiksel önem eksikliği mevsimsel etkilerin olmadığı anlamına gelmez. Aslında, herhangi bir mevsimsellik olup olmadığını belirlemek için bir regresyon modeli kullanacaksanız, uygun test, her ay kontrastının istatistiksel önemini aynı anda değerlendiren iç içe geçmiş 11 serbestlik derecesi testidir. Böyle bir testi bir ANOVA, olabilirlik oranı testi veya sağlam Wald testi yaparak elde edersiniz. Örneğin:

library(lmtest) model.mt <- lm(outcome ~ time + month) model.t <- lm(outcome ~ time) aov(model.mt, model.t) lrtest(model.mt, model.t) library(sandwich) ## autoregressive consistent robust standard errors waldtest(lrtest, lmtest, vcov.=function(x)vcovHAC(x))


0

Sizin durumunuz olup olmadığını bilmiyorum, ama R'deki zaman serilerini analiz etmeye başladığımda bu oldu ve sorun, ayrıştırmak için zaman serisi nesnesini oluştururken zaman serisi dönemini doğru bir şekilde belirtmememdi. Zaman serisi fonksiyonunda, frekansını belirlemenizi sağlayan bir parametre vardır. Bunu yaparak, mevsimsel eğilimlerini doğru bir şekilde ayrıştırır.


jmnavarro, ayrıştırma işlevinde frekansı doğru tanımladım (aylık verilerim olduğu gibi = 12). Aslında, bu fonksiyonun sonucundan memnunum. Benim sorum, kukla değişkenler kullanarak doğrusal regresyon yaptığımda neden aynı sonucu bulamıyorum (mevsimsellik önemlidir). Hem R hem de excel ile yaptım ve sonuçlar aynı: kukla katsayılar istatistiksel olarak anlamlı değil. Bu, daha önce ayrıştırma işlevinde bulduğum şeye aykırıdır. Burada bir şey eksik olup olmadığımı anlamıyorum
mattiace

Doğru, üzgünüm, sorunuzu tam olarak anlamadım. Kodunuzu gönderebiliyorsanız bu size yardımcı olabilir, bu yüzden kodu yeniden oluşturmayı deneyebiliriz.
jmnavarro
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.