Periyodik olmayan zaman serilerindeki eğilim nasıl analiz edilir


12

Aşağıdaki periyodik olmayan zaman serilerine sahip olduğumu varsayalım. Açıkçası eğilim azalıyor ve bunu bazı testlerle ( p değeriyle ) kanıtlamak istiyorum . Değerler arasında güçlü zamansal (seri) oto-korelasyon nedeniyle klasik lineer regresyonu kullanamıyorum.

library(forecast)
my.ts <- ts(c(10,11,11.5,10,10.1,9,11,10,8,9,9,
               6,5,5,4,3,3,2,1,2,4,4,2,1,1,0.5,1),
            start = 1, end = 27,frequency = 1)
plot(my.ts, col = "black", type = "p",
     pch = 20, cex = 1.2, ylim = c(0,13))
# line of moving averages 
lines(ma(my.ts,3),col="red", lty = 2, lwd = 2)

resim açıklamasını buraya girin

Seçeneklerim neler?


4
Bence dizinin periyodik olmayan ( frequency=1) olması çok az alakalı. Daha ilgili bir sorun, modeliniz için işlevsel bir form belirtmek isteyip istemediğiniz olabilir.
Richard Hardy

1
Verilerin ne olduğu hakkında daha fazla bilgi modelleme için muhtemelen yararlı olacaktır.
bdeonovic

Veriler, her yıl su rezervuarında sayılan belirli türlerin (binlerce olarak) bireylerin sayısıdır.
Ladislav Naďo

1
@LadislavNado, serideki örnekte olduğu gibi kısa mı? Soruyorum çünkü eğer öyleyse, örneklem büyüklüğü nedeniyle kullanılabilecek yöntem sayısını azaltır.
Tim

1
Azalan yönün açıklığı, bana göre, dikkate alınması gereken oldukça ölçeğe bağlıdır
Laurent Duval

Yanıtlar:


7

Söylediğiniz gibi, örnek verilerinizdeki eğilim açıktır. Bu gerçeği hipotez testi ile doğrulamak istiyorsanız, lineer regresyon (belirgin parametrik seçim) kullanmanın yanı sıra, monotonik eğilim için parametrik olmayan Mann-Kendall testini kullanabilirsiniz. Test şu amaçla kullanılır:

ilgilenilen değişkenin zaman içinde tekdüze bir yukarı veya aşağı eğilimi olup olmadığını değerlendirmek. Tekdüze bir yukarı (aşağı) eğilim, değişkenin zaman içinde sürekli olarak arttığı (azaldığı) anlamına gelir, ancak eğilim doğrusal olabilir veya olmayabilir. ( http://vsp.pnnl.gov/help/Vsample/Design_Trend_Mann_Kendall.htm )

ayrıca, Gilbert (1987) tarafından belirtildiği gibi, test

eksik değerlere izin verildiğinden ve verilerin belirli bir dağıtımla uyumlu olması gerekmediğinden özellikle yararlıdır

xjxin(n1)/2

S=i=1n1j=i+1nsgn(xjxi)

sgn()S τ1+1τ

τ=Sn(n1)/2

pn10pSS

var(S)=118[n(n1)(2n+5)p=1gtp(tp1)(2tp+5)]

ve sonra hesaplayınZMK

ZMK={S1var(S)if S>00if S=0S+1var(S)if S<0

ZMK

  • ZMKZ1α
  • ZMKZ1α
  • |ZMK|Z1α/2

Bu konuda bu testi uygulayan R kodunu bulabilirsiniz.

SpSpSdataSpermutationSdataSpermutation


Gilbert, RO (1987). Çevre Kirliliğinin İzlenmesi için İstatistiksel Yöntemler. Wiley, NY.

Önöz, B. ve Bayazit, M. (2003). Trend tespiti için istatistiksel testlerin gücü. Türk Mühendislik ve Çevre Bilimleri Dergisi, 27 (4), 247-251.


1

"Değerler arasında güçlü zamansal (seri) otomatik korelasyon nedeniyle klasik doğrusal regresyon kullanamıyorum." gerçekte bir fırsattır. 27 değerinizi aldım ve AUTOBOX'u (isteğe bağlı olarak) olası bir modeli otomatik olarak belirleyebilen bir yazılım parçası (geliştirmeye yardımcı oldum) kullandım. İşte gerçek / uyum ve tahmin grafiği resim açıklamasını buraya girin. Artıkların ACF'si burada artık arsa ile resim açıklamasını buraya girin. Model burada resim açıklamasını buraya girinve burada resim açıklamasını buraya girinve buradaresim açıklamasını buraya girin. İki katsayı, tahmini "eğilim" olarak da adlandırılan "sürüklenme" yani yani -.596 arasındaki dönem farkı ile ilgili verileri uygun şekilde açıklar. Bunun, modelinizin 1,2, ... 27 sayma sayılarını bir tahmin değişkeni olarak kullandığı bir tür eğilim olduğunu unutmayın. Verileriniz bu tür bir eğilim önermişse, yazılım daha uygulanabilir olduğunu fark ederdi. Bu iki tür eğilimi tamamen ayrıntılı / zıt olan daha önceki bir yazımı bulacağım. Burada stokastik bir trend modelinin belirlenmesi ve ilk trendin veya aykırı değerlerin belirlenmesi

resim açıklamasını buraya girin


2
Otomatik kutu tahmini, son trendin kırıldığı 1996, 1999, 2000, 2009'daki her ilginç noktayı kaçırıyor. Neredeyse bir yıl faz değişimine benziyor. Bu bakımdan hiçbir şeyi açıklamaz.
Aksakal

Verilere yüksek dereceli bir polinom takma konusunda önceki tavsiyeniz (yanaktaki dil) tam olarak ne istersen yapardı. Ama biz uydurmakla ilgili değiliz, modelleme ile ilgili. Kalan arsa, bazı harici / bilinmeyen faktör nedeniyle bir hata sürecini yeterince açıklıyor gibi görünüyor. Tüm modeller yanlış ama bazıları faydalı. Bu yararlı bir model olduğuna inanıyorum, ancak daha iyisini yapabileceğinizi düşünüyorsanız, lütfen sonuçlarınızı yayınlayın, böylece hepimiz öğrenebiliriz. Geçmişin atlanan değişkenler için bir vekil olması nedeniyle ARIMA modelinden bir açıklama yoktur.
IrishStat

2
Bu durumda, istatistiklerle ilgisi yok gibi görünüyor. Hiç ilginç bir istatistik sorusu değil. Açık bir eğilim var ve OP olgunun fiziğini incelemeli. Bence bu model Autobox gibi uyarlar OP'yi yanlış yöne yönlendiriyor. Zaten belirgin olanın ötesinde değerli bir şey açığa vurmuyorlar.
Aksakal

Soru analizin insan gözünün yerini alıp alamayacağıdır ... Analiz gözün neyi desteklediğini ortaya çıkarır, bu yüzden hemen görülebilir olandan daha fazlasını yapmak için istatistikleri uygularız. AUTOBOX çözümü OP'yi doğru yönde, yani aşağı yönlendirir. Görüşleriniz hiç de verimli değil ama daha önce sorduğum gibi (kibarca) lütfen istatistiklere dayalı uygulanabilir bir alternatif sağlayın. Bence bu çok ilginç bir istatistiki soru ve cevap gerektiriyor. Mümkünse lütfen bir tane sağlayın.
IrishStat

1

Sen kullanabilirsiniz Spearman korelasyon katsayısı size veri monoton açık olma seviyesini belirlemek için. Monotonik artan veriler için pozitif değerler ve monotonik azalan veriler için negatif değerler (-1 ile +1 arasında) döndürür. Yukarıdaki bağlantıyı takiben, önem testiyle ilgili bir bölüm de vardır, ancak çoğu yazılım paketinin korelasyon katsayılarını hesaplarken sizin için yapılmış bir p değerine sahip olacağından eminim (örneğin Matlab [RHO,PVAL] = corr(...):; R: 'de cor.test(x,...))


0

OLS kullanabilirsiniz, çünkü seri otokorelasyon yoktur (en azından verdiğiniz örnekte); 1.966 (≈2) Durbin-Watson test istatistiğine dikkat edin.

Yani, x1 için önemli ölçüde negatif katsayı tahmini, şöyle bir şey söylemek için yeterlidir

Gözlenen [belirli türler] sayısı yılda yaklaşık 1.000 azalmaktadır.

veya

Gözlenen [belirli türler] sayısı yılda 628 ile 1.408 arasında azalmaktadır (% 95 güven ile).

Bu, tür sayma metodolojisinin iyi bir kapsama sahip olduğunu ve numunenizdeki yıllar boyunca tutarlı olduğunu varsayar.

resim açıklamasını buraya girin

Bu, bu Python kodu ile üretildi (üzgünüm; R kullanışlı değil):

import numpy as np
import statsmodels.api as sm

y = [10,12,10,11,8,9,6,4,2,4]
x = np.arange(len(y))
x = sm.add_constant(x)

mod = sm.OLS(y, x)
result = mod.fit()
print(result.summary())

0

Veri kaynağını bilmek çok yararlı olacaktır ve ayrıca değerlerinin my.tsnegatif olup olmayacağı bilgisi de yararlı olacaktır .

Bununla birlikte, sabit bir doğrusal eğilim görmek yerine, arsaya hızlı bir şekilde göz atarak , zaman serisinin sabit olmadığını ve dolayısıyla entegre olduğunu öneriyorum . Örnek olarak, hisse senedi fiyatları da entegre edilmiştir, ancak hisse senedi getirileri artık (0 civarında dalgalanmaktadır).

Bu hipotez, Artırılmış Dickey Fuller Testi kullanılarak da test edilebilir:

require(tseries)
adf.test(my.ts)

Augmented Dickey-Fuller Test
Dickey-Fuller = -2.9557, Lag order = 2, p-value = 0.7727
alternative hypothesis: stationary

P değerinin 0.05'in altında olmadığı düşünüldüğünde, işlemin durağan olduğuna dair bir kanıt yoktur.

Verileri sabit tutmak için fark etmeniz gerekir:

diff.ts <- diff(my.ts)
plot(diff.ts)

resim açıklamasını buraya girin

Artık veriler artık bir eğilim göstermiyor ve bulacağınız tek şey 2. dereceden (o) kullanarak otoregresif bir terim acf(diff.ts).

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.