Zaman serilerinin öngörülebilirliği nasıl belirlenir?


10

Tahmincileri karşılaştığı önemli konulardan biri verilen seri halinde olabilir tahmin ya da değil?

Belirli bir zaman serisini belirlemek için göreli bir ölçü olarak Yaklaşık Entropi'yi (ApEn) kullanan Peter Catt tarafından " Öngörülebilirliğin Öncelik Göstergesi Olarak Entropi " başlıklı bir makaleye rastladım .

Makale diyor ki,

"Daha küçük ApEn değerleri, bir dizi veriyi takip eden benzer verilerle (düzenlilik) daha büyük bir şansa işaret eder. Bunun aksine, ApEn'in daha büyük bir değeri, benzer verilerin tekrarlanma olasılığının daha düşük olduğunu gösterir (düzensizlik). , rasgelelik ve sistem karmaşıklığı. "

Bunu ApEn hesaplamak için matematiksel formüller takip eder. Bu ilginç bir yaklaşımdır, çünkü göreceli olarak öngörülebilirliği değerlendirmek için kullanılabilecek sayısal bir değer sağlar. Yaklaşık Entropinin ne anlama geldiğini bilmiyorum, hakkında daha fazla bilgi okuyorum.

Adında bir paket vardır pracma içinde Rolduğunu sen apen hesaplamak sağlar. Açıklayıcı bir amaçla 3 farklı zaman serisi kullandım ve ApEn sayılarını hesapladım.

  1. Seri 1: Ünlü AirPassenger zaman serisi - son derece belirleyicidir ve kolayca tahmin edebilmeliyiz.
  2. Seri 2: Sunspot Zaman Serisi - çok iyi tanımlanmıştır, ancak seri 1'den daha az tahmin edilebilir olmalıdır.
  3. Seri 3: Rastgele Sayı Bu seriyi tahmin etmenin bir yolu yoktur.

Yani ApEn hesaplarsak, Seri 1, Seri 2'den daha az olmalı, Seri 3 çok daha az olmalıdır.

Üç dizinin tümü için ApEn değerini hesaplayan R snippet'i aşağıdadır.

library("pracma")
> series1 <- approx_entropy(AirPassengers)
> series1
[1] 0.5157758
> series2 <- approx_entropy(sunspot.year)
> series2
[1] 0.762243
> series3 <- approx_entropy(rnorm(1:30))
> series3
[1] 0.1529609

Beklediğim bu değil. Rastgele seri, iyi tanımlanmış AirPassenger serisinden daha düşük bir sayıya sahiptir. Rastgele sayıyı 100'e çıkarsam bile, yine de iyi tanımlanmış seri 2 / Sunspot.yealry serisinden daha az olanı alıyorum.

> series3 <- approx_entropy(rnorm(1:100))
> series3
[1] 0.747275

Sorularım aşağıdadır:

  1. ApEn ( mve r) hesaplamasında 2 parametre var mı? Onları nasıl belirlerim. RYukarıdaki kodda varsayılanları kullandım .
  2. Ne yanlış yapıyorum bu yanlış ApEn rasgele sayılar için daha düşük olduğunu gösteren sunspot.yearly gibi iyi tanımlanmış bir dizi.
  3. Diziyi mevsimsellikten arındırmalı / alçaltmalı ve ApEn'i tahmin etmeliyim. Ancak yazar ApEn'i doğrudan serinin üzerine uygulamıştır.
  4. Serinin öngörülebilir olup olmadığını belirlemenin başka bir yolu var mı?

Makalede belirtildiği gibi, yaklaşık entropi kısa süreli serilerde kullanılmamalıdır, N <200. Daha da önemlisi, makale yaklaşık entropi değil, örnek entropiyi kullanır. Pracma her ikisini de içerir. Teşekkürler

Açıklayıcı değişkenleri açıklıyor mu? Örneğin, bir firmanın hesap yıpranmasını tahmin ediyorsanız, bu pazarlama harcamalarıyla ilişkilendirilebilir ve harcama oldukça öngörülebilirdir, aslında aylar önce planlanmaktadır. Bu önerilen yaklaşımda nasıl açıklanır?
Aksakal

@Aksakal, hayır açıklayıcı değişken yok. Öngörülebilirliği değerlendirmek için nesnel bir ölçüme ihtiyaç duyduğumuz büyük ölçekli tek değişkenli (açıklayıcı değişken yok) zaman serisi tahmini arıyordum. Ayrıca, birçok durumda tek değişkenli tahmin, açık değişkenlerle oluşturulan modellerden çok daha doğrudur.
tahminci


1
Benim düşüncem, bu önerilen kopyadan çok daha dar bir soru olmasıdır. Oylama açık bırakılır, ancak OP'nin ikisini karıştırmamak için daha spesifik bir başlık düşünmesini önerin. " Yaklaşık entropi kullanarak zaman serilerinin öngörülebilirliği nasıl belirlenir ?"
Sean Easter

Yanıtlar:


7

Parametreler mve zaman serilerinin yaklaşık entropisinin (ApEn)r hesaplanmasında , ilgili pencere (sıra) uzunluğu ve toleransı (filtre değeri) vardır . Aslında, açısından , hem de (veri noktalarının sayısı), apen olduğu tanımlanan "uzunluğunun tekrarlanan desenleri nispi yaygınlığı doğal logaritma olarak uzunluğu olanlar ile karşılaştırıldığında " (Balasis, Daglis, Anastasiadis ve Eftaxias 2011 , s. 215):mrNmm + 1

birpEn(m,r,N-)=Φm(r)-Φm+1(r),

nerede 

Φm(r)=ΣbenlnCbenm(r)/(N--m+1)

Bu nedenle, toleransı değiştirmenin zaman serilerinin entropisini belirleme r(zamansal) ayrıntı düzeyini kontrol etmeye izin verdiği görülmektedir . Bununla birlikte, varsayılan her ikisi için değerleri kullanarak mve rparametreleri pracmapaketin entropi işlev çağrıları cezası çalışır. Üç zaman serisinin tümü için doğru entropi değerleri ilişkisini görmek için yapılması gereken tek düzeltme (daha iyi tanımlanmış seriler için daha düşük entropi, daha rastgele veriler için daha yüksek entropi) rastgele veri vektörünün uzunluğunu arttırmaktır :

 library(pracma)
 set.seed(10)
 all.series <- list(series1 = AirPassengers,
                    series2 = sunspot.year,
                    series3 = rnorm(500)) # <== size increased
 sapply(all.series, approx_entropy)
  series1   series2   series3 
  0.5157758 0.7622430 1.4741971 

Sonuçlar, beklenen - en kararlı gelen dalgalanmalar önceden tahmin azaldıkça series1en rasgele series 3, kendi entropi dolayısıyla artar: ApEn(series1) < ApEn(series2) < ApEn(series3).

Diğer açıdan önlemlerin arasında tahmin edilebilirlik , denetlemek isteyebilirsiniz ortalama mutlak ölçekli hataları (MASE) bakınız - Bu tartışmayı daha fazla ayrıntı için. Öngörülebilir bileşen analizi , zaman serilerinin öngörülebilirliğini belirlemek için ilginç ve yeni bir yaklaşım gibi görünmektedir . Ve muhtemelen , bunun için bir Rpaket var - ForeCA .

library(ForeCA)
sapply(all.series,
       Omega, spectrum.control = list(method = "wosa"))
 series1   series2   series3 
 41.239218 25.333105  1.171738 

Burada tahmin edilebilirliğin bir ölçüsüdür.Ω[0,1]Ω(whbentenÖbense)=0%Ω(sbennusÖbend)=100%

Referanslar

Balasis, G., Daglis, IA, Anastasiadis, A. ve Eftaxias, K. (2011). Entropi kavramları ve yeniden ölçeklendirilmiş aralık analizi kullanılarak Dst time sSeries'de dinamik karmaşıklık değişikliklerinin tespiti. W. Liu ve M. Fujimoto (Eds.), Dinamik Manyetosfer, IAGA Özel Sopron Kitabı, Seri 3, 211. doi: 10.1007 / 978-94-007-0501-2_12. Springer. Http://members.noa.gr/anastasi/papers/B29.pdf adresinden erişildi.

Georg M. Goerg (2013): Öngörülebilir Bileşen Analizi. JMLR, W&CP (2) 2013: 64-72. http://machinelearning.wustl.edu/mlpapers/papers/goerg13


Ayrıca pracma::sample_entropy()işlevi test ettim ve bu senaryoda da zaman serisindeki sonuç ilişkisini düzelttim.
Aleksandr Blekh

@forecaster: Bir şey değil.
Aleksandr Blekh

1
Ayrıca , öngörülebilirlik ölçümlerini haklı çıkarmak için deneysel verileri kullanan notsoirrational.files.wordpress.com/2015/04/schulz15.pdf makalesine bakın . Ayrıca, bu çalışmanın bazılarını bu yazıda bahsedilen ForeCA çalışmasıyla da ilişkilendirmektedir
Georg M. Goerg

@ GeorgM.Goerg: Öneriler, bağlantı ve düzenlemeler için teşekkür ederiz.
Aleksandr Blekh

@forecaster: Benim için zevkti.
Aleksandr Blekh

0

Her zaman serisi 3 bileşenden oluşur: Trend, Mevsimsellik ve Rastgele. Veriler güçlü bir eğilim gösteriyorsa ve / veya mevsimsel olarak yüksekse, tahmin nispeten kolay olacaktır. Veriler çoğunlukla rastgele ise, tanım gereği hiçbir şey tahmin edemezsiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.