Zaman serisi tahmini yaparken iyi uygulamalar


10

Aylardır kısa vadeli yük tahmini ve doğruluğu artırmak için iklim / hava durumu verilerinin kullanımı üzerinde çalışıyorum. Bir bilgisayar bilimi geçmişim var ve bu nedenle ARIMA modelleri gibi istatistik araçlarıyla çalışırken büyük hatalar ve haksız karşılaştırmalar yapmaya çalışmıyorum. Birkaç şey hakkındaki görüşünüzü bilmek istiyorum:

  1. Hava verilerinin tahmin üzerindeki etkisini araştırmak için hem (S) ARIMA hem de (S) ARIMAX modellerini kullanıyorum, ayrıca Üstel Düzeltme yöntemlerini de kullanmanın gerekli olacağını düşünüyor musunuz?

  2. 300 günlük örneklerden oluşan bir zaman serisine sahip olmak İlk iki haftadan başlıyorum ve auto.arima R işlevi (tahmin paketi) ile oluşturulan modelleri kullanarak 5 günlük bir tahmin gerçekleştiriyorum. Sonra, veri setime başka bir örnek ekliyorum ve modelleri tekrar kalibre ediyorum ve mevcut verilerin sonuna kadar 5 günlük bir tahmin daha yapıyorum. Bu şekilde çalışmanın doğru olduğunu düşünüyor musunuz?

Önerileriniz için teşekkür ederiz, işimizin hedefi bir mühendislik dergisi makalesi olsa da, istatistiksel açıdan olabildiğince titiz bir çalışma yapmak istiyorum.


1
Bu soru birbiriyle yakından ilişkili gibi görünüyor: stats.stackexchange.com/questions/16915/…
whuber

Yanıtlar:


9
  1. Bence üstel yumuşatma modellerini de keşfetmeye değer. Üstel yumuşatma modelleri, ARIMA modellerinden temelde farklı bir model sınıfıdır ve verilerinizde farklı sonuçlar verebilir.

  2. Bu geçerli bir yaklaşım gibi geliyor ve Rob Hyndman tarafından önerilen zaman serisi çapraz doğrulama yöntemine çok benziyor .

Her tahminden (üstel yumuşatma, ARIMA, ARMAX) çapraz doğrulama hatasını toplar ve daha sonra 3 yöntemi karşılaştırmak için genel hatayı kullanırdım.

Ayrıca auto.arima kullanmak yerine ARIMA parametreleri için bir "ızgara araması" da düşünmek isteyebilirsiniz. Bir ızgara aramasında, bir arima modeli için olası her parametreyi keşfeder ve ardından tahmin doğruluğunu kullanarak "en iyi" olanları seçersiniz.


Cevabınız için teşekkür ederim, STEPWISE araması devre dışı bırakıldığında auto.arima kullanıyorum ve bu şekilde min-max aralığı arasındaki tüm parametreleri araştıracağını düşünüyorum (Hyndman & Kandahar 2008 belgesini henüz okumadım)
Matteo De Felice

@Matteo De Felice: Mesele şu ki, bu parametreleri AIC'ye göre optimize ediyor. Çapraz doğrulama ile değerlendirebileceğiniz örnek dışı performanslarıyla bu parametreleri optimize etmeye değebilirdi. Ayrıca, diğer modelleri (ETS gibi) karşılaştırmak istiyorsanız, farklı model türleri (auto.arima ve ets gibi) arasında AIC'yi karşılaştıramayacağınız için örnek dışı bir performans metriğine ihtiyacınız olacaktır.
Zach

şu anda bir ızgara araması yaptım (kademeli = FALSE ile auto.arima kullanarak) ve sonra performanslarını değerlendirmek için en sık kullanılan modelleri denedim.
Matteo De Felice

@Matteo De Felice: Zaman serisi çapraz doğrulamayı uygulamakta sorun yaşıyorsanız, bu blog gönderisi yardımcı olabilir: robjhyndman.com/researchtips/tscvexample
Zach

ARIMA ve ETS modellerinin temelde farklı olmadığı belirtilmelidir. Aslında, doğrusal üstel yumuşatma modelleri ARIMA modellerinin özel durumlarıdır. Buraya bakın: otexts.org/fpp/8/10 .
Siğil
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.