Saniye cinsinden “Frekans” değeri R cinsinden verilerdir.


28

Tahmin için R (3.1.1) ve ARIMA modellerini kullanıyorum. Zaman serisi verilerini kullanıyorsanız , ts()fonksiyonda atanan "frekans" parametresinin ne olması gerektiğini bilmek isterim :

  1. dakikalarla ayrılır ve 180 güne (1440 dakika / gün) yayılır
  2. saniye ile ayrılır ve 180 güne (86.400 saniye / gün) yayılır.

Eğer tanımı doğru hatırlıyorsam, R cinsinden "frekans", "mevsim" başına gözlem sayısıdır.

Soru bölüm 1:

Benim durumumdaki "mevsim" nedir?

Eğer mevsim "gün" ise, o zaman dakika için "frekans" = 1440 ve saniye için 86.400 nedir?

Soru bölüm 2:

“Frekans”, elde etmeye / tahmin etmeye çalıştığım şeye de bağlı olabilir mi? örneğin, benim durumumda, çok kısa vadeli bir tahmin yapmak istiyorum. Her seferinde 10 dakikalık bir adım önde. O zaman sezonu bir gün yerine bir saat olarak düşünmek mümkün müdür? Bu durumda frekans = dakika için 60, frekans = saniye için 3600?

Örneğin dakika verileri için frekans = 60 kullanmaya çalıştım ve frekans = 1440'a kıyasla daha iyi sonuçlar elde ettim ( fourieraşağıdaki bağlantıyı Hyndman'a bakın) http://robjhyndman.com/hyndsight/forecasting-weekly-data/

(Karşılaştırma, tahmin doğruluğunun ölçülmesi için MAPE kullanılarak yapılmıştır)

Sonuçların keyfi olması durumunda ve frekans değiştirilemez. Verilerimde freq = 60 kullanmanın yorumlanması gerçekte ne olurdu?

Ayrıca verilerimin her saat ve iki saatte bir mevsimsellik içerdiğini belirtmeye değer olduğunu düşünüyorum (ham verileri ve Otokorelasyon işlevini gözlemleyerek)

Yanıtlar:


38

"Frekans", "döngü" başına gözlem sayısıdır (normalde bir yıl, ancak bazen bir hafta, bir gün, bir saat, vb.). Bu, fizikteki veya "dönem" in döngünün uzunluğu olduğu ve "frekans" da dönemin tersi olduğu Fourier analizindeki frekans tanımının zıttıdır. ts()R fonksiyonunu kullanırken aşağıdaki seçenekler kullanılmalıdır.

Data      frequency
Annual     1
Quarterly  4
Monthly   12
Weekly    52

Aslında yılda 52 hafta yok, ancak ortalama 365.25 / 7 = 52.18. Ancak, tsnesneleri kullanan çoğu fonksiyon tamsayı frekansı gerektirir.

Gözlemlerin sıklığı bir haftadan daha küçük olduğunda, genellikle frekansı kullanmanın birden fazla yolu vardır. Örneğin, her dakika gözlemlenen veriler saatlik bir mevsimsellik (sıklık = 60), günlük bir mevsimsellik (sıklık = 24x60 = 1440), haftalık bir mevsimsellik (sıklık = 24x60x7 = 10080) ve yıllık bir mevsimsellik içerebilir (sıklık = 24x60x365.25 = 525.960). Bir tsnesneyi kullanmak istiyorsanız , hangisinin en önemli olduğuna karar vermeniz gerekir.

Bir alternatif, birden fazla mevsimsellik zaman serisini ele mstsalan ( forecastpakette tanımlanan) bir nesneyi kullanmaktır . Ardından alakalı olabilecek tüm frekansları belirleyebilirsiniz. Ayrıca tamsayılı olmayan frekansları kaldırabilecek kadar esnektir.

Mutlaka tüm bu frekansları dahil etmek istemeyeceksiniz - sadece verilerde bulunabilecek olanları. Sadece 180 günlük bir veriye sahip olduğunuzdan, muhtemelen yıllık mevsimsellikten yoksun olabilirsiniz. Veriler doğal bir fenomenin ölçümleriyse (örn. Sıcaklık) haftalık mevsimselliği görmezden gelebilirsiniz.

Birden fazla mevsimsellik ile, bir regresyonda veya ARIMA modelinde bir TBATS modelini veya Fourier terimlerini kullanabilirsiniz. fourierTahmini paketinden işlevi idare edecek mstsnesneler.


Bu cevabın bir varyasyonu blogumda
Rob Hyndman

Prof. Hyndman, göreviniz için çok teşekkür ederim! Sorularıma cevap verdiğim için memnunum.
Apython
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.