@Irishstat, söyleyeceklerimi neredeyse kapsıyordu, ancak bu verileri zaman serisi regresyonu ve OLS regresyonu ile modelleme konusundaki kendi kişisel deneyimime cevap verirdim.
Günlük bir veri ise o zaman aşağıdakileri yaparım:
Farklı mevsimsellik için kukla değişken oluşturun:
- Haftanın gün mevsimselliğini yakalamak için 6 yapay değişken oluşturun.
- Ayın gün mevsimselliğini yakalamak için 30 kukla değişken oluşturun
- Yılın ayını yakalamak için 11 yapay değişken oluşturun.
Trend değişkenleri için kukla değişken oluşturun:
Zaman serisi doğrusal eğilim gösteriyorsa, zaman eğilimi değişkeni ekleyin.
Zaman serisi doğrusal olmayan eğilim gösteriyorsa, ikinci dereceden / kübik / günlük gibi doğrusal olmayan bir zaman eğilimi değişkeni ekleyin
Bağımsız değişkenler ekleyin Değişkenler
Bu bir zaman serisi verisidir, bu nedenle bağımsız değişkenlerin kurşun ve gecikme etkileri konusunda dikkatli olunmalıdır. Örneğin, örnekte, fiyat noktası promosyon bayrağından bahsediyorsunuz, yanıtınız üzerinde hemen bir etkisi olmayabilir, yani gecikme ve çürüme / kalıcı bir etki olabilir. Örneğin, bugün bir promosyon gerçekleştirirseniz, bugün satışlarda bir artış olabilir, ancak birkaç gün sonra promosyonun etkisi azalır. Bunu çoklu regresyon kullanarak modellemenin kolay bir yolu yoktur, parsimonoius olan ve her türlü kurşun ve gecikme efektlerini işleyebilen transfer fonksiyonu modellemesini kullanmak istersiniz. Daha önce yayınladığım (müdahale durumunuzda) ve ani bir artış olan ve ardından azalan bir etki olan bu örneğe bakın . Eğer söylediyseniz,olası satış ve gecikme etkisi hakkında önceden bilgi sahibi olmak, fiyat noktasından önce ve sonra durum kukla değişkenler ve (evet / hayır) promosyon değişikliğinde ek değişkenler oluşturun.
Ayrıca, hareketli Holidays göstergesi değişkenlerini de eklemeniz gerekir, örneğin Irishstat'ın Tatiller'i hareket ettiren Paskalya / Şükran Günü (ABD'de) eklemek istediğinizi belirtti. Sabit tarihler olan tatiller, mevsimselliği yakalamak için kukla kodlama şeması kullanıyorsanız otomatik olarak halledilir.
Ek olarak, katkı / darbe (bir defalık olay) veya seviye kaydırma (kalıcı kaydırma) gibi aykırı değerleri tanımlamanız ve bunları regresör olarak eklemeniz gerekir. Zaman serisi verileri için çoklu regresyonda aykırı değerleri belirlemek neredeyse imkansızdır; Tsay prosedürü veya Chen ve Liu'nun AUTOBOX, SPSS, SAS veya R'deki paket gibi yazılımlara dahil edilen prosedür gibi zaman serisi aykırı tespit yöntemlerine ihtiyacınız olacaktır tsoutlier
.
Potansiyel Sorunlar:
OLS çoklu regresyon kullanarak zaman serisi verilerini modellerseniz karşılaşacağınız sorunlar aşağıdadır.
- Hatalar otomatik olarak ilişkilendirilebilir. Bu güzel web sitesine ve bu sorunu açıklayan bu web sitesine bakın . Bundan kaçınmanın bir yolu, OLS çoklu regresyonuna karşı Genelleştirilmiş en küçük kareler (GLS) veya ARIMAX yaklaşımını kullanmaktır, burada otomatik korelasyon için düzeltebilirsiniz.
- OLS modeli parsimonoius olmayacak. You have mevsimsellik için kukla değişkenler.6 + 30 + 11 = 47
- Kukla değişkenler kullanarak, mevsimselliğinizin deterministik olduğunu, yani zamanla değişmediğini varsayıyorsunuz. Sadece 3 yıllık veriye sahip olduğunuz için endişelenmeyeceğim, ancak yine de seriyi çizmek ve mevsimselliğin değişip değişmediğini görmek önemlidir.
Ve çoklu regresyon kullanmanın daha birçok dezavantajı var. Tahmin sizin için daha önemliyse, en az 6 aylık veri tutar ve çoklu regresyonunuzun tahmin yeteneğini test ederdim. Eğer asıl amacınız bağımsız değişkenler arasındaki korelasyonu açıklamaksa, çoklu regresyon kullanarak temkinli olurdum, bunun yerine ARIMAX / GLS gibi bir zaman serisi yaklaşımı kullanırdım.
Eğer ilgileniyorsanız, transfer fonksiyonu ve dinamik regresyon modellemesi için Pankratz'ın mükemmel metnine başvurabilirsiniz . Genel zaman serileri tahmini için lütfen Makridakis ve ark . Ayrıca, regresyon ve zaman serisine dayalı tahmin için iyi bir referans metni Diebold olacaktır .