Günlük veriler için çoklu regresyonda mevsimsellik yakalamak


13

Oldukça mevsimsel bir ürün için günlük satış verilerim var. Regresyon modelinde mevsimsellik yakalamak istiyorum. Üç aylık veya aylık verileriniz varsa, bu durumda sırasıyla 3 ve 11 kukla değişken oluşturabileceğinizi okudum - ancak günlük verilerle ilgilenebilir miyim?

Üç yıllık günlük verilerim var. Bağımsız değişkenler fiyat noktası, promosyon bayrağı (evet / hayır) ve sıcaklıktır. Bağımlı değişken, o ürünün satışlarıdır. Çoklu regresyon modeli kullandığım için bir zaman serisi modeli aramıyorum.


Ne kadar veri var? Kaç yıl değerinde? Sıcaklık gibi bir şeyle ilgili verileriniz var mı? Modelinizin geri kalanı nasıl? DV ve IV'leriniz nedir?
Peter Flom - Monica'yı eski durumuna döndürün

Peter Flom'un sorduğuna ek olarak, verilerinizi tek değişkenli zaman serileri mi yoksa çok değişkenli zaman serileri olarak mı modelliyorsunuz? Çok değişkenli ise, başka değişkenleriniz var mı? Bu değişken mevsimsel davranış sergiliyor mu? öyleyse kukla değişken eklemek gereksizdir. Bu ek bilgileri verebilir misiniz?
tahminci

Sorumu düzenledim. Lütfen herhangi bir çözüm sağlayabilir misiniz? Teşekkürler
Arushi


@IrishStat ile tamamen katılıyorum, zaman serisi modellerini, çok mevsimselliği yakalayan oldukça iyi bir modeli görmezden gelmeyeceğiz.Çok mevsimselliği idare etme kabiliyetine sahip üstel yumuşatma durum uzay modelini kontrol etmenizi öneririm, trend, eşzamanlı olarak. sadece R.you içindeits tahmin () paketini kullanabilirsiniz.
Karthi V

Yanıtlar:


10

@Irishstat, söyleyeceklerimi neredeyse kapsıyordu, ancak bu verileri zaman serisi regresyonu ve OLS regresyonu ile modelleme konusundaki kendi kişisel deneyimime cevap verirdim.

Günlük bir veri ise o zaman aşağıdakileri yaparım:

Farklı mevsimsellik için kukla değişken oluşturun:

  • Haftanın gün mevsimselliğini yakalamak için 6 yapay değişken oluşturun.
  • Ayın gün mevsimselliğini yakalamak için 30 kukla değişken oluşturun
  • Yılın ayını yakalamak için 11 yapay değişken oluşturun.

Trend değişkenleri için kukla değişken oluşturun:

  • Zaman serisi doğrusal eğilim gösteriyorsa, zaman eğilimi değişkeni ekleyin.

  • Zaman serisi doğrusal olmayan eğilim gösteriyorsa, ikinci dereceden / kübik / günlük gibi doğrusal olmayan bir zaman eğilimi değişkeni ekleyin

Bağımsız değişkenler ekleyin Değişkenler

  • Bu bir zaman serisi verisidir, bu nedenle bağımsız değişkenlerin kurşun ve gecikme etkileri konusunda dikkatli olunmalıdır. Örneğin, örnekte, fiyat noktası promosyon bayrağından bahsediyorsunuz, yanıtınız üzerinde hemen bir etkisi olmayabilir, yani gecikme ve çürüme / kalıcı bir etki olabilir. Örneğin, bugün bir promosyon gerçekleştirirseniz, bugün satışlarda bir artış olabilir, ancak birkaç gün sonra promosyonun etkisi azalır. Bunu çoklu regresyon kullanarak modellemenin kolay bir yolu yoktur, parsimonoius olan ve her türlü kurşun ve gecikme efektlerini işleyebilen transfer fonksiyonu modellemesini kullanmak istersiniz. Daha önce yayınladığım (müdahale durumunuzda) ve ani bir artış olan ve ardından azalan bir etki olan bu örneğe bakın . Eğer söylediyseniz,olası satış ve gecikme etkisi hakkında önceden bilgi sahibi olmak, fiyat noktasından önce ve sonra durum kukla değişkenler ve (evet / hayır) promosyon değişikliğinde ek değişkenler oluşturun.

  • Ayrıca, hareketli Holidays göstergesi değişkenlerini de eklemeniz gerekir, örneğin Irishstat'ın Tatiller'i hareket ettiren Paskalya / Şükran Günü (ABD'de) eklemek istediğinizi belirtti. Sabit tarihler olan tatiller, mevsimselliği yakalamak için kukla kodlama şeması kullanıyorsanız otomatik olarak halledilir.

  • Ek olarak, katkı / darbe (bir defalık olay) veya seviye kaydırma (kalıcı kaydırma) gibi aykırı değerleri tanımlamanız ve bunları regresör olarak eklemeniz gerekir. Zaman serisi verileri için çoklu regresyonda aykırı değerleri belirlemek neredeyse imkansızdır; Tsay prosedürü veya Chen ve Liu'nun AUTOBOX, SPSS, SAS veya R'deki paket gibi yazılımlara dahil edilen prosedür gibi zaman serisi aykırı tespit yöntemlerine ihtiyacınız olacaktır tsoutlier.

Potansiyel Sorunlar:

OLS çoklu regresyon kullanarak zaman serisi verilerini modellerseniz karşılaşacağınız sorunlar aşağıdadır.

  • Hatalar otomatik olarak ilişkilendirilebilir. Bu güzel web sitesine ve bu sorunu açıklayan bu web sitesine bakın . Bundan kaçınmanın bir yolu, OLS çoklu regresyonuna karşı Genelleştirilmiş en küçük kareler (GLS) veya ARIMAX yaklaşımını kullanmaktır, burada otomatik korelasyon için düzeltebilirsiniz.
  • OLS modeli parsimonoius olmayacak. You have mevsimsellik için kukla değişkenler.6+30+11=47
  • Kukla değişkenler kullanarak, mevsimselliğinizin deterministik olduğunu, yani zamanla değişmediğini varsayıyorsunuz. Sadece 3 yıllık veriye sahip olduğunuz için endişelenmeyeceğim, ancak yine de seriyi çizmek ve mevsimselliğin değişip değişmediğini görmek önemlidir.

Ve çoklu regresyon kullanmanın daha birçok dezavantajı var. Tahmin sizin için daha önemliyse, en az 6 aylık veri tutar ve çoklu regresyonunuzun tahmin yeteneğini test ederdim. Eğer asıl amacınız bağımsız değişkenler arasındaki korelasyonu açıklamaksa, çoklu regresyon kullanarak temkinli olurdum, bunun yerine ARIMAX / GLS gibi bir zaman serisi yaklaşımı kullanırdım.

Eğer ilgileniyorsanız, transfer fonksiyonu ve dinamik regresyon modellemesi için Pankratz'ın mükemmel metnine başvurabilirsiniz . Genel zaman serileri tahmini için lütfen Makridakis ve ark . Ayrıca, regresyon ve zaman serisine dayalı tahmin için iyi bir referans metni Diebold olacaktır .


Çok güzel bir özet ANCAK, çok önemli bulduğum olası hafta sonu etkilerine ek olarak, ayın haftasını ve ayın belirli günlerini de göz ardı ettiğinizi eklemek isterim. Ayrıca olay öncesi ve olay sonrası etkileri göz ardı edilmemelidir. Paskalya ve diğer büyük tatil / etkinliklerin etrafındaki aktiviteyi göz önünde bulundurun.LED spesifikasyonunun dahil edilmesini gerektiren bireysel bir yanıt deseni vardır. Ayrıca, parametrelerin zaman içinde değişebileceğini ve sıklıkla değişebileceğini ve parametrelerin sabit olduğu varsayımını doğrulaması gerektiğini unutmayın.
IrishStat

Teşekkürler @Irishstat. Haklısın. Hareketli Tatiller ve onların kurşun ve gecikme etkilerini unuttum.
tahminci

2

İhtiyacınız olan şey günlük etkileri, haftalık etkileri, aylık etkileri, ayın haftası etkileri, ayın etkileri, tatilin kurşun ve gecikme etkilerini, belirtilmemiş ancak ampirik olarak tanımlanabilir seviye / adım değişimlerini, yerel zaman trendleri, ARIMA yapısını dahil ederken ve muhtemelen zaman içinde parametreler ve hata varyansı değişiklikleriyle uğraşırken mevsimsel darbelerde ve darbelerde değişiklikler. Buna Aktarım İşlevi denir ve Çoklu Doğrusal Regresyon olarak kolayca yeniden yazılabilir (ANCAK DEĞİLDİR).

Spesifik olarak günlük bir gösterge 6 öngörücü alacaktır. Genel olarak ne tür bir öngörücüye ihtiyaç duyulduğunu dikkatli bir şekilde düzenlemek (tanımlamak) gerekir. Ellerinizde çok zamanınız varsa, bahsettiğim bazı yapıları deneyebilirsiniz. Alternatif olarak, probleminizi ömür boyu çözebilmeniz için bazı gelişmiş yazılımlara / danışmanlığa ihtiyacınız olabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.