Geçen ayki kayda göre satışları tahmin etmek için uygun bir zaman serisi modeli geliştirmek


12

Şu anda üst üste iki yıldır çevrimiçi bir işletme işletiyorum, bu yüzden yaklaşık iki yıldır aylık satış verilerim var. Her ay için işim kesinlikle mevsimsel salınımdan (Noel'de daha iyi performans gösterir, vb.) Ve muhtemelen farkında olmadığım diğer bazı faktörlerden etkilenir.

Gelecekteki satışları daha iyi tahmin etmek ve satış kampanyamın etkinliğini veya yeni rakiplerin etkisini ölçmek için, mevcut satış verilerimi geleceğe tahmin etmek için uygun bir zaman serisi modeli geliştirmek istiyorum. Bu, tahminimin sonucunu gerçek sonuçla karşılaştırdığımda, satış kampanyamın etkinliğini veya rakiplerin etkisini niceliksel olarak test edebilirim.

Sorum şu: 2 yıllık satış verilerine sahip olduğum göz önüne alındığında, bunun için tahmini bir zaman serisi modeli formüle edebileceğim yine de var mı?

Not: Kara kutu araçlarından ziyade arka plan kavramları ve teorileriyle ilgileniyorum. Araçlardan bahsetmişken, ben mathematica, matlab, R, Excel, Google E-Tablo .... var.


Hangi yazılımı kullanıyorsunuz?
Dimitriy V. Masterov

1
@ DimitriyV.Masterov, Matlab / R / Excel / Mathematica var ... Aslında gerçek kodun kendisini yazmaktan ziyade kavramlarla ilgileniyorum
Graviton

Yanıtlar:


14

Evet, bunu yapmanın yolları var. İnsanlar hayatlarını böyle yaparlar ;-)

Nedensel tahmin arıyorsunuz . Tahmin metodolojisi hakkında bilgi edinmek için tahmin üzerine bu ücretsiz çevrimiçi ders kitabına bakın .

Elinizde başa çıkmanız gereken iki önemli konu var: bir yandan mevsimsellik (veya daha genel olarak zaman serisi yapısı, muhtemelen otoregresyon ile) ve diğer yandan promosyonlar gibi nedensel etkiler. Yukarıdaki ders kitabında Bölüm 8 , ARIMA bağlamında zaman serileriyle, Bölüm 5 ise nedensel etkilerle ilgilidir.

Ne mutlu ki, ARIMAX (X "dış etkiler", yani dış etkilerle ARIMA) modelleri veya ARIMA hataları olan regresyonları hesaplayarak her iki sorunu da ele almak mümkündür. Fark için Rob Hyndman'ın "ARIMAX model karışması" başlıklı blog yayınına bakın . auto.arima()İşlev forecastR paketinde ARIMA hataları ile bir gerileme uyacaktır. Güçlü bir eğilim ve mevsimsellik ile standart bir veri kümesi alıp "promosyonlar" eklediğim bir örneği inceleyelim.

library(forecast)
AirPassengers # a built-in dataset
#      Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
# 1949 112 118 132 129 121 135 148 148 136 119 104 118
# 1950 115 126 141 135 125 149 170 170 158 133 114 140
# 1951 145 150 178 163 172 178 199 199 184 162 146 166
# 1952 171 180 193 181 183 218 230 242 209 191 172 194
# 1953 196 196 236 235 229 243 264 272 237 211 180 201
# 1954 204 188 235 227 234 264 302 293 259 229 203 229
# 1955 242 233 267 269 270 315 364 347 312 274 237 278
# 1956 284 277 317 313 318 374 413 405 355 306 271 306
# 1957 315 301 356 348 355 422 465 467 404 347 305 336
# 1958 340 318 362 348 363 435 491 505 404 359 310 337
# 1959 360 342 406 396 420 472 548 559 463 407 362 405
# 1960 417 391 419 461 472 535 622 606 508 461 390 432

set.seed(1) # for reproducibility
promos <- rep(0,length(AirPassengers))
promos[sample(seq_along(AirPassengers),10)] <- 1
promos.future <- c(0,1,0,0,1,0,0,1,0,0,1,0)
AP.with.promos <- AirPassengers
AP.with.promos[promos==1] <- AP.with.promos[promos==1]+120

model <- auto.arima(AP.with.promos,xreg=promos)
summary(model) # examine the model - you'll see the estimated promo coefficient
# Series: AP.with.promos 
# ARIMA(0,1,1)(0,1,0)[12]                    

# Coefficients:
#           ma1    promos
#       -0.3099  122.2599
# s.e.   0.0947    2.2999

# sigma^2 estimated as 151.2:  log likelihood=-457.4
# AIC=920.79   AICc=920.98   BIC=929.42

# Training set error measures:
#                     ME     RMSE     MAE        MPE     MAPE      MASE         ACF1
# Training set 0.2682805 11.12974 8.24397 0.06139784 2.867274 0.1860814 0.0008326436

fcast <- forecast(model,xreg=promos.future,h=length(promos.future))
fcast
#          Point Forecast    Lo 80    Hi 80    Lo 95    Hi 95
# Jan 1961       447.1516 431.3951 462.9081 423.0542 471.2490
# Feb 1961       543.4115 524.2670 562.5559 514.1326 572.6904
# Mar 1961       449.1516 427.1345 471.1687 415.4793 482.8239
# Apr 1961       491.1516 466.5956 515.7076 453.5964 528.7068
# May 1961       624.4115 597.5556 651.2674 583.3389 665.4841
# Jun 1961       565.1516 536.1777 594.1255 520.8399 609.4633
# Jul 1961       652.1516 621.2044 683.0988 604.8220 699.4812
# Aug 1961       758.4115 725.6095 791.2135 708.2452 808.5778
# Sep 1961       538.1516 503.5942 572.7090 485.3006 591.0026
# Oct 1961       491.1516 454.9237 527.3795 435.7459 546.5573
# Nov 1961       542.4115 504.5869 580.2361 484.5637 600.2593
# Dec 1961       462.1516 422.7950 501.5082 401.9608 522.3424
promos.ts <- ts(c(AP.with.promos,fcast$mean),
                  start=start(AirPassengers),frequency=frequency(AirPassengers))
promos.ts[c(promos,promos.future)==0] <- NA

plot(fcast)
points(promos.ts,pch=19,col="red")

Arimax

Kırmızı noktalar promosyonlardır. Varsayılan olarak, tahmin aralıkları gri olarak çizilir. Farklı efektlere sahip farklı promosyon türlerinizxreg varsa yapmanız gereken parametre aracılığıyla modelinize birden fazla regressör besleyebilirsiniz . Biraz deneyin.

Örneğin, haftalık olarak varsa, aylıklara göre daha ayrıntılı veriye bakmanızı öneririm. Özellikle de promosyonlarınız tam ay boyunca yayınlanmazsa. Bunu, özellikle belirli ürünleri tanıtıyorsanız veya tüm kategorilerde ürüne göre ayrı ayrı yapabilirsiniz.

Standart üç seviye, sezon ve trend bileşenlerine promosyon bileşenleri ekleyerek , Exponential Smoothing'e bakmak ve ihtiyaçlarınıza uyacak şekilde değiştirmek için koddan ziyade kavramlarla daha fazla ilgilendiğiniz düşünülürse bir alternatif olacaktır . Üstel Yumuşatma ile bir ARIMAX modelini maksimum tahmin etmeye çalışmaktan çok daha fazla şey yapabilirsiniz, ancak birden fazla promosyon türünüz varsa Smoothing biraz defter tutma kabusuna dönüşebilir.


1
Ortak değişkenli ARIMA modelleri kitabın 9. Bölümünde ele alınmaktadır: www.otexts.org/fpp/9/1
Rob Hyndman

Teşekkürler Rob. Gerçekten daha sık kitaptan
geçmem gerekiyor

Teşekkürler @StephanKolassa! bir yan soru, yukarıdaki yazıda bahsettiğiniz kitabı mobi veya epub formatında alabilir miyim?
Graviton

1
@Graviton: güzel soru. Yazarlara sormak en iyisi. Bunlardan biri yukarıda yorum yapan Rob Hyndman.
Stephan Kolassa

1
@Graviton. Üzerinde çalışıyorum. Bkz. Robjhyndman.com/hyndsight/fpp-amazon
Rob Hyndman

4

ilk olarak, oynamak için çok fazla veriniz yok, sadece 24 gözlem. Sizin durumunuzda, güvenilir bir şekilde tahmin etmek için zar zor birkaç parametreniz olduğu anlamına gelir. öngörmede en sistematik yol bir veri oluşturma süreci (DGP) bulmaktır. satışlarınız için gerçek sürecin ne olduğu hakkında bir varsayım yaparsınız ve ardından parametrelerini tahmin etmeye çalışırsınız.

AR (1) DGP: olan saf zaman serisi modelini , yani bu ayki satışlarınız geçen ayın ağırlıklı ortalama ortalaması ve sabittir. Zaten 3 parametreniz (iki katsayı ve bir hata varyansı) var, bu da parametre başına yaklaşık 8 gözlem anlamına geliyor - açıkça çok değil.xt=ϕxt1+c

Satışlarınız mevsimsel olduğundan, bu konuda bir şeyler yapmalıyız. bunun bir yolu çarpma mevsimselliğini eklemektir : gecikme operatörü gösteriminde veya genişletilmiş biçimde: . bu tahmin etmek için bir parametre daha ekler, böylece parametre başına 6 gözleme inersiniz - gerçek bir esnemex t = c + ϕ 1 x t - 1 + ϕ 12 x t - 12 - ϕ 1 ϕ 12 x r - 13(1L)(1L12)xt=cxt=c+ϕ1xt1+ϕ12xt12ϕ1ϕ12xr13

Matlab'da bu model şu şekilde belirtilmiştir arima('ARLags',1,'SARLags',12)

bu satışlarınızın sabit olduğunu, yani genellikle büyümediğini varsayar.

satışlarınızın arttığını düşünüyorsanız, iki seçeneğiniz vardır: rastgele yürüyüş (RW) ve bir zaman eğilimi.

içinde Matlab RW ile belirtilir arima('D',1,'SARLags',12)

açıkçası, bunlar sadece farklı DGP'lerin örnekleridir. ne yaparsanız yapın, tahmin edilecek parametre sayısını aklınızda bulundurun. 24 gözlem ile modeliniz çok basit olmalı, en fazla 4 parametre (varyanslar dahil) olmalıdır.


0

Yapmanız gerekenler İşte iki grafik yapın:

  • 24 ay boyunca Satış ve Süre
  • Satışlar - İkinci yılın ilk yılın üstüne çizildiği süre

Onlara bakmak. Özel promosyonların veya bilinen rekabetçi etkinliklerin tarihlerine açıklama ekleyin. "Aralık" genellikle oldukça belirgindir, ancak yardım etmek için bir not ekleyin.

Devam edin ve bir zaman serisi modeline uyun - herhangi bir model (yüzlerce). Model, bir sonraki dönem için (t + 1) kararınızdan biraz daha iyi bir tahmin verebilir. En azından kararınıza itiraz edecek. Bir sonraki dönemin (t + n, n> 1) ötesinde, herhangi bir zaman serisi modeli saçmalıktır. † Öyleyse satış kampanyalarının etkinliğini veya rakiplerin etkilerini nicel olarak değerlendirmeyi unutun. Gerçek satışları tahminlerle karşılaştırırsanız tahminlerin berbat olduğunu görürsünüz. Geleceği tahmin etmek zordur ve hiçbir yöntem bu temel gerçeği değiştirmez.

İki grafiğinizi daha kullanışlı bulacaksınız. Bunları bir süre çalışın, daha sonra zamanınızın geri kalanını satışları nasıl artıracağınıza dair fikirlerle geçirin - bu, zaman serisi modeline uymaya çalışan zamanınızın çok daha karlı bir kullanımı olacaktır.

Öncü göstergelere dayalı bir tahmin modeli oluşturabilirseniz daha fazla umudunuz vardır - yani, önceki aya ait konut satışları, mevcut aydaki pencere tonlarının satışını tahmin etmek için yararlı olabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.