Bir yan hobi olarak, zaman serilerini tahmin ediyorum (özellikle R kullanarak).
Verilerim için, günde yaklaşık 4 yıl öncesine kadar her gün ziyaretim var. Bu verilerde bazı farklı modeller vardır:
- Pazartesi-Cum çok ziyaret (Pazartesi / Sal en yüksek), ancak Sat-Sun önemli ölçüde daha az ziyaret var.
- Yılın belirli zamanlarında düşüş (yani ABD Tatillerinde daha az ziyaret, yazlar daha az büyüme gösterir)
- Yıldan yıla önemli büyüme
Bu verilerle gelecek bir yılı tahmin edebilmek ve aynı zamanda mevsimsellikten aya göre büyümeye sahip olmak için kullanmak iyi olurdu. Beni aylık bir görüşle fırlatan ana şey:
- Bazı aylar diğer aylara göre daha fazla Pzt / Sal olur (ve bu yıllar içinde tutarlı değildir). Bu nedenle hafta içi günlerden daha fazla olan bir ayın buna göre ayarlanması gerekir.
Hafta numaralandırma sistemleri yıla bağlı olarak 52-53 arasında değiştiği için haftaları keşfetmek de zor görünüyor ve öyle görünmüyor ts
.
Ayın hafta içi günleri için ortalama almayı düşünüyorum, ancak ortaya çıkan birim biraz garip (Ort. Hafta içi Ziyaretlerde Büyüme) ve bu geçerli veriyi düşürüyor olacak.
Bu tür verilerin zaman serilerinde yaygın olacağını düşünüyorum (örneğin ofis binasında elektrik kullanımı böyle bir şey olabilir), herkesin özellikle R'de nasıl modelleneceği konusunda herhangi bir tavsiyesi var mı?
Çalıştığım veriler oldukça basit, şöyle başlıyor:
[,1]
2008-10-05 17607
2008-10-06 36368
2008-10-07 40250
2008-10-08 39631
2008-10-09 40870
2008-10-10 35706
2008-10-11 18245
2008-10-12 23528
2008-10-13 48077
2008-10-14 48500
2008-10-15 49017
2008-10-16 50733
2008-10-17 46909
2008-10-18 22467
ve şu ana kadar devam ediyor, genel bir büyüme trendi ile, ABD tatil haftalarında bazı düşüşler ve büyüme genellikle yaz aylarında yavaşlıyor.
ts
(ve hatta msts
) bir yılın "doğal" dönemi ile bir haftanın örnekleme dönemine uymuyor (Takvimler gerçekten sanmıyorum). Ya da, bu işi nasıl yapacağımı anlamıyorum ...