Pastaneden tarihi satış verilerim var (günlük, 3 yıldan fazla). Şimdi gelecekteki satışları tahmin etmek için bir model oluşturmak istiyorum (hafta içi, hava değişkenleri vb. Özellikleri kullanarak).
Modelleri yerleştirmek ve değerlendirmek için veri setini nasıl bölmeliyim?
- Kronolojik bir tren / validasyon / test bölümü olması gerekiyor mu?
- Daha sonra hiperparametreyi tren ve validasyon seti ile ayarlayabilir miyim?
- (İç içe geçmiş) çapraz doğrulama, zaman serisi sorunu için kötü bir strateji midir?
EDIT
@ ene100 tarafından önerilen URL'yi takip ettikten sonra karşılaştığım bazı bağlantılar:
- Rob Hyndman teoride ve pratikte "haddeleme tahmini orijini" ni tarif ediyor (R kodu ile)
- Haddeleme öngörme orijini için diğer terimler "ileriye yönelik optimizasyondur" ( burada veya burada ), "yuvarlanma ufku" veya "hareketli menşe" dir
- Bu tekniklerin yakın gelecekte scikit-learning'e entegre olmayacağı görülüyor, çünkü “bu tekniklerin talebi ve seminalitesi belirsiz” ( burada belirtiliyor ).
Ve bu , zaman serisi çapraz doğrulama için başka bir öneri.