Soru: Bir şeyden emin olmak istiyorum, zaman serileri ile k-fold cross-geçerlilik kullanımı basit mi, yoksa kullanmadan önce özel bir dikkat gösterilmesi gerekiyor mu?
Arkaplan: Her 5 dakikada bir veri örneği ile 6 yıllık bir zaman serisini (yarı markov zinciri ile) modelleyeceğim. Birkaç modeli karşılaştırmak için, verileri 6 yıl içinde ayırarak 6 kat çapraz doğrulama kullanıyorum, bu nedenle eğitim setlerim (parametreleri hesaplamak için) 5 yıl uzunluğunda ve test setlerinin uzunluğu 1 yıl. Zaman sırasını dikkate almıyorum, bu yüzden farklı setlerim:
- kat 1: eğitim [1 2 3 4 5], test [6]
- kat 2: eğitim [1 2 3 4 6], test [5]
- kat 3: eğitim [1 2 3 5 6], test [4]
- kat 4: eğitim [1 2 4 5 6], test [3]
- kat 5: eğitim [1 3 4 5 6], test [2]
- kat 6: eğitim [2 3 4 5 6], test [1].
Her yıl birbirinden bağımsız olduğu hipotezini yapıyorum. Bunu nasıl doğrulayabilirim? Zaman serileri ile k-kat çapraz doğrulama uygulanabilirliğini gösteren herhangi bir referans var mı?