Zaman serisi çapraz doğrulaması ile tahmin hatasını hesaplama


13

Bir zaman serisi için bir tahmin modelim var ve onun örnek dışı tahmin hatasını hesaplamak istiyorum. Şu anda takip ettiğim strateji, Rob Hyndman'ın blogunda (sayfanın altına yakın) önerilen stratejidir ( ve boyutunda bir eğitim seti varsayarak ).y1,,ynk

  1. Veri modeli monte ve izin aşağıdaki gözlem için tahmin olabilir.yt,,yt+k1y^t+k
  2. Tahmin hatasını .et=y^t+kyt+k
  3. için tekrarlayınt=1,,nk
  4. Ortalama kare hatasınıMSE=1nkt=1nket2

Sorum, örtüşen eğitim setlerim nedeniyle korelasyonlar hakkında ne kadar endişelenmem gerektiği. Özellikle, sadece bir sonraki değeri değil, bir sonraki değerlerini de tahmin etmek istediğimi varsayalım, böylece tahminlerim var ve hatalar ve tahmin hatalarının bir terim yapısını oluşturmak istiyorum.my^t+k,,y^t+k+m1et,1,,et,m

Her seferinde belirlenen eğitimin penceresini her seferinde 1 ileri alabilir miyim, yoksa ileri mi döndürmeliyim ? Tahmin ettiğim dizide önemli bir otokorelasyon varsa bu soruların cevapları nasıl değişir (muhtemelen uzun süreli bir süreçtir, yani otokorelasyon fonksiyonu katlanarak değil bir güç yasası olarak bozulur.)m

Burada bir açıklama ya da MSE etrafındaki güven aralıkları (veya diğer hata önlemleri) hakkında teorik sonuçlar bulabileceğim bir yere bağlantıyı takdir ediyorum.

Yanıtlar:


11

Çapraz doğrulama yerine maksimum entropi bootstrap kullanarak hataları tahmin etmekle daha fazla ilgilenebileceğiniz anlaşılıyor . Bu, verilerinizin çoklu önyüklemelerini oluşturmanıza olanak tanır; bu da, tahminleriniz için güven aralıklarını hesaplamak için istediğiniz kadar tren / test setine bölebilirsiniz.

Rob Hyndman'ın blogunda birkaç farklı "yuvarlama" ve tahmin yöntemi uyguladığı zaman serisi çapraz doğrulaması hakkında daha fazla tartışması var , ancak çoğunlukla uygulamaya odaklandı. Biraz alabilir blogumda daha ileri uygulamaları da. Belki de en basit yaklaşım, hatalarınızı tüm zaman pencerelerinde ortalamak ve bu nedenle hatalardaki potansiyel korelasyonları görmezden gelmek olacaktır.

Anlayabildiğim kadarıyla, zaman serisi verileri için çapraz geçerliliğin teorik durumu, genel çapraz geçerliliğin teorik durumunun biraz gerisindedir. Sezgisel olarak, ufuk arttıkça hatanın artmasını beklerim, bu da çeşitli tahmin ufuklarında ilişkili hatalar beklemeniz gerektiğini gösterir. Bu neden seni endişelendiriyor?

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.