Bence bu iyi bir soru ve bir cevabı hak ediyor. Sağlanan bağlantı, bazı ev yapımı yöntemlerin Box-Jenkins'e göre zaman serisi analizi yapmanın daha iyi bir yolu olduğunu iddia eden bir psikolog tarafından yazılmıştır. Umarım bir cevap girişimim zaman serileri hakkında daha bilgili olanları katkıda bulunmaya teşvik eder.
Tanıtımından itibaren, Darlington sadece bir AR modelini en küçük karelerle uydurma yaklaşımını savunuyor gibi görünüyor. Yani,
zaman serisine istiyorsanız, serideki serisine gecikme , gecikme ve böylece lag için yukarı , sıradan bir çoklu regresyon kullanılarak. Buna kesinlikle izin verilir; R'de, fonksiyonda bir seçenek bile var . Test ettim ve R'ye bir AR modeli takmak için varsayılan yönteme benzer cevaplar verme eğiliminde.
zt=α1zt−1+⋯+αkzt−k+εt
ztzt12kar
O da gerileyen savunan gibi şeyler üzerinde veya yetkileri eğilimleri bulmak için. Yine, bu kesinlikle iyi. Birçok zaman serisi kitabı bunu tartışır, örneğin Shumway-Stoffer ve Cowpertwait-Metcalfe. Tipik olarak, bir zaman serisi analizi aşağıdaki satırlar boyunca devam edebilir: bir eğilim bulursunuz, kaldırırsınız, ardından kalanlara bir model yerleştirirsiniz.zttt
Ama aynı zamanda aşırı uydurmayı savunuyor ve daha sonra, takılan seriler ve veriler arasındaki ortalama kare hatasının azalmasını, yönteminin daha iyi olduğuna dair kanıt olarak kullanıyor gibi görünüyor. Örneğin:
Korelogramların artık eskimiş olduğunu hissediyorum. Birincil amaçları, çalışanların hangi modellerin verilere en uygun olacağını tahmin etmelerini sağlamaktı, ancak modern bilgisayarların hızı (en azından zaman serisi model montajında değilse regresyonda) bir işçinin birkaç modele uymasını ve tam olarak nasıl her biri ortalama kare hatası ile ölçüldüğü gibi uyar. [İki yöntem bu probleme eşit derecede duyarlı olduğu için, şans eseri kapitalizasyon konusu bu seçenekle ilgili değildir.]
Bu iyi bir fikir değildir, çünkü bir modelin testinin mevcut verilere ne kadar iyi uyduğunu değil, ne kadar iyi tahmin edebileceği varsayılır. Üç örneğinde, uyumun kalitesi ölçütü olarak "düzeltilmiş kök ortalama karesi hatası" nı kullanır. Tabii ki, bir modelin aşırı uydurulması, örneklemede hata tahminini daha küçük hale getirecektir, bu nedenle modellerinin "daha iyi" olduğu iddiaları daha küçük RMSE'ye sahip oldukları için yanlıştır.
Özetle, bir modelin ne kadar iyi olduğunu değerlendirmek için yanlış kriteri kullandığından, regresyon ve ARIMA hakkında yanlış sonuçlara varır. Bahse girerim, eğer modellerin tahmin yeteneğini test etmiş olsaydı, ARIMA en üste çıkardı. Belki birisi burada bahsettiği kitaplara erişimi varsa deneyebilir .
[Ek: regresyon fikri hakkında daha fazla bilgi için, ARIMA en popüler olmadan önce yazılmış eski zaman serisi kitaplarına göz atmak isteyebilirsiniz. Örneğin, Kendall, Time-Series , 1973, Bölüm 11, bu yöntem ve ARIMA ile karşılaştırmalar hakkında bütün bir bölüme sahiptir.]