İlk olarak, IrishStat tarafından özetlenen yaklaşımın, herhangi bir genel model setine değil, ARIMA modellerine özgü olduğunu belirtmeniz gerekir.
"Zaman serisi tahminini otomatikleştirmek mümkün mü?"
Evet öyle. Talep tahmini alanımda, çoğu ticari tahmin paketi bunu yapıyor. Birçok açık kaynak paketi de bunu yapar, en önemlisi, R'deki açık kaynaklı Tahmin paketinden Rob Hyndman'ın auto.arima () (otomatik ARIMA tahmini) ve ETS () (otomatik üstel yumuşatma tahmini) işlevleri , bu iki işlevle ilgili ayrıntılar için buraya bakın . Benim deneyimime göre R paketleri kadar olgun olmasa da, Pyramid adlı auto.arima'nın bir Python uygulaması da var .
Hem bahsettiğim ticari ürünler hem de bahsettiğim açık kaynak paketleri, en iyi tahmini seçmek için bilgi ölçütlerini kullanma fikrine dayanarak çalışır: Bir grup model takarsınız ve daha sonra en düşük AIC, BIC, AICc, vb. (tipik olarak bu örnek dışı doğrulama yerine yapılır).
Ancak büyük bir uyarı var: tüm bu yöntemler tek bir model ailesi içinde çalışıyor . Bir dizi ARIMA modeli arasından mümkün olan en iyi modeli veya bir dizi üstel yumuşatma modeli arasından mümkün olan en iyi modeli seçerler.
Farklı model aileleri arasından seçim yapmak istiyorsanız, örneğin ARIMA, Üstel yumuşatma ve Theta yönteminden en iyi modeli seçmek istiyorsanız, bunu yapmak çok daha zordur. Teorik olarak, bunu tek bir model ailesi içinde yaptığınız şekilde yapabilirsiniz, yani bilgi ölçütlerini kullanarak. Bununla birlikte, pratikte, AIC veya BIC'yi dikkate alınan tüm modeller için tam olarak aynı şekilde hesaplamanız gerekir ve bu önemli bir sorundur. Bilgi dizileri yerine zaman serisi çapraz doğrulaması veya örnek doğrulamasının kullanılması daha iyi olabilir , ancak bu çok daha hesaplama açısından yoğun (ve kodlama sıkıcı) olacaktır.
Facebook'un Peygamber paketi de Genel Katkı Modellerine dayalı tahmin üretimini otomatikleştirir . Ayrıntılar için buraya bakın . Ancak Peygamber, birçok parametreye sahip çok esnek bir model de olsa, sadece tek bir modele uyar. Peygamber'in örtülü varsayımı, bir GAM'ın teorik olarak doğrulanamayabilecek, ancak gerçek dünya senaryoları için çok pragmatik ve yararlı olabilecek "hepsini yöneten tek model" olduğudur.
Yukarıda belirtilen yöntemlerin tümü için geçerli olan başka bir uyarı: Muhtemelen otomatik zaman serisi tahmini yapmak istiyorsunuz, çünkü birden fazla zaman serisini tahmin etmek istiyorsunuz, manuel olarak analiz etmek için çok fazla. Aksi takdirde kendi deneylerinizi yapabilir ve kendi başınıza en iyi modeli bulabilirsiniz. Otomatik tahmin yaklaşımının asla her zaman serisi için en iyi modeli bulamayacağını aklınızda bulundurmanız gerekir - tüm zaman serilerinde ortalama olarak oldukça iyi bir model verecektir, ancak yine de bazılarının bu zaman serilerinin otomatik yöntemle seçilen modellerden daha iyi modelleri olacaktır. Bu gönderiye bakınbunun bir örneği. Basitçe ifade etmek gerekirse, otomatik öngörme ile gidecekseniz, her bir zaman serisi için mümkün olan en iyi tahminler yerine "yeterince iyi" tahminleri tolere etmeniz gerekir.