Uğraştığım sorun zaman serisi değerlerini tahmin etmektir. Bir seferde bir zaman serisine bakıyorum ve örneğin girdi verilerinin% 15'ine dayanarak gelecekteki değerlerini tahmin etmek istiyorum. Şimdiye kadar iki modelle karşılaştım:
- LSTM (uzun kısa süreli hafıza; tekrarlayan sinir ağları sınıfı)
- ARİMA
İkisini de denedim ve bunlarla ilgili bazı makaleler okudum. Şimdi ikisini nasıl kıyaslayacağımı daha iyi anlamaya çalışıyorum. Şimdiye kadar ne buldum:
- Büyük miktarda veri ile uğraşıyorsak ve yeterli eğitim verisi mevcutsa, LSTM daha iyi çalışır, ARIMA daha küçük veri setleri için daha iyidir (bu doğru mu?)
- ARIMA
(p,q,d)
, verilere göre hesaplanması gereken bir dizi parametreye ihtiyaç duyarken, LSTM bu gibi parametrelerin ayarlanmasını gerektirmez. Ancak, LSTM için ayarlamamız gereken bazı hiperparametreler var. - EDIT: Buradaki harika bir makaleyi okurken dikkatimi çeken ikisi arasındaki önemli farklardan biri, ARIMA'nın sadece durağan zaman serilerinde (mevsimsellik, trend vb. Olmadığı durumlarda) iyi bir performans sergileyebilmesi ve ARIMA kullanmak istiyorum
Yukarıda belirtilen özelliklerden başka, en iyi modeli seçmemde bana yardımcı olabilecek başka noktalar veya gerçekleri bulamadım. Birisi makaleleri, makaleleri veya başka şeyleri bulmama yardım edebilirse gerçekten minnettar olurum (şimdiye kadar hiç şansım yoktu, burada ve oradaki bazı genel görüşler ve deneylere dayanan hiçbir şey yok.)
Başlangıçta akış verileriyle uğraştığımdan bahsetmeliyim, ancak şu an için maksimum 20k veri noktası boyutunda 50 veri kümesi içeren NAB veri kümeleri kullanıyorum .