Ben oluşturulan 3 ay veri (her satır karşılık gelen her satır) ve aynı için çok değişkenli bir zaman serisi analizi yapmak istiyorum:
kullanılabilir sütunlar -
Date Capacity_booked Total_Bookings Total_Searches %Variation
Her Tarih veri kümesine 1 giriş ve 3 aylık veriye sahiptir ve diğer değişkenleri de tahmin etmek için çok değişkenli bir zaman serisi modeline uymak istiyorum.
Şimdiye kadar bu benim girişimimdi ve ben de makaleleri okuyarak aynı şeyi yapmaya çalıştım.
Ben de aynısını yaptım -
df['Date'] = pd.to_datetime(Date , format = '%d/%m/%Y')
data = df.drop(['Date'], axis=1)
data.index = df.Date
from statsmodels.tsa.vector_ar.vecm import coint_johansen
johan_test_temp = data
coint_johansen(johan_test_temp,-1,1).eig
#creating the train and validation set
train = data[:int(0.8*(len(data)))]
valid = data[int(0.8*(len(data))):]
freq=train.index.inferred_freq
from statsmodels.tsa.vector_ar.var_model import VAR
model = VAR(endog=train,freq=train.index.inferred_freq)
model_fit = model.fit()
# make prediction on validation
prediction = model_fit.forecast(model_fit.data, steps=len(valid))
cols = data.columns
pred = pd.DataFrame(index=range(0,len(prediction)),columns=[cols])
for j in range(0,4):
for i in range(0, len(prediction)):
pred.iloc[i][j] = prediction[i][j]
Bir doğrulama kümem ve tahmin kümem var. Ancak tahminler beklenenden çok daha kötü.
Veri kümesinin grafikleri -% 1. Varyasyon
Aldığım çıktı -
Tahmin veri çerçevesi -
Doğrulama Veri Çerçevesi -
Gördüğünüz gibi tahminler beklenenin çok dışında. Herkes doğruluğunu artırmak için bir yol tavsiye edebilir. Ayrıca, modeli tüm verilere sığdırır ve ardından tahminleri yazdırırsam, yeni ayın başladığını ve dolayısıyla bu şekilde tahmin etmeyi dikkate almazsam. Bu buraya nasıl dahil edilebilir. herhangi bir yardım takdir.
DÜZENLE
Veri kümesine bağlantı - Veri kümesi
Teşekkürler