Bir ürünün toplam satışını tahmin etmek için bir model geliştirmeye çalışıyorum. Yaklaşık bir buçuk yıllık rezervasyon verilerim var, bu yüzden standart bir zaman serisi analizi yapabilirim. Ancak, kapalı ya da kayıp olan her 'fırsat' (potansiyel satış) hakkında da çok fazla veri var. 'Fırsatlar' bir boru hattının kapanana veya kaybedilene kadar aşamalarında ilerler; ayrıca potansiyel alıcı, satış elemanı, etkileşim geçmişi, endüstri, tahmini rezervasyon boyutu vb. ile ilgili veriler de vardır.
Amacım sonuçta toplam rezervasyonları tahmin etmektir, ancak rezervasyonların gerçek 'kök nedeni' olan mevcut 'fırsatlar' hakkındaki tüm bu bilgileri açıklamak istiyorum.
Bir fikrim var iki farklı modeli seri olarak aşağıdaki gibi kullanmak:
Bireysel bir 'fırsattan' kaynaklanan rezervasyonları tahmin eden bir model oluşturmak için tarihsel 'fırsatları' kullanın (muhtemelen bu adım için rastgele ormanlar hatta düz eski doğrusal regresyon kullanırdım).
Şu anda boru hattında bulunan tüm 'fırsatların' tahmini rezervasyonlarını tahmin etmek için 1'den modeli kullanın, ardından bu tahminleri her 'fırsatın' oluşturulduğu aya göre toplayın.
1,5 yıllık aylık geçmiş zaman serisi verilerini VE o ayda yaratılan tüm 'fırsatlar' için tahmini (1'deki modeli kullanarak) toplam rezervasyonları kullanarak bir zaman serisi modeli (muhtemelen ARIMA?) Kullanın.
Bu fırsatlarda gerçek rezervasyonlara dönüşmede bir gecikme olacağı kabul edilir, ancak zaman serisi modeli gecikme ile başa çıkabilmelidir.
Kulağa nasıl geliyor? Zaman serileri ve satış tahminleri hakkında çok fazla şey yaptım ve söyleyebileceğimden biraz benzersiz bir yaklaşım. Bu nedenle herhangi bir geri bildirimi gerçekten takdir ediyorum!