Sıklıkla diziler olan bazı tahmin değişkenlerinin olduğu bir model (sınıflandırma veya regresyon) yapıyorum ve bunları modelde yordayıcılar olarak dahil etmek için mümkün olan en iyi şekilde özetlemek için teknik öneriler bulmaya çalışıyorum.
Somut bir örnek olarak, bir müşterinin önümüzdeki 90 gün içinde şirketi terk edip etmeyeceğini tahmin etmek için bir model oluşturulduğunu varsayalım (t ve t + 90 arasında herhangi bir zamanda; dolayısıyla ikili sonuç). Mevcut öngörücülerden biri müşterilerin t_0 ila t-1 dönemleri için finansal bakiyesidir. Belki bu, önceki 12 ay için aylık gözlemleri temsil eder (yani 12 ölçüm).
Bu seriden özellikler oluşturmanın yollarını arıyorum. Her müşteri serisinin ortalama, yüksek, düşük, standart geliştirme gibi eğilimlerini elde etmek için bir OLS regresyonuna uygun tanımlarını kullanıyorum. Diğer özellikleri hesaplama yöntemleri mi? Diğer değişim veya oynaklık ölçüleri?
EKLE:
Aşağıdaki yanıtta belirtildiği gibi, Dinamik Zaman Çarpıtma (DTW) kullanarak ve sonra da sonuçlanan mesafe matrisinde hiyerarşik kümelemeyi kullanarak (bazı kümeler oluşturarak ve sonra küme üyeliğini bir özellik olarak kullanarak) da düşündüm (ancak buraya eklemeyi unuttum). Puanlama verilerinin puanlanması, DTW'nin yeni vakalarda ve küme sentroidlerinde yapıldığı - yeni veri serilerini en yakın sentroidleriyle eşleştiren bir süreci takip etmek zorunda kalacaktır ...