Varsayalım ki, Ocak'05'ten Aralık'11'e kadar aylık 20.000'den fazla zaman serisi var. Bunların her biri farklı bir ürün için küresel satış verilerini temsil eder. Ya, her biri için tahminleri hesaplamak yerine, yalnızca "gerçekten önemli" olan az sayıda ürüne odaklanmak isteseydim?
Bu ürünleri toplam yıllık gelire göre sıralayabilir ve klasik Pareto kullanarak listeyi kesebilirim. Yine de bana öyle geliyor ki, sonuçta çok fazla katkıda bulunmasalar da, bazı ürünlerin onları dışarıda bırakmanın kötü yargı olacağını tahmin etmek çok kolay. Geçtiğimiz 10 yıl boyunca her ay 50 $ değerinde ürün satan bir ürün kulağa pek hoş gelmeyebilir, ancak gelecekteki satışlarla ilgili tahminlerde bulunmak için yapabileceğim kadar az çaba gerektirir.
Diyelim ki ürünlerimi dört kategoriye ayırıyorum: yüksek gelir / tahmin edilmesi kolay - düşük gelir / tahmin edilmesi kolay - yüksek gelir / tahmin edilmesi zor - düşük gelir / tahmin edilmesi zor.
Sadece dördüncü gruba ait zaman serilerini geride bırakmanın makul olacağını düşünüyorum. Ancak "öngörülebilirliği" tam olarak nasıl değerlendirebilirim?
Varyasyon katsayısı iyi bir başlangıç noktası gibi görünüyor (bir süre önce bu konuda bazı kağıtlar gördüğümü de hatırlıyorum). Peki, zaman serilerim mevsimsellik / seviye değişimleri / takvim efektleri / güçlü eğilimler sergiliyorsa ne olacak?
Değerlendirmemi, "ham" verilerden değil, yalnızca rastgele bileşenin değişkenliğine dayandırmayı düşünmeliyim. Yoksa bir şey mi kaçırıyorum?
Daha önce benzer bir sorunla karşılaşan var mı? Siz nasıl başaracaksınız?
Her zaman olduğu gibi, herhangi bir yardım büyük beğeni topluyor!