Birkaç zaman serisi veri kümesinde anomali tespiti uygulamam gerekiyor. Bunu daha önce hiç yapmadım ve tavsiye almayı umuyordum. Ben python ile çok rahat, bu yüzden çözüm uygulanmasını tercih ederdim (benim kod çoğu işimin diğer bölümleri için python olduğunu).
Verilerin açıklaması: Son 2 yılda toplanmaya başlanan aylık zaman serisi verileri (yani sadece 24-36 zaman diliminde). Temel olarak, birkaç müşteri için aylık olarak izlenen birkaç metrik vardır.
time_period client metric score
01-2013 client1 metric1 100
02-2013 client1 metric1 119
01-2013 client2 metric1 50
02-2013 client2 metric2 500
...
İşte düşündüğüm şey: verileri bir veri çerçevesine (pandalar) çekin, ardından her bir müşteri / metrik çifti için yuvarlanan 6 aylık bir ortalama hesaplayın. Geçerli zaman diliminin değeri 6 aylık ortalamaya göre bir eşiği aşarsa, bayrağı yükseltin. Sorun oldukça basit görünüyor. Sadece sağlam bir yaklaşım benimsediğimden emin olmak istiyorum.
Bu fikri biraz dışlamak için herhangi bir tavsiye büyük mutluluk duyacağız. Sorunun biraz soyut olduğunu biliyorum ve bunun için özür dilerim.