Hadoop, Kovan, Elastik Arama (diğerleri arasında) kullanarak büyük bir veri altyapısı kurmaya çalışıyorum ve bazı veri kümeleri üzerinde bazı algoritmalar çalıştırmak istiyorum. Algoritmaların kendilerinin ölçeklenebilir olmasını istiyorum, bu yüzden Weka, R ve hatta RHadoop gibi araçları kullanmak hariç tutulur. Apache Mahout Kütüphanesi iyi bir seçenek gibi görünüyor ve bu özellikleri regresyon ve kümeleme görevler için algoritmalar .
Bulmak için uğraştığım şey anomali veya aykırı tespit için bir çözüm.
Mahout, Gizli Markov Modelleri ve çeşitli kümeleme tekniklerine (K-Ortalamalar dahil) sahip olduğundan, bunlardan herhangi birini kullanarak zaman serilerinde aykırı değerleri tespit etmek için bir model oluşturmanın mümkün olup olmadığını merak ediyordum. Bu konuda deneyimli biri bana tavsiyede bulunsa minnettar olurum
- mümkünse ve olması halinde
- nasıl yapılır artı
- ilgili çabanın bir tahmini ve
- bu yaklaşımın doğruluğu / sorunları.