Zaman serilerinde anomali tespiti için iyi bir paket mi arıyorsunuz?


17

Zaman serilerinde anomali tespiti için kullanılabilecek kapsamlı bir açık kaynaklı paket (tercihen python veya R'de) var mı?

Scikit-learn'da tek bir sınıf SVM paketi vardır, ancak zaman serisi verileri için değildir. Anormallik tespiti için örneğin Bayesian ağlarını kullanan daha karmaşık paketler arıyorum.


bir tane yazmamız lazım kardeşim !! : P
Arpit Sisodia

Yanıtlar:


19

Burada biraz geç kaldığımı biliyorum, ama evet aykırı kombinasyon çerçeveleri ile birlikte anomali tespiti için bir paket var.

Hala github üzerinde erken gelişim aşamasında ve yakında JMLR'de yayınlanacak.

Paket python dilinde ve paket adı pyod'dur ( https://github.com/yzhao062/Pyod ).

Bireysel yaklaşımları takip etmek için birden fazla algoritmaya sahiptir:

  1. Aykırı Tespit için Doğrusal Modeller ( PCA, vMCD, vOne-Sınıfı ve SVM )
  2. Yakınlık Tabanlı Aykırı Tespit Modelleri ( LOF, CBLOF, HBOS, KNN, OrtalamaKNN ve MedianKNN )
  3. Aykırı Tespit için Olasılıksal Modeller ( ABOD ve FastABOD )
  4. Aykırı Topluluklar ve Kombinasyon Çerçeveleri ( IsolationForest ve FeatureBagging )
  5. Yapay Sinir Ağları ve Derin Öğrenme Modelleri ( Tamamen bağlı Yapay Sinir Ağına sahip otomatik kodlayıcı )

Son olarak, özellikle zaman serilerini arıyorsanız, bu github bağlantısı yararlı olacaktır.

Zaman aşımı aykırı algılaması için aşağıdaki liste paketlerine sahiptir:

datastream.io

ufuk çizgisi

banpei

Anomali tespiti


bağlam anormallikleri üzerinde çalışmanın herhangi bir yolu var mı?
Arpit Sisodia

anomali tespiti veya aykırı tespiti hakkında mı konuşuyorsunuz? Bir fark var.
Arpit Sisodia

6

Zaman serisi anormalliklerini ele almanın birden fazla yolu vardır.

1) Anormallikler biliniyorsa , bir sınıflandırma modeli oluşturun. Zaman serisi verileri için aynı tür anormallikleri tespit etmek için bu modeli kullanın.

2) Anormallikler bilinmiyorsa , organizasyonumuzda yaptıklarımız - kümelenme ve sınıflandırma-

Aykırı değerleri tanımlamak için önce LOF / K-araçlarını / Cook mesafesini kullanın. Şu anda 2 sınıfımız olduğu için tüm verileri sınıflandırma problemine dönüştürün - Aykırı değerler ve normaller. Şimdi bir sınıflandırma modeli oluşturun ve çalışma zamanında anormalliği (zaman serisi verileri) tanımlamak için kurallar (sınıflandırma modeli) alın.

3) Anormallikler bilinmiyorsa , Araştırmam sırasında, anormallikleri tanımlamanın en yaygın yolu normal bir model oluşturmaktır ve normal modelden (hata) herhangi bir sapma anormaldir, bu nedenle bir sonraki saat için zaman dizinizi tahmin edip karşılaştırırsınız. gerçek değerlerle. Hata beklenenden fazla ise, anormal bir şey oluyor.

Python veya R'de herhangi bir doğrudan paket bulamadım, kimse gerçekten anormal olanı bilmiyordu: P, tüm durumlarda, aykırı algılama ile ilgili.

bazı yararlı bağlantılar

https://machinelearningstories.blogspot.com/2018/12/easiest-way-of-detection-abnormality.html

https://machinelearningstories.blogspot.com/2018/07/anomaly-detection-anomaly-detection-by.html


2

Peygamber Kütüphanesi'ni deneyin

Peygamber , lineer olmayan eğilimlerin yıllık, haftalık ve günlük mevsimsellik artı tatil etkilerine uygun olduğu ek bir modele dayanan zaman serisi verilerini tahmin etmek için bir prosedürdür. Güçlü mevsimsel etkileri olan ve birkaç mevsim geçmiş verisi olan zaman serileriyle en iyi sonucu verir. Hz.

Daha fazla bilgi: Peygamber kütüphanesi ile zaman serilerinde anomali tespiti

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.