Sorunun formülasyonundan, anormalliklerin (yani etiketlerin) "örnekleri" olmadığını varsayıyorum. Bu varsayımla, mümkün olan bir yaklaşım, otomatik enkoderleri kullanmak olacaktır : verilerinizi girdi olarak alan ve aynı verileri çıkarmak için eğitilmiş sinir ağları. Buradaki fikir, eğitimin ağın girdi veri dağılımlarının temsillerini gizli değişkenler biçiminde öğrenmesine izin vermesidir.
Orijinal verilerin bozuk sürümleri giriş olarak ve bozulmamış orijinal veriler çıkış olarak eğitilmiş denoising otoenkoder adı verilen bir tür otomatik kodlayıcı vardır . Bu, girişlerden paraziti (yani veri bozulmalarını) kaldırabilen bir ağ sunar .
Günlük verilerle denoising bir otomatik kodlayıcıyı eğitebilirsiniz. Sonra yeni günlük veriler üzerinde kullanın; bu şekilde orijinal günlük verilere ve aynı verilerin bozulmamış bir sürümüne sahip olursunuz . Daha sonra, önemli farklılıkları tespit etmek için her ikisini de karşılaştırabilirsiniz .
Burada önemli olan, hangi önemli farkın tanımını seçeceğinizdir. Öklid mesafesini hesaplayabilir ve belirli bir keyfi eşiği aşarsa bir anomaliniz olduğunu varsayabilirsiniz. Bir diğer önemli faktör, ortaya koyduğunuz yolsuzluk türleridir; makul anormalliklere mümkün olduğunca yakın olmalıdırlar.
Başka bir seçenek de Generatif Düşman Ağları kullanmak olacaktır . Eğitimin yan ürünü, normal günlük verileri anormal verilerden ayıran bir ayırıcı ağdır .