Anomali tespiti için özellikleri otomatik olarak seçmenin en iyi yolu nedir?
Önemli olan çıkış: Ben normalde özellikleri insan uzmanlar tarafından seçilir bir algoritma olarak Anomali Detection tedavi aralık o kadar hatta birçok özellikleri ile siz - ( "anormal çıkış anormal giriş" gibi) olabilir birleştirerek çok daha küçük bir alt kümesi ile gelip özellikler.
Bununla birlikte, genellikle bir özellik listesinin çok büyük olabileceğini varsayarsak, bazen otomatik bir öğrenme bazen tercih edilebilir. Görebildiğim kadarıyla bazı girişimler var:
- Destek Vektör Verilerini genelleştiren "Anomali Tespiti için otomatik özellik seçimi" ( pdf )
- "Kaba Set Teorisi Kullanan Hızlı Ana Bilgisayar Tabanlı Saldırı Tespit Sistemi" (sanırım kaba Set Teorisini kullanan)
- İstatistiksel yaklaşım kullanan "Düşman Ağ Trafiğinin Anomali Tespiti için Öğrenme Kuralları" ( pdf , video )
Şimdi anlayabiliyorum merak ediyorum - anomali tespiti ve gerçekten büyük (yüzlerce?) Özellik seti varsayarak:
- Bu devasa özellik setleri hiç mantıklı mı? Sadece birkaç düzine kadar ayarlanan özelliği azaltmamalı mıyız, hepsi bu mu?
- Büyük özellik kümeleri mantıklıysa, yukarıdaki yaklaşımlardan hangisi daha iyi tahminler verebilir ve neden? Listelenmemiş çok daha iyi bir şey var mı?
- Örneğin, kümelenme / sıralama / vb. Yoluyla boyutsallık azalması veya özellik inşasına kıyasla neden daha iyi sonuçlar vermeliler?