Yoğunluk tahmininin uygulanması için tipik bir durum, sadece tek bir tipte (veya çoğunlukla) veriye sahip olmanız, ancak önemli ölçüde sapma gösteren çok nadir, nitel farklı verilerle ilgilenmeniz olan yenilik tespiti, yani aykırı tespittir. bu yaygın durumlar.
Örnekler sahtekarlık tespiti, sistemlerde arıza tespiti vb. Bunlar, ilgilendiğiniz türde veri toplamanın çok zor ve / veya pahalı olduğu durumlardır. Bu nadir durumlar, yani düşük olma olasılığı olan vakalar.
Çoğu zaman kesin dağılımı doğru bir şekilde tahmin etmekle değil, göreceli oranlarla (belirli bir örneğin gerçek bir aykırı olması ile bir olmama olasılığı ne kadar) tahmin etmekle ilgilenirsiniz.
Konuyla ilgili onlarca öğretici ve inceleme var. Bu bir başlangıç için iyi bir kişi olabilir.
EDIT: bazı insanlar için aykırı algılama için yoğunluk tahmini kullanarak garip görünüyor. Öncelikle bir şey üzerinde anlaşalım: Birisi verilerine bir karışım modeli uyduğunda , aslında yoğunluk tahmini yapıyor. Bir karışım modeli bir olasılık dağılımını temsil eder.
kNN ve GMM aslında birbiriyle ilişkilidir: böyle bir olasılık yoğunluğunu tahmin etmenin iki yöntemidir. Bu, yenilik tespitinde birçok yaklaşım için temel fikir. Örneğin, bu kNN'lere, diğeri Parzen pencerelerine (bu makalenin başlangıcında bu fikri vurgulayan) ve diğerlerine dayanmaktadır .
Bana öyle geliyor ki (ama sadece benim kişisel algım), hepsi olmasa da çoğu bu fikir üzerinde çalışıyor. Anormal / nadir bir olay fikrini başka nasıl ifade edersiniz?