Bunu gelecekte sorumla karşılaşan herkes için yayınlamak - yerel aykırı faktör algoritmasını tanımlayan orijinal makale, "LOF: Yoğunluğa Dayalı Yerel Aykırı Değerleri Tanımlamak" (Breunig ve ark.), Bir k-değeri seçme yöntemi önerir . Bir hatırlatma olarak, LOF algoritması her bir noktanın yoğunluğunu kendi yoğunluğuyla karşılaştırır.k- en yakın komşular. Makalenin yazarları, en azk ve maksimum kve her nokta için, her biri için maksimum LOF değerini alarak ko aralıkta. Sınırları seçmek için çeşitli yönergeler sunarlar.
Minimum değer için, LOF değerleri, eşit dağılımdaki noktaları çılgınca dalgalandırır. k<10, eşit dağılımlı noktalar bazen aykırı değerler olarak gösterildiğinden, en azından min(k)=10. İkincisi, minimumk-değer, bir şeyin "küme" olarak kabul edilmesi için minimum boyut olarak işlev görür, böylece noktalar bu kümeye göre aykırı değerler olabilir. Eğerk=15ve bir grup var 12 puan ve bir puan p, gruptaki her nokta şunları içerecektir p en yakın komşularında ve pbu noktaları içerecek ve çok benzer LOF'lara sahip olmalarını sağlayacaktır. Yani bir grubun yakınındaki bir noktayıN bu grubun bir parçası olmaktan ziyade bir aykırı değer olarak k değerinizin en azından N.
Maksimum değer için, benzer bir ölçüt uygulanır, çünkü birlikte kümelenmişse aykırı olarak değerlendirilmesini istediğiniz maksimum nesne sayısı olmalıdır. Bir grupN ana kümeden izole edilen nesneler bir küme olabilir veya Nkomutlar; içink<N, onlar ilk olacak; içink>N, ikinci olacaklar.
Umarım bu benzer bir sorunu olan herkese yardımcı olur. Makalenin tamamı buradadır ve maks / min k-değerleri tartışması sayfa 7'de başlar ve sayfa 9'a kadar devam eder.kdeğeri MinPts olarak .)