Naive Bayes sınıflandırıcıları sınıflandırma problemleri için popüler bir seçimdir. Bunun da dahil birçok nedeni var:
- "Zeitgeist" - yaklaşık on yıl önce spam filtrelerinin başarısından sonra yaygın bir farkındalık
- Yazması kolay
- Sınıflandırıcı model kurmak hızlı
- Model, yeni bir eğitim verisi ile modeli yeniden oluşturmak zorunda kalmadan değiştirilebilir
Ancak, bunlar 'naif' - yani özelliklerin bağımsız olduğunu varsayıyorlar - bu, Maksimum Entropi sınıflandırıcıları (hesaplanması yavaş olan) gibi diğer sınıflandırıcılarla tezat oluşturuyor.
Bağımsızlık varsayımı genellikle kabul edilemez ve spam filtresi örneği de dahil olmak üzere pek çok (çoğu) durumda, bu sadece yanlıştır.
Öyleyse neden Naive Bayes Sınıflandırıcısı, bu tür uygulamalarda, özellikler birbirinden bağımsız olmasa bile, hala çok iyi performans gösteriyor?