Genel Naive Bayes terimi, modeldeki her bir özelliğin belirli bir dağılımından ziyade güçlü bağımsızlık varsayımlarını ifade eder. Naive Bayes modeli, kullandığı özelliklerin her birinin, bir sınıfa verilen şartlı olarak birbirinden bağımsız olduğunu varsayar. Daha resmi olarak, eğer Naive Bayes varsayımı altında, bazı sınıf c verildiğinde, ile f n arasındaki özellikleri gözlemleme olasılığını hesaplamak istersem , aşağıdakiler geçerlidir:f1fn
p(f1,...,fn|c)=∏i=1np(fi|c)
Bunun anlamı, yeni bir örneği sınıflandırmak için Naive Bayes modelini kullanmak istediğimde, arka olasılığın çalışılması daha kolay olduğu anlamına geliyor:
p(c|f1,...,fn)∝p(c)p(f1|c)...p(fn|c)
Elbette, bu bağımsızlık varsayımları nadiren doğrudur, bu da neden bazılarının modeli "Idiot Bayes" modeli olarak adlandırdığını açıklayabilir, ancak pratikte Naive Bayes modelleri, güçlü olanın açık olduğu karmaşık görevlerde bile şaşırtıcı derecede iyi performans göstermiştir. bağımsızlık varsayımları yanlıştır.
Bu noktaya kadar, her bir özelliğin dağılımı hakkında hiçbir şey söylemedik. Başka bir deyişle, tanımsız bıraktık . Multinomial Naive Bayes terimi bize her p ( f i | c ) ' nin başka bir dağıtımdan ziyade bir multinom dağılım olduğunu bilmemizi sağlar . Bu, metindeki sözcük sayıları gibi kolayca sayıma dönüştürülebilen veriler için işe yarar.p(fi|c)p(fi|c)
Naive Bayes sınıflandırıcınızla kullandığınız dağıtım bir Guassian pdf'dir, bu yüzden sanırım bir Guassian Naive Bayes sınıflandırıcı diyebilirsiniz.
Özetle, Naive Bayes sınıflandırıcısı, modeldeki özelliklerin her birinin koşullu bağımsızlığını ifade eden genel bir terimdir; Multinomial Naive Bayes sınıflandırıcısı, özelliklerin her biri için bir multinom dağılımını kullanan bir Naive Bayes sınıflandırıcısının belirli bir örneğidir.
Referanslar:
Stuart J. Russell ve Peter Norvig. 2003. Yapay Zeka: Modern Bir Yaklaşım (2 ed.). Pearson Eğitimi. Bakınız s. 499 "salak Bayes" referansına ve ayrıca Naive Bayes modelinin genel tanımına ve bağımsızlık varsayımlarına atıfta bulunmak için