Bugün Naive Bayes Sınıflandırması'nı okuyordum. Parametre Tahmini başlığı altında, 1 yumuşatma ile birlikte okudum :
yapalım (örneğin, pozitif veya negatif olarak) bir sınıfını ifade ve izin bir belirteç ya da kelime bakın.
İçin maksimum olabilirlik tahmin olduğu
nin bu tahmini, bilinmeyen kelimelere sahip belgeler için bize olasılık vereceği için problemli olabilir . Bu sorunu çözmenin yaygın bir yolu Laplace yumuşatma kullanmaktır.
V, eğitim setinde bir kelime kümesi olsun, kelime grubuna (bilinmeyen) için yeni bir eleman ekleyin .
Tanımla
kelime haznesine atıfta bulunduğu (eğitim setindeki kelimeler).
Özellikle, bilinmeyen herhangi bir kelimenin olasılığı olacak
Sorum şu: Neden bu Laplace yumuşatma ile uğraşıyoruz? Test setinde karşılaştığımız bu bilinmeyen kelimelerin neredeyse sıfır, yani , onları modele dahil etmenin amacı nedir? Neden onları göz ardı etmiyor ve silmiyorsunuz?