Gönderen StatSoft, Inc. (2013), Elektronik İstatistik Kitabı , "Naif Bayes Sınıflandırıcı" :
Naif Bayes Sınıflandırması kavramını göstermek için, yukarıdaki şekilde gösterilen örneği düşünün. Belirtildiği gibi, nesneler YEŞİL veya KIRMIZI olarak sınıflandırılabilir. Benim görevim yeni davaları ulaştıklarında sınıflandırmak, yani şu anda mevcut olan nesnelere dayanarak hangi sınıf etiketine ait olduklarına karar vermek.
KIRMIZI'dan iki kat daha YEŞİL nesne olduğu için, yeni bir vakanın (henüz gözlemlenmemiş) KIRMIZI yerine YEŞİL üyeliğe sahip olma ihtimalinin iki katı olduğuna inanmak makul. Bayes analizinde, bu inanç öncelikli olasılık olarak bilinir. Öncelikli olasılıklar önceki deneyime dayanır, bu durumda YEŞİL ve KIRMIZI nesnelerin yüzdesi ve genellikle gerçekte gerçekleşmeden önce sonuçları tahmin etmek için kullanılır.
Böylece yazabiliriz:
40'ı YEŞİL ve 20 KIRMIZI olmak üzere toplam 60 nesne bulunduğundan, sınıf üyeliği için öncelikli olasılıklarımız:
Önceden olasılığımızı belirledikten sonra, şimdi yeni bir nesneyi sınıflandırmaya hazırız (WHITE dairesi). Nesnelerin iyi bir şekilde kümelenmesi nedeniyle, X'in çevresindeki YEŞİL (veya KIRMIZI) nesnelerin ne kadar fazla olduğunu varsayalım, yeni vakaların o belirli renge ait olma olasılığı o kadar yüksektir. Bu olasılığı ölçmek için, sınıf etiketlerine bakılmaksızın X'in etrafına bir nokta (bir priori seçilecek) içeren bir daire çizeriz. Sonra, her bir sınıf etiketine ait olan dairedeki noktaların sayısını hesaplıyoruz. Bundan olasılığını hesaplıyoruz:
Yukarıdaki çizimden, YEŞİL verilen X Olabilirliğinin, RED verilen X Olabilirliğinden daha küçük olduğu açıktır, çünkü daire 1 YEŞİL nesne ve 3 Kırmızı olanlar içerir. Böylece:
Önceki olasılıklar, X'in YEŞİL'e ait olabileceğini gösterse de (KIRMIZI'dan iki kat fazla YEŞİL olduğu göz önüne alındığında) olabilir; X'in sınıf üyeliğinin KIRMIZI olduğu (X civarında YEŞİL'den daha fazla KIRMIZI nesne olduğu düşünülür). Bayes analizinde, son sınıflandırma, her iki bilgi kaynağını, yani öncekini ve olasılığını birleştirerek, Bayes kuralı (Rev. Thomas Bayes 1702-1761'den sonra adlandırılır) kullanılarak bir arka olasılık oluşturmak üzere üretilir.
Son olarak, sınıf üyeliği en büyük arka olasılığa ulaştığından, X'i KIRMIZI olarak sınıflandırıyoruz.
Bu matematik anlayışımın zorluğunun ortaya çıktığı yerdir.
p (Cj | x1, x2, x ..., xd), sınıf üyeliğinin arka olasılığıdır, yani X'in Cj'ye ait olma olasılığıdır, ancak neden böyle yazıyorsunuz?
Olasılığı hesaplamak?
Posterior Olasılık?
Asla matematik almadım, ama saf bayes anlayışım iyi, sanırım bu ayrıştırılmış yöntemlere gelince kafam karıştı. Bazıları bu yöntemlerin görselleştirilmesine ve matematiğin anlaşılır bir şekilde yazılmasına yardımcı olabilir mi?