Bayes Sınıflandırıcı neden ideal sınıflandırıcıdır?


11

Kategorilerin altında yatan olasılık yapısının mükemmel olarak bilindiği ideal bir durum olarak kabul edilir.

Neden Bayes sınıflandırıcısı ile elde edilebilecek en iyi performansı elde ediyoruz?

Bunun resmi kanıtı / açıklaması nedir? Her zaman Bayes sınıflandırıcısını diğer tüm sınıflandırıcıların performansını karşılaştırmak için bir referans olarak kullandığımızdan.

Yanıtlar:


9

Neden Bayes sınıflandırıcısı ile elde edilebilecek en iyi performansı elde ediyoruz? Bunun resmi kanıtı / açıklaması nedir?

Genellikle, bir veri kümesi D oluşur düşünülmektedir n IID örnekleri xi veri üreten bir dağılım. Daha sonra, belirli bir veri, bir tahmin modelini oluşturmak: örnek verilen xi , sınıf tahmin f ( x i ) numunenin gerçek sınıf ise f ( x i ) .f^(xi)f(xi)

Ancak, teorik olarak, bir belirli model seçmek için değil karar verebilir f seçilmiş değil, düşünün tüm olası modeller f defada ve bir içine nasılsa bunları birleştirmek büyük modeli F .f^chosenf^F^

Tabii ki, veri verilmiş, birçok küçük MODELLS oldukça imkansız veya uygunsuz olabilir (örneğin, hedefin birden değerler veri kümesi içinde bulunmasına rağmen, hedefin yalnızca bir değer tahmin modelleri D ).

Her durumda, xi s ile aynı dağılımdan alınan yeni örneklerin hedef değerini tahmin etmek istersiniz . İyi bir ölçü e modeline performansı olacaktır

e(model)=P[f(X)=model(X)],
örneğin, bir rastgele örneklenmiş için de geçerlidir hedef değeri tahmin olasılığı X .

Bayes formülünü kullanarak, D verisi verildiğinde, yeni bir x örneğinin v hedef değerine sahip olma olasılığının ne olduğunu hesaplayabilirsiniz :D

P(vD)=f^P(vf^)P(f^D).
Kişi bunu vurgulamalı

  • Genellikle P(vf^) ya olduğu 0 ya da 1 , çünkü ön bir belirleyici fonksiyonu olan x ,f^x
  • Genellikle, ancak hemen hemen tüm bu tahmin etmek imkansız zamandır P(f^D) (yukarıda bahsedilen önemsiz durumlar hariç),
  • f^

P(vD)

x

v^=argmaxvf^P(vf^)P(f^D).
ve(f^)

Her zaman Bayes sınıflandırıcısını diğer tüm sınıflandırıcıların performansını karşılaştırmak için bir referans olarak kullandığımızdan.

P(vD)


P(v|f)

@RuiQi ben diye bir şey olmadığını düşünmüyorum Bayes sınıflandırıcı. Saf Bayes sınıflandırıcısının ve optimum Bayes sınıflandırıcısının farkındayım.
Antoine

P(vf^)vf^

0

CTCP

XXx

P(CT=CP)=all possible Xf(x)P(CT=CP|x)dx

f(x)X

x

xP(CT=CP|x)x

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.