Naive Bayes Doğrusal Sınıflandırıcı Nasıl?


31

Diğer konuyu burada gördüm ama cevabın asıl soruyu tatmin ettiğini sanmıyorum. Sürekli okuduğum, Naive Bayes'ın log odds gösterimini kullanarak doğrusal bir sınıflandırıcı (örneğin: burada ) (doğrusal bir karar sınırı çizecek şekilde) olduğu.

Ancak, iki Gauss bulutunu simüle ettim ve bir karar sınırı taktım ve sonuçları aldım (n. Kitaplık e1071, naiveBayes kullanarak) () 1- Yeşil, 0 - Kırmızı

Gördüğümüz gibi karar sınırı doğrusal değil. Sınıflandırıcının kendisinin verileri doğrusal olarak ayırdığını söylemek yerine, parametrelerin (koşullu olasılıklar) günlük alanında doğrusal bir kombinasyon olduğunu söylemeye mi çalışıyor?


karar sınırını nasıl oluşturdunuz? sınıflandırıcının gerçek karar sınırından ziyade, uygun rutininizle ilgisi olduğundan şüpheleniyorum. normalde kişi kararınızı kadranızın her bir noktasında hesaplayarak bir karar sınırı oluşturur.
seanv507

Ben de öyle yaptım, iki X = [Min (x), Max (x)] ve Y = [Min (Y), Max (Y)] aralıklarını 0.1 aralığında aldım. Daha sonra tüm bu veri noktalarını eğitimli sınıflandırıcıya yerleştirdim ve log oranlarının -0.05 ile 0.05 arasında olacağı noktaları buldum
Kevin Pei

Yanıtlar:


30

Genel olarak naif Bayes sınıflandırıcı doğrusal değildir, ancak bu olasılık faktörler ise ile ilgili olarak üstel ailesine , bir özelliği, uzayda naif Bayes sınıflandırıcı karşılık doğrusal sınıflandırıcı. İşte bunu görmek için nasıl.p(xic)

Herhangi bir saf Bayes sınıflandırıcısını * olarak yazabilirsiniz.

p(c=1|x)=σ(Σbengünlükp(xben|c=1)p(xben|c=0)+günlükp(c=1)p(c=0)),

burada olan lojistik fonksiyon . Eğer p ( x i | c ) üstel aileden, biz olarak yazabilirizσp(xic)

p(xic)=hi(xi)exp(uicϕi(xi)Ai(uic)),

ve dolayısıyla

p(c=1x)=σ(iwiϕi(xi)+b),

nerede

wi=ui1ui0,b=logp(c=1)p(c=0)i(Ai(ui1)Ai(ui0)).

Bunun reg i tarafından tanımlanan özellik alanındaki lojistik regresyona - doğrusal bir sınıflandırıcıya - benzer olduğunu unutmayın . İkiden fazla sınıf için, benzer şekilde, multinomial lojistik (veya softmax) regresyonu elde ederiz .ϕi

Eğer Gauss ise, ϕ i ( x i ) = ( x i , x 2 i ) ve w i 1 olması gerekir. p(xic)ϕi(xi)=(xi,xi2)

wi1=σ12μ1σ02μ0,wi2=2σ022σ12,bi=logσ0logσ1,

p varsayarak ( c = 1 ) = p ( c = 0 ) = 1 .p(c=1)=p(c=0)=12


* İşte bu sonucu türetmek nasıl:

p(c=1x)=p(xc=1)p(c=1)p(xc=1)p(c=1)+p(xc=0)p(c=0)=11+p(xc=0)p(c=0)p(xc=1)p(c=1)=11+exp(logp(xc=1)p(c=1)p(xc=0)p(c=0))=σ(ilogp(xic=1)p(xic=0)+logp(c=1)p(c=0))

Şimdi anladığım türetme için teşekkür ederim, denklem 2 ve altındaki gösterimleri açıklayabilir misiniz? (u, h (x_i), phi (x_i), vb.) P (x_i | c) üstel bir ailenin altında, sadece pdf'deki değeri alıyor mu?
Kevin Pei

uϕ

1
ϕ(x)=(x,x2)w

Bu cevabı yanıltıcı buluyorum: yorumda belirtildiği gibi ve hemen altındaki cevapta, Gauss safı Bayes orijinal özellik alanında doğrusal değil, doğrusal olmayan bir dönüşüm içinde. Dolayısıyla geleneksel bir lineer sınıflandırıcı değildir.
Gael Varoquaux

p(xben|c)φben(xben)=(xben,xben2)T(x)x/σ

8

Sınıf koşullu varyans matrislerinin her iki sınıf için de aynı olması durumunda doğrusaldır. Bunu görmek için log posteriorlarının rasyonlarını yazın; karşılık gelen varyasyonlar aynı ise, bunun dışında doğrusal bir fonksiyon elde edersiniz. Aksi takdirde ikinci dereceden.


3

Başka bir nokta daha eklemek isterim: Bazı karışıklıkların nedeni, "Naive Bayes sınıflandırması" yapmanın ne demek olduğuna bağlı.

"Gaussian Discriminant Analysis (GDA)" başlığı altında, birkaç teknik vardır: QDA, LDA, GNB ve DLDA (ikinci dereceden DA, doğrusal DA, gauss saflığı, diyagonal LDA). [GÜNCELLEME] LDA ve DLDA, verilen öngörülerin alanında doğrusal olmalıdır. (Bakınız örn ., DA için Murphy , 4.2, sayfa 101 ve NB için sayfa 82. Not: GNB'nin mutlaka doğrusal olması gerekmez. Ayrık NB (kaputun altında multinom dağılımını kullanan) doğrusaldır. Duda'yı da kontrol edebilirsiniz. , Hart & Stork bölüm 2.6). QDA diğer cevapların işaret ettiği gibi ikinci derecedendir (ve grafiğinizde ne olduğunu düşünüyorum - aşağıya bakınız).

Σc

  • Σc
  • Σc=Σ
  • Σc=diagc
  • DLDA: Σc=dbenbirg: paylaşılan & köşegen cov. matris

E1071'e ilişkin dokümanlar , sınıf-şartlı bağımsızlık (yani, GNB) olduğunu varsaydığını iddia etse de, aslında QDA yaptığından şüpheleniyorum. Bazı insanlar "saf Bayes" i (bağımsızlık varsayımları yaparak) "basit Bayesian sınıflandırma kuralı" ile birleştirir. GDA yöntemlerinin tümü daha sonradan türetilmiştir; ancak yalnızca GNB ve DLDA eskileri kullanır.

Büyük bir uyarı, ne yaptığını onaylamak için e1071 kaynak kodunu okumamıştım.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.