KNN ayrımcı bir öğrenme algoritması mıdır?


Yanıtlar:


19

KNN, belirli bir sınıfa ait bir örneğin koşullu olasılığını modellediğinden, ayrımcı bir algoritmadır . Bunu görmek için sadece kişinin kNN'lerin karar kuralına nasıl ulaştığını düşünün.

Sınıf etiketi, özellik uzayındaki bir bölgeye ait olan bir dizi noktaya karşılık gelir R. Gerçek olasılık dağılımından örnek noktalar çizerseniz, p(x) , bağımsız olarak, o sınıftan bir örnek çizim olasılığı,

P=Rp(x)dx

N puanınız varsa ne olur ? Bu N noktasının K noktalarının R bölgesine düşme olasılığı binom dağılımını takip eder, NR

Prob(K)=(NK)PK(1P)NK

Şöyle bu dağılımı olan keskin olasılığı olan ortalama değer olarak ifade edilebilir, böylece, zirveKN RP=Rp(x)dxp(x)VVp(x)KKN . Ek bir yaklaşım, üzerindeki olasılık dağılımının yaklaşık olarak sabit , böylece kişi integrale yaklaşık burada , bölgesi. Bu yaklaşımlar altında .R

P=Rp(x)dxp(x)V
Vp(x)KNV

Şimdi, eğer birkaç sınıfımız olsaydı, her biri için aynı analizi tekrarlayabiliriz, bu da bize nerede sınıftan alınan puan miktarıdır

p(x|Ck)=KkNkV
Kkk o bölgeye giren ve , sınıfına ait toplam puan . Uyarı .NkCkkNk=N

Analizi binom dağılımı ile tekrarlayarak, önceki tahmin edebildiğimizi görmek kolaydır .P(Ck)=NkN

Bayes kuralını kullanarak,

P(Ck|x)=p(x|Ck)p(Ck)p(x)=KkK
KNN'ler için kural olan .

2
Referans, KNN hakkında herhangi bir bilgi içermemektedir. Doğru mu?
bayerj

1
Kastetmeye karşı bir ayrımcı algoritma için neyin anlaşıldığını vurgulamak istedim.
jpmuc

5

Tarafından cevap @jpmuc doğru değil. Üretken modeller temel dağılımı P (x / Ci) modellemekte ve daha sonra posterior olasılıkları bulmak için Bayes teoremini kullanmaktadır. Bu cevapta gösterilen tam olarak budur ve daha sonra tam tersini sonuçlandırır. :Ö

KNN'nin üretken bir model olması için sentetik veriler üretebilmeliyiz. Başlangıç ​​eğitimi verilerimiz olduğunda bunun mümkün olduğu görülmektedir. Ancak hiçbir eğitim verisinden başlamak ve sentetik veri üretmek mümkün değildir. Bu nedenle KNN, üretken modellere iyi uymuyor.

KNN'nin ayrımcı bir model olduğu iddia edilebilir, çünkü sınıflandırma için ayrımcı sınır çizebiliriz veya posterior P'yi (Ci / x) hesaplayabiliriz. Ancak, tüm bunlar üretken modeller için de geçerlidir. Gerçek bir ayrımcı model, altta yatan dağılım hakkında hiçbir şey söylemez. Ancak KNN durumunda, temel dağıtım hakkında çok şey biliyoruz, aslında tüm eğitim setini saklıyoruz.

Yani KNN, üretken ve ayrımcı modeller arasında ortada gibi görünüyor. Muhtemelen bu yüzden KNN, tanınmış makalelerde herhangi bir üretken veya ayrımcı model altında kategorize edilmemiştir. Onlara parametrik olmayan modeller diyelim.


Katılmıyorum. "Üretken sınıflandırıcılar, x ve y etiketinin birleşme olasılığı p (x, y) modelini öğrenir ve p (ylx) hesaplamak için Bayes kurallarını kullanarak tahminlerini yaparlar ve en olası y etiketini seçerler Ayrımcı sınıflandırıcılar posterior p (ylx) 'i doğrudan modellenir veya x girişlerinden sınıf etiketlerine doğrudan bir harita öğrenir ". Bkz. "
Ayrımcıya


1

KNN'nin ayrımcı olduğuna katılıyorum. Bunun nedeni, verileri açıklayan (olasılıkla, örneğin Naive Bayes gibi) açık bir şekilde (olasılıklı) bir modeli saklamadığı veya öğrenmeye çalıştığıdır.

Juampa'nın cevabı beni karıştırıyor çünkü benim anlayışımla, üretken bir sınıflandırıcı verinin nasıl üretildiğini açıklamaya çalışan (örneğin bir model kullanarak) ve bu cevap bunun bu nedenle ayrımcı olduğunu söylüyor ...


1
Üretken bir model P'yi (Ck, X) öğrenir, böylece bu eklem dağılımını kullanarak daha fazla veri üretebilirsiniz. Aksine, ayrımcı bir model P (Ck | X) öğrenir. @Juampa'nın KNN ile işaret ettiği şey budur.
Zhubarb

1
Sınıflandırma zamanında, hem üretici hem de ayrımcı, tahminlerde bulunmak için koşullu olasılıkları kullanır. Bununla birlikte, üretken sınıflandırıcılar eklem olasılığını öğrenir ve Bayes kuralı ile koşulu hesaplar, ayrımcı olarak ise bir sınıflandırıcı ya doğrudan koşulu hesaplar ya da buna olabildiğince iyi bir yaklaşım sağlar.
rapaio
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.