Çok sınıflı bir algılayıcı nasıl çalışır?


13

Matematikte herhangi bir arka planım yok, ama basit Perceptron'un nasıl çalıştığını anlıyorum ve sanırım bir hiper düzlem kavramını kavradım (bunu bir çizgi ayırırken iki nokta bulutunu birbirinden ayıran 3B alanda geometrik olarak bir düzlem olarak hayal ediyorum 2B alanda iki nokta bulutu).

Ancak bir düzlemin veya bir çizginin sırasıyla 3B alanda veya 2B alanda üç farklı nokta bulutunu nasıl ayırabileceğini anlamıyorum - bu geometrik olarak mümkün değil, değil mi?

Wikipedia makalesindeki ilgili bölümü anlamaya çalıştım , ancak “Burada x girişi ve y çıkışı keyfi setlerden çekiliyor” cümlesiyle zaten sefil bir şekilde başarısız oldum . Birisi bana çok sınıflı algılayıcıyı ve bunun hiper düzlem fikrine nasıl gittiğini açıklayabilir mi, yoksa belki de beni o kadar matematiksel olmayan bir açıklamaya işaret edebilir mi?

Yanıtlar:


8

Verilerimiz burada giriş vektörleri ve \ {\ text {kırmızı, mavi, yeşil} \} olan y_i \ sınıflandırmalar.(x1,y1),,(xk,yk)xiRnyi{red, blue, green}

İkili sonuçlar için bir sınıflandırıcı oluşturmayı biliyoruz, bu yüzden bunu üç kez yapıyoruz: sonuçları birlikte gruplandırma, {red, blue or green} , {blue, red or green} ve {green, blue or red} .

Her bir model fonksiyonu şeklini alır diyoruz, sırasıyla. Bu mavi bir öngörüsüne olumlu mesafe karşılık eğer her modeline bağlı altdüzlemden imzalanan mesafeye bir giriş vektörü alır , eğer kırmızı ve eğer yeşil . Temelde ne kadar pozitif , model yeşil olduğunu düşünür ve bunun tersi de geçerlidir. Olasılık için çıktıya ihtiyacımız yok, sadece modelin ne kadar kendinden emin olduğunu ölçebilmeliyiz.f:RnRfR,fB,fGfBfRfGfG(x)x

Bir giriş verilen biz göre sınıflandırmak , eğer öyleyse, ndan en için yeşil tahmin ederiz .xargmaxc fc(x)fG(x){fG(x),fB(x),fR(x)}x

Bu strateji "Tüm vs biri" denir ve bu konuda okuyabilirsiniz burada .


3

O Wiki makalesini hiç anlayamıyorum. İşte bunu açıklamak için alternatif bir bıçak.

Olan bir algılayıcı , bir lojistik çıkış düğümünde 2 sınıfları için bir sınıflandırma ağdır. Bu çıktılar diğer basit olma olasılığı ile, sınıflardan birinin olma olasılığını .p1p

İki çıkış düğümü olan bir algılayıcı, 3 sınıf için bir sınıflandırma ağıdır. İki düğümün her biri sınıfında olma olasılığını verir ve üçüncü sınıfta olma olasılığı .pi1i=(1,2)pi

Ve bunun gibi; çıkış düğümlü bir algılayıcı, sınıfları için bir sınıflandırıcıdır . Gerçekten de, gizli bir katman yoksa, böyle bir algılayıcı temel olarak multinomiyal bir lojistik regresyon modeli ile aynıdır , tıpkı basit bir algılayıcının bir lojistik regresyonla aynı olması gibi.mm+1


Çıktının gerçek bir olasılık olduğundan emin misiniz? Her neyse, multinomiyal lojistik regresyonun nasıl çalıştığını bilmiyorum, bu yüzden buna bakmam gerekecek. Ancak iki veya daha fazla çıkış düğümü olan bir algılayıcının nasıl oluşturulduğunu açıklamanın (algoritmik) bir yolu yok mu? Bir şekilde zincirlenmişler mi?
wnstnsmth
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.