sinir ağlarını doğrusal olmayan bir sınıflandırma modeli yapan nedir?


18

Doğrusal olmayan sınıflandırma modellerinin matematiksel anlamını anlamaya çalışıyorum:

Sinir ağlarının doğrusal olmayan bir sınıflandırma modeli olduğu hakkında bir makale okudum.

Ama bunun farkındayım:

resim açıklamasını buraya girin

İlk katman:

h1=x1wx1h1+x2wx1h2

h2=x1wx2h1+x2wx2h2

Sonraki katman

y=bwby+h1wh1y+h2wh2y

Basitleştirilebilir

=b+(x1wx1h1+x2wx1h2)wh1y+(x1wx2h1+x2wx2h2)wh2y

=b+x1(wh1ywx1h1+wx2h1wh2y)+x2(wh1ywx1h1+wx2h2wh2y)

İki katmanlı sinir ağı Sadece basit bir doğrusal regresyon

=b+x1W1+x2W2

Bu, herhangi bir sayıda tabakaya gösterilebilir, çünkü herhangi bir sayıda ağırlığın doğrusal kombinasyonu yine doğrusaldır.

Bir sinir ağını gerçekten doğrusal olmayan bir sınıflandırma modeli yapan nedir?
Aktivasyon fonksiyonu modelin doğrusal olmamasını nasıl etkiler?
Bana açıklayabilir misin?

Yanıtlar:


18

Bence sinirsel ağdaki düğümlerde aktivasyon fonksiyonunu unutursunuz , ki bu doğrusal değildir ve tüm modeli doğrusal değildir.

Formülünüzde tam olarak doğru değil, nerede,

h1w1x1+w2x2

fakat

h1=sigmoid(w1x1+w2x2)

nerede sigmoid işlevi böyle, sigmoid(x)=11+ex

resim açıklamasını buraya girin

Sigmoid fonksiyonunun etkisini açıklamak için sayısal bir örnek kullanalım, sonra sigmoid ( 4 ) = 0.99 olduğunu varsayalım . Diğer taraftan, w 1 x 1 + w 2 x 2 = 4000 , sigmoid ( 4000 ) = 1 olduğunu ve neredeyse doğrusal olmayan sigmoid ( 4 ) ile aynı olduğunu varsayalım .w1x1+w2x2=4sigmoid(4)=0.99w1x1+w2x2=4000sigmoid(4000)=1sigmoid(4)


Ayrıca, bu eğitimdeki slayt 14'ün tam olarak nerede yanlış yaptığınızı gösterebileceğini düşünüyorum . için 'H1 değil lütfen otuput -7.65 ama değildir sigmoid(-7.65)

resim açıklamasını buraya girin


1
Aktivasyon fonksiyonu modelin doğrusal olmamasını nasıl etkiler? Bana açıklayabilir misin?
Alvaro Joao

3

Birden fazla doğrusal katmanın tek bir doğrusal katmana eşdeğer olabileceği konusunda haklısınız. Diğer cevapların söylediği gibi, doğrusal olmayan bir aktivasyon fonksiyonu doğrusal olmayan sınıflandırmaya izin verir. Bir sınıflandırıcının doğrusal olmadığını söylemek, doğrusal olmayan karar sınırına sahip olduğu anlamına gelir. Karar sınırı sınıfları ayıran bir yüzeydir; sınıflandırıcı, karar sınırının bir tarafındaki tüm noktalar için bir sınıfı ve diğer taraftaki tüm noktalar için başka bir sınıfı tahmin edecektir.

yhwb

y=σ(hw+b)

σ1c

c={0y0.51y>0.5

Gizli birim aktivasyonlarıyla ilgili olarak sınıflandırma kuralını ele alalım. Gizli birim aktivasyonlarının çizgisine yansıtıldığını görebilirizhW+by

Daha önce karar sınırının doğrusal olmadığını, ancak hiper düzlemin doğrusal sınırın tanımı olduğunu söyledim. Ancak, sınırı çıktıdan hemen önce gizli birimlerin bir fonksiyonu olarak görüyoruz. Gizli ünite aktivasyonları, önceki gizli katmanlar ve doğrusal olmayan aktivasyon fonksiyonları nedeniyle orijinal girişlerin doğrusal olmayan bir fonksiyonudur. Ağ hakkında düşünmenin bir yolu, verileri doğrusal olmayan bir şekilde bazı özellik alanlarına eşlemesidir. Bu alandaki koordinatlar, son gizli birimlerin etkinleştirilmesiyle verilir. Ağ daha sonra bu alanda doğrusal sınıflandırma gerçekleştirir (bu durumda lojistik regresyon). Karar sınırını orijinal girdilerin bir fonksiyonu olarak da düşünebiliriz. Girişlerden gizli birim aktivasyonlarına doğrusal olmayan eşlemenin bir sonucu olarak bu işlev doğrusal olmayacaktır.

Bu blog yazısı , bu sürecin bazı güzel figürlerini ve animasyonlarını gösteriyor.


1

Doğrusalsızlık sigmoid aktivasyon fonksiyonundan (1 / (1 + e ^ x)) gelir; burada x, sorunuzda referans verdiğiniz öngörücülerin ve ağırlıkların doğrusal kombinasyonudur.

Bu arada, bu aktivasyonun sınırları sıfır ve birdir, çünkü payda fraksiyon sıfıra yaklaşacak kadar büyür veya e ^ x fraksiyon 1/1'e yaklaşacak kadar küçük olur.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.