Derin Öğrenme ve Bilgi Darboğaz Prensibi adlı makalede yazarlar bölüm II A) 'da belirtilmektedir:
Tek nöronlar, yalnızca lineer olarak ayrılabilir girdileri sınıflandırır, çünkü giriş alanlarında sadece hiper düzlemler uygulayabilirler . Girişler koşullu olarak bağımsız olduğunda hiper düzlemler verileri en iyi şekilde sınıflandırabilir.
Bunu göstermek için aşağıdakileri elde ederler. Bayes teoremini kullanarak şunları elde ederler:
(1)
Nerede girdi, sınıf ve tahmin edilen sınıf (sanırım, tanımlanmamış). Devam ederek şunları söylüyorlar:
(2)
Nerede girdi boyutu ve Emin değilim (yine her ikisi de tanımsız). Sigmoid aktivasyon fonksiyonu ile sigmoidal bir nöron göz önüne alındığında ve ön aktivasyon , (2) 'ye (1) yerleştirdikten sonra optimum ağırlık değerlerini alıyoruz ve , girdi değerleri .
Şimdi sorularıma geçelim. (2) 'yi (1)' e eklemenin optimal ağırlık ve giriş değerlerine nasıl yol açtığını anlıyorum. Ancak anlamadığım şey şudur:
- (1) Bayes teoremi kullanılarak nasıl türetilir?
- (2) nasıl türetilir? Nedir? Bunun anlamı nedir? Şartlı bağımsızlıkla bir ilgisi olduğunu düşünüyorum
- X'in boyutları şartlı olarak bağımsız olsa bile, kişi ölçeklendirilmiş olasılığına eşit olduğunu nasıl belirtebilir? (yani nasıl ifade edebilirsiniz?)
EDIT: Değişken bir ikili sınıf değişkenidir. Bundan varsayıyorum ki"diğer" sınıftır. Bu soru 1'i çözecektir. Kabul ediyor musunuz?