Öğelerin toplamı sıfır olduğunda önerdiğiniz işlevin tekilliği vardır.
Vektörünüzün diyelim [ - 1 , 13, 23]. Bu vektörün toplamı 0'dır, bu nedenle bölme tanımlanmamıştır. İşlev burada ayırt edilemez.
Ek olarak, vektörün bir veya daha fazla elemanı negatifse, ancak toplam sıfır değilse, sonucunuz bir olasılık değildir.
Vektörünüzün [ - 1 , 0 , 2 ] olduğunu varsayalım . Bunun toplamı 1'dir, bu nedenle işlevinizi uygulamanız , negatif elemanlara ve 1'den fazla elemanlara sahip olduğu için olasılık vektörü olmayan [ - 1 , 0 , 2 ] ile sonuçlanır.
Daha geniş bir bakış açısıyla, ikili lojistik regresyonun üç veya daha fazla kategorik sonuç durumuna genişletilmesi perspektifinden softmax fonksiyonunun özel formunu motive edebiliriz.
Yorumlarda önerildiği gibi mutlak değerler veya kareler almak gibi şeyler yapmak, ve aynı öngörülen olasılığa sahip olduğu anlamına gelir ; bu, modelin tanımlanmadığı anlamına gelir . Buna karşılık, tüm gerçek için monotonik ve pozitiftir , bu nedenle softmax sonucu (1) bir olasılık vektörü ve (2) multinomiyal lojistik modeli tanımlanır.- xexp ( x ) xxexp( x )x