Coursera'da Machine Learning Stanford kursunu yapıyorum.
Lojistik Regresyon bölümünde, maliyet fonksiyonu şudur:
Maliyet fonksiyonunun türevini almaya çalıştım ama tamamen farklı bir şey aldım.
Türev nasıl elde edilir?
Aracı adımlar nelerdir?
Coursera'da Machine Learning Stanford kursunu yapıyorum.
Lojistik Regresyon bölümünde, maliyet fonksiyonu şudur:
Maliyet fonksiyonunun türevini almaya çalıştım ama tamamen farklı bir şey aldım.
Türev nasıl elde edilir?
Aracı adımlar nelerdir?
Yanıtlar:
Andrew Ng's Coursera Machine Learning kursu sayfasındaki öğrencilerin kattığı notların dışında (bu türev dahil) mevcut görmediğim ders notlarından uyarlanmıştır .
Aşağıda, üst simge bireysel ölçümleri veya "örnekleri" eğitimi gösterir.
Sigmoid fonksiyonunun türevi
Maddenin aşırı karmaşıklığı izlenimini önlemek için, çözümün yapısını görelim.
Sadeleştirme ve bazı gösterimlerin kötüye kullanılması ile ifadesi cinsinden bir terim olsun ve işlevidir. :
Bu zincir kuralı kullanabilir: ve tek çözmek bir ( ve sabittir).
Son olarak, .
Sonuçların bir araya getirilmesi aranan ifadeyi verir: olur.
Bu cevabın kredisi, bu sayfada daha belirgin bir yeri hak ettiğini düşündüğüm yorumlardan Antoni Parellada'ya gidiyor (diğer pek çok cevap vermediğinde bana yardımcı olduğu gibi). Ayrıca, bu tam bir türetme değil, ifadesinin açık bir ifadesidir . (Tam türetme için diğer cevaplara bakınız).
nerede
Aynı zamanda, gradyanı hesaplamak isteyenler için bir Python uygulama göre .
import numpy
def sig(z):
return 1/(1+np.e**-(z))
def compute_grad(X, y, w):
"""
Compute gradient of cross entropy function with sigmoidal probabilities
Args:
X (numpy.ndarray): examples. Individuals in rows, features in columns
y (numpy.ndarray): labels. Vector corresponding to rows in X
w (numpy.ndarray): weight vector
Returns:
numpy.ndarray
"""
m = X.shape[0]
Z = w.dot(X.T)
A = sig(Z)
return (-1/ m) * (X.T * (A - y)).sum(axis=1)
Analizde çok güçlü olmayan, ancak maliyet fonksiyonunu ayarlamakla uğraşmak ve türev hesaplamak için bir yol bulmak isteyen bizler için ... hesaplamayı yeniden öğrenmek için kısa bir yol otomatik olarak hesaplamak için bu çevrimiçi araçtır türetme, kuralın adım adım açıklamalarıyla birlikte.