1. Örnek
Tipik bir durum, doğal dil işleme bağlamında etiketlemedir . Ayrıntılı bir açıklama için buraya bakın . Fikir temel olarak bir cümledeki bir kelimenin sözcük kategorisini belirleyebilmektir (bir isim, bir sıfat, ...). Temel fikir, gizli bir markov modelinden ( HMM ) oluşan bir dil modeline sahip olmanızdır . Bu modelde, gizli durumlar sözcük kategorilerine ve gözlenen durumlar gerçek kelimelere karşılık gelir.
İlgili grafik model şu şekildedir:
burada cümledeki sözcük dizisidir ve dizidir Etiketlery=(y1,...,yN)x=(x1,...,xN)
Eğitildikten sonra amaç, belirli bir giriş cümlesine karşılık gelen sözcük kategorilerinin doğru sırasını bulmaktır. Bu, dil modeli tarafından üretilmesi en uygun / en muhtemel olan etiket dizisini bulmak, yani
f(y)=argmaxx∈Yp(x)p(y|x)
2. Örnek
Aslında daha iyi bir örnek regresyon olabilir. Sadece anlaşılması daha kolay olduğu için değil, aynı zamanda maksimum olabilirlik (ML) ve maksimum arasındaki bir posteriori (MAP) arasındaki farkları netleştirdiği için.
Temel olarak, sorun, örnekleri tarafından verilen bazı fonksiyonların bir dizi temel fonksiyonun doğrusal bir kombinasyonuyla uydurulmasıdır ,
burada temel işlevlerdir ve ağırlıklardır. Genellikle örneklerin Gauss gürültüsü tarafından bozulduğu varsayılır. Bu nedenle, hedef fonksiyonun tam olarak böyle doğrusal bir kombinasyon olarak yazılabileceğini varsayarsak,t
y(x;w)=∑iwiϕi(x)
ϕ(x)w
t=y(x;w)+ϵ
bu yüzden
Bu sorunun ML çözümü en aza indirmeye eşdeğerdir,p(t|w)=N(t|y(x;w))
E(w)=12∑n(tn−wTϕ(xn))2
ki bu en iyi bilinen en küçük kare hata çözeltisini verir. Şimdi, ML gürültüye duyarlıdır ve belirli koşullar altında kararlı değildir. MAP, ağırlıklar üzerinde kısıtlamalar koyarak daha iyi çözümler bulmanızı sağlar. Örneğin, tipik bir durum, ağırlıkların mümkün olduğunca küçük bir norm olmasını talep ettiğiniz sırt regresyonudur,
E(w)=12∑n(tn−wTϕ(xn))2+λ∑kw2k
öncesinde bir Gauss ayarı yapmaya eşdeğerdir . Toplamda, tahmini ağırlıklarN(w|0,λ−1I)
w=argminwp(w;λ)p(t|w;ϕ)
MAP'de ağırlıkların ML'deki parametreler değil, rastgele değişkenler olduğuna dikkat edin. Bununla birlikte, hem ML hem de MAP nokta tahmin edicilerdir (optimal ağırlıkların dağılımı yerine en uygun ağırlık kümesini döndürürler).