Bence değerlendirebilirsin f ve gnormalleştirici bir sabite kadar. Göstermekf(x)=fu(x)/cf ve g(x)=gu(x)/cg.
Kullanılabilecek tutarlı bir tahmin edici
DKLˆ(f||g)=[n−1∑jfu(xj)/πf(xj)]−11N∑iN[log(fu(zi)gu(zi))fu(zi)πr(zi)]−log(r^)
nerede
r^=1/n1/n∑jfu(xj)/πf(xj)∑jgu(yj)/πg(yj).(1)
oran için önemli bir örnekleme tahmin edicisidir
cf/cg. Burada kullan
πf ve
πg enstrümantal yoğunluk olarak
fu ve
gu sırasıyla ve
πr normal olmayan yoğunlukların log oranını hedeflemek.
İzin ver {xi}∼πf, {yi}∼πg, ve {zi}∼πr. (1) 'in payıcf. Payda yakınsarcg. Oran, sürekli haritalama teoremi ile tutarlıdır. Oranın günlüğü tekrar sürekli haritalama ile tutarlıdır.
Tahmincinin diğer kısmı ile ilgili olarak,
1N∑iN[log(fu(zi)gu(zi))fu(zi)πr(zi)]→ascfE[log(fu(zi)gu(zi))]
büyük sayılar kanunu.
Motivasyonum şu:
DKL( f| | g)=∫∞- ∞f( x ) günlük(f( x )g( x )) dx=∫∞- ∞f( x ) { günlük[fu( x )gu( x )] +günlük[cgcf] } dx=Ef[ logfu( x )gu( x )] +günlük[cgcf]=c- 1fEπr[ logfu( x )gu( x )fu( x )πr( x )] +günlük[cgcf] .
Bu yüzden onu izlenebilir parçalara ayırıyorum.
Olabilirlik oranının nasıl simüle edileceğiyle ilgili daha fazla fikir için, birkaç tane içeren bir kağıt buldum:
https://projecteuclid.org/download/pdf_1/euclid.aos/1031594732