Varyasyonel Çıkarım, KL sapması gerçek gerektirir


12

Varyasyonel çıkarım (çok mütevazı) anlayışım için , aşağıdakileri optimize eden bir dağıtım bularak bilinmeyen bir dağıtım yaklaşmaya çalışır :pq

KL(p||q)=xp(x)logp(x)q(x)

Ne zaman varyasyonsal çıkarımları anlamak için zaman harcadığım zaman bu formüle çarpmaya devam ediyorum ve yardım edemiyorum ama noktayı kaçırmış gibi hissediyorum. yı hesaplamak için bilmem gerekiyor gibi görünüyor . Ama bütün mesele bu dağılımı bilmiyordum .pKL(p||q)p

Değişken bir şeyi her okumaya çalıştığımda beni rahatsız eden tam da bu nokta. Neyi kaçırıyorum?

DÜZENLE :

@Wij cevabının bir sonucu olarak buraya birkaç ilave yorum ekleyeceğim, daha kesin olmaya çalışacağım.

İlgilendiğim durumlarda, aşağıdakilerin geçerli olduğunu düşünmek gerçekten de makul görünüyor;

p(θ|D)=p(D|θ)p(θ)p(D)p(D|θ)p(θ)

Bu durumda orantılı olarak neye benzemesi gerektiğini biliyordum çünkü ve için bir model seçimi yapmış olacağım . O zaman tahmin edebileceğim bir aile dağıtımı [gaussian diyelim] seçmem gerektiğini söylerken doğru olur muyum . Bu durumda normalleşmemiş yakın bir gaussian uydurmaya çalışıyorum gibi geliyor . Bu doğru mu?pp(D|θ)p(θ)qKL(p(θ|D)||q)p(D|θ)p(θ)

Eğer öyleyse, posteriorumun normal bir dağılım olduğunu varsayıyorum ve sadece dağılımı ile ilgili olarak bu dağılım için olası değerleri bulmaya çalışıyorum .KL

Yanıtlar:


7

Sana tedavi bir his var tamamen bilinmeyen bir nesne olarak. Ben öyle düşünmüyorum. Muhtemelen kaçırdığınız şey budur.p

Diyelim ki (iid) ve için ve olduğunu varsaydığımız yi çıkarmak istiyoruz. içinde model tarafından belirtilir. Bayes kuralına göre, p ( x | Y ) p ( y | x ) p ( x ) x R, dY={yi}i=1np(x|Y)p(y|x)p(x)xRd

p(x|Y)=p(x)p(Y)p(Y|x)=p(x)p(Y)i=1np(yi|x).

İlk gözlem, posterior dağılımı hakkında bir şeyler bildiğimizdir . Yukarıdaki gibi verilir. Tipik olarak, normalleştiricisi bilmiyoruz . Olabilirlik Eğer çok karmaşık, o zaman bazı karmaşık dağıtım sahip sonunda .p ( Y ) p ( y | x ) p ( x | Y )p(x|Y)p(Y)p(y|x)p(x|Y)

Varyasyonel çıkarım yapmayı mümkün kılan ikinci şey, alabileceği form üzerinde bir kısıtlama olmasıdır . Herhangi bir kısıtlama olmaksızın, genellikle inatçı olmayan olur . Tipik olarak, üstel ailenin seçilmiş bir alt kümesinde yaşadığı varsayılır. Örneğin, bu tam faktörlü Gauss dağılımlarının ailesi olabilir, yani . Bu sizin kısıt kümesi ise, o zaman her bileşeni çıkıyor verilirqargminqKL(p||q)pqqQ={i=1dqi(xi)each qi is a one-dimensional Gaussian}q

qiexp(Ejiqjlogp(x,Y)),

buradaKesin formül pek önemli değil. Nokta yaklaşıktır gerçek bilgisine dayanarak bulunabilir ve yaklaşık o formdaki varsayımına almalıdır.p(x,Y)=p(x)i=1np(yi|x).qpq

Güncelleme

Aşağıda sorudaki güncellenmiş bölüm cevaplanmaktadır. hakkında düşündüğümü fark ettim . Her zaman gerçek miktar için , yaklaşık olarak da kullanacağım . Varyasyonel çıkarımda veya varyasyonel Bayes'te ,KL(q||p(x|Y))pqq

q=argminqQKL(q||p(x|Y)).

Yukarıda belirtilen kısıtlaması ile çözüm daha önce verilen sınırlamadır . Şimdi düşünüyorsanQ

q=argminqQKL(p(x|Y)||q),

için üstel ailesinin bir alt kümesi olarak tanımlanmaktadır, bu çıkarım denir beklenti yayılımı (AP). Bu durumda çözümü , anlarının eşleştiği çözümdür .Qqp(x|Y)

Her iki durumda da, esasen KL anlamda gerçek posterior dağılıma, bazı şekil almaya kısıtlanmış bir dağılım ile yaklaşmaya çalıştığınızı söylemekte haklısınız .q


Bununla tartışamam. Sanırım bu konuda kendi parlaklığımı da içeren çoğu açıklama.
Peadar Coyle
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.