Fisher metrik ve bağıl entropi arasındaki bağlantı


20

Birisi Fisher bilgi metriği ile bağıl entropi (veya KL diverjansı) arasındaki aşağıdaki bağlantıyı tamamen matematiksel bir titizlikle kanıtlayabilir mi?

D(p(,a+da)p(,a))=12gi,jdaidaj+(O(da3)
burada a=(a1,,an),da=(da1,,dan) ,
gi,j=i(logp(x;a))j(logp(x;a)) p(x;a) dx
ve gi,jdaidaj:=i,jgi,jdaidaj Einstein toplama kuralıdır.

Yukarıdakileri, John Baez'in Vasileios Anagnostopoulos'un bu konuda yorumlarda söylediği güzel blogunda buldum .


1
Sevgili Kumara: Açıklamak gerekirse, gösterimlerinizi, özellikle g_ {i, j} ' nin anlamını daha iyi açıklamanıza yardımcı olacaktır gi,j. Ayrıca, ifadenizin ekran denkleminin sağ tarafının ilk teriminin önünde 1/2 sabit bir faktörün eksik olduğunu düşünüyorum 1/2. Kullback'in kendisinin ıraksama ( J (\ cdot, \ cdot) gösterimini kullanarak J(,)) olarak adlandırdığı şeyin KL ıraksaması olarak bilinen şeyin simetize edilmiş sürümü olduğunu, yani J(p,q)=D(pq)+D(qp) . KL sapması, Kullback'in yazılarında I (\ cdot, \ cdot) olarak gösterildi I(,). Bu da 1/2 faktörünü açıklar 1/2. Şerefe.
kardinal

Yanıtlar:


19

1946'da, jeofizikçi ve Bayesci istatistikçi Harold Jeffreys bugün Kullback-Leibler sapması dediğimiz şeyi tanıttı ve "sonsuz derecede yakın" iki dağıtım için keşfetti (umarım Math SE adamları bunu görmez ;-) yazabiliriz katsayıları Fisher bilgi matrisinin elemanları tarafından verilen kuadratik bir form olarak Kullback-Leibler ayrışmaları. Bu kuadratik formu bir Riemann manifoldunun uzunluğu unsuru olarak yorumladı ve Fisher bilgileri Riemann metriğinin rolünü oynadı. İstatistiksel modelin bu geometrileşmesinden, Jeffrey'lerini önce Riemann metriğinin doğal olarak indüklediği ölçü olarak türetmiştir ve bu ölçü, genel olarak, sınırlı bir ölçü olmamasına rağmen, manifold üzerinde kendinden düzgün bir dağılım olarak yorumlanabilir.

Titiz bir kanıt yazmak için, tüm düzenlilik koşullarını tespit etmeniz ve Taylor genişlemelerindeki hata koşullarının sırasına dikkat etmeniz gerekir. İşte argümanın kısa bir taslağı.

ve iki yoğunluğu arasındaki simetrik Kullback-Leibler sapması şu şekilde tanımlanır:fg

D[f,g]=(f(x)-g(x))günlük(f(x)g(x))dx.

Biz parametreli yoğunluğu ailesini varsa ardındanθ=(θ1,...,θk)

D[p(|θ),p(|θ+Δθ)]=(p(x,|θ)-p(x|θ+Δθ))günlük(p(x|θ)p(x|θ+Δθ))dx,
ki burada . notasyonuyla bazı basit cebirler Doğal logaritma için Taylor genişlemesini kullanarak, Δθ=(Δθ1,...,Δθk)
Δp(x|θ)=p(x|θ)-p(x|θ+Δθ),
D[p(θ),p(θ+Δθ)]=Δp(xθ)p(xθ)log(1+Δp(xθ)p(xθ))p(xθ)dx.
log(1+Δp(xθ)p(xθ))Δp(xθ)p(xθ),
D [ p ( ve bu nedenle Ancak Bu nedenle ;
D[p(θ),p(θ+Δθ)](Δp(xθ)p(xθ))2p(xθ)dx.
Δp(xθ)p(xθ)1p(xθ)i=1kp(xθ)θiΔθi=i=1klogp(xθ)θiΔθi.
D[p(θ),p(θ+Δθ)]i,j=1kgijΔθiΔθj,
gij=logp(xθ)θilogp(xθ)θjp(xθ)dx.

Bu orijinal kağıt:

Jeffreys, H. (1946). Tahmin problemlerinde önceki olasılık için değişmez bir form. Proc. Kraliyet Soc. Londra, Seri A, 186, 453-461.


1
Güzel yazı için çok teşekkür ederim. Eğer yardımcı olursanız iyi olurdu bu yanı.
Kumara

Evet, haklı olarak dedin. Bu "soyutlama tuzağından" çıkmalıyım.
Kumara

@zen Logaritmanın Taylor genişlemesini integral altında kullanıyorsunuz, bu neden geçerli?
Sus20200

1
Standart KL diverjansının aksine, simetrik KL sapması ile başlamanız çok önemlidir. Wikipedia makalesinde simetrik sürümden bahsedilmiyor ve bu yüzden yanlış olabilir. tr.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence
Cerrahi Komutan

11

Olağan (simetrik olmayan) KL sapmasının kanıtı

Zen'in cevabı simetrik KL sapmasını kullanır, ancak sonuç normal form için de geçerlidir, çünkü sonsuz derecede yakın dağılımlar için simetrik hale gelir.

İşte bir skaler tarafından parametrelenen ayrık dağılımlar için bir kanıt (tembel olduğum için), ancak sürekli dağılımlar veya bir parametre vektörü için kolayca yeniden yazılabilir:θ

D(pθ,pθ+dθ)=Σpθgünlükpθ-Σpθgünlükpθ+dθ .
Taylor son terimi genişletiyor: Bazı düzenlilikleri varsayarsak, iki sonucu kullandım:
=Σpθgünlükpθ-Σpθgünlükpθ= 0-dθΣpθddθgünlükpθ= 0 -12dθ2Σpθd2dθ2günlükpθ=-Σpθ(ddθgünlükpθ)2 +O(dθ3)=12dθ2Σpθ(ddθgünlükpθ)2Fisher bilgileri+O(dθ3).
:Σpθddθgünlükpθ=Σddθpθ=ddθΣpθ=0,

:Σpθd2dθ2günlükpθ=Σpθddθ(1pθdpθdθ)=Σpθ[1pθd2pθdθ-(1pθdpθdθ)2]=Σd2pθdθ2-Σpθ(1pθdpθdθ)2=d2dθ2Σpθ= 0-Σpθ(ddθgünlükpθ)2.

4

Aşağıdaki makalenin denkleminde (3) benzer bir ilişki (tek boyutlu bir parametre için) bulabilirsiniz

D. Guo (2009), Bağıl Entropi ve Skor Fonksiyonu: Keyfi Katkı pertürbasyon aracılığıyla Yeni Bilgiler-Tahmin İlişkiler , içinde Proc. IEEE Uluslararası Bilgi Teorisi Sempozyumu , 814-818. ( kararlı bağlantı ).

Yazarlar

S. Kullback, Bilgi Kuramı ve İstatistik . New York: Dover, 1968.

bu sonucun bir kanıtı için.


1
Bu yazının denkleminin (3) çok değişkenli bir versiyonu 27-28. Sayfalardaki alıntılanan Kullback metninde kanıtlanmıştır. sabiti OP'nin sorusunda kaybolmuş gibi görünüyor. :)1/2
kardinal
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.