Günlük (p (x, y)) noktası karşılıklı bilgileri nasıl normalleştirir?


9

Normalleştirilmiş karşılıklı bilgi formunu anlamaya çalışıyorum.

npmi=pmi(x,y)log(p(x,y))

Günlük eklemi olasılığı, noktasal karşılıklı bilgiyi neden [-1, 1] arasında normalleştiriyor?

Noktasal karşılıklı bilgi:

pmi=log(p(x,y)p(x)p(y))

p (x, y) [0, 1] ile sınırlıdır, bu nedenle log (p (x, y)) (, 0] ile sınırlıdır. pay, ama tam olarak nasıl olduğunu anlamıyorum.Ayrıca bana entropi hatırlatıyor , ama yine de tam ilişkiyi anlamıyorum.h=log(p(x))


Başlangıç ​​için, noktaya karşılıklı bilgi logaritma kullanır (onun yazım hatası veya başka bir miktar kullanıp kullanmadığından emin değilim ).
Piotr Migdal

Yanıtlar:


12

Vikipedi girişinde karşılıklı olarak karşılıklı bilgi :

Noktasal karşılıklı bilgi [-1, + 1] arasında normalleştirilebilir ve sonuçta birlikte asla meydana gelmemesi için -1 (sınırda), bağımsızlık için 0 ve tam bir ortak oluşum için +1 elde edilir.

Neden oluyor? Eh, için tanım noktasal karşılıklı bilgi olduğunu

pmilog[p(x,y)p(x)p(y)]=logp(x,y)logp(x)logp(y),

oysa normalleştirilmiş puansal karşılıklı bilgi için:

npmipmilogp(x,y)=log[p(x)p(y)]logp(x,y)1.

Ne zaman var:

  • ortak oluşum yok, logp(x,y), yani nmpi -1,
  • rastgele rastlantılar, logp(x,y)=log[p(x)p(y)], yani nmpi 0,
  • tam ortak oluşumlar, logp(x,y)=logp(x)=logp(y), yani nmpi 1'dir.

Npmi'nin neden aralıkta olduğunu göstermek daha eksiksiz bir yanıt olurdu [1,1]. Kanıtımı diğer cevapta görün.
Hans

1

Piotr Migdal'ın cevabı, nmpi'nin üç uç değer elde ettiği örnekleri verirken bilgilendirici olsa da, bunun aralıkta olduğunu kanıtlamaz. [1,1]. Eşitsizlik ve onun türetilmesi.

logp(x,y)logp(x,y))logp(x)logp(y)=logp(x,y)p(x)p(y)=:pmi(x;y)=logp(y|x)+logp(y|x)logp(x,y)logp(x,y)
gibi logp(A)0 for any event A. Dividing both side by the non-negative h(x,y):=logp(x,y), we have
-1NMPI(x;y): =MPI (x, y)h(x,y)1.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.