Karşılıklı karşılıklı bilgi üzerinde verilen karşılıklı bilgilerin sınırlanması


18

Diyelim ki iki küme ve Y ve bu kümeler üzerinde ortak olasılık dağılımı p (x, y) . P (x) ve p (y) 'nin sırasıyla X ve Y üzerindeki marjinal dağılımları göstermesine izin verin .X XY Yp ( x , y ) p(x,y)p ( x ) p(x)p ( y ) p(y)X XYY

XX ve Y arasındaki karşılıklı bilgi YYşu şekilde tanımlanır: I ( X ; Y ) = x , y p ( x , y ) günlük ( p ( x , y )p ( x ) p ( y ) )

I(X;Y)=x,yp(x,y)log(p(x,y)p(x)p(y))

yani, noktasal karşılıklı bilginin ortalama değeri pmi ( x , y ) günlük ( p ( x , y )p ( x ) p ( y ) )(x,y)log(p(x,y)p(x)p(y)) .

Diyelim ki pmi'de üst ve alt sınırları biliyorum (x,y)(x,y) : yani tüm x,yx,y için aşağıdakilerin geçerli olduğunu biliyorum : klog(p(x,y)p(x)p(y))k

klog(p(x,y)p(x)p(y))k

Hangi üst sınır I (X; Y) için ima eder I(X;Y)I(X;Y). Tabii ki I(X;Y)kI(X;Y)k , ancak mümkünse daha sıkı bir bağlantı istiyorum. Bu bana mantıklı geliyor çünkü p bir olasılık dağılımını tanımlar ve pmi (x,y)(x,y) her xx ve y değeri için maksimum değerini (hatta negatif olamaz ) alamaz yy.


1
Eklem ve marjinal olasılıklar tekdüze olduğunda, pmi ( xx , yy ) eşit olarak sıfırdır (ve bu nedenle negatif değildir, görünüşte son ifadenizle çelişir, ancak zar zor). Bana öyle geliyor ki, yanılmıyorsam, bu durumu X \ times Y'nin küçük alt kümeleri X×YX×Yüzerinde bozmak, pmi üzerindeki sınırların ben (X; Y) hakkında neredeyse hiçbir şey söylemediğini I(X;Y)I(X;Y)gösterir.
whuber

1
Aslında, XX ve YY bağımsızsa, marjinal dağılımdan bağımsız olarak pmi(x,y)pmi(x,y) sabittir. Böylece dağılımları bir bütün sınıfı vardır p(x,y)p(x,y) olduğu için pmi(x,y)pmi(x,y) her için en yüksek değeri elde xx ve yy .
kardinal

Evet, pmi'nin (x,y)(x,y) tüm xx ve y için eşit olabileceği kesinlikle doğrudur yy, ancak bu daha sıkı bir bağlamayı dışlamaz. Örneğin, I (X; Y) \ leq k (e ^ k-1) olduğunu kanıtlamak zor değildir I(X;Y)k(ek1)I(X;Y)k(ek1). Bu k2k2 olduğunda k<1k<1 ve bağlı olmayan bir önemsiz güçlendirilmesi k k <1 . Daha genel olarak önemsiz sınırlar olup olmadığını merak ediyorum. kkk<1k<1
Florian

1
için den daha iyi bir bağlanma alacağınızdan şüpheliyim . Daha sert görünmek istiyorsanız, sorunuzu p (x) p (y) ve p (x, y) arasındaki KL sapması açısından yeniden çerçevelemeyi deneyin. Pinsker Eşitsizliği, MI üzerinde benim önsezimi teyit edebilecek bir alt sınır sağlar. Ayrıca bkz. Ajmaa.org/RGMIA/papers/v2n4/relog.pdf Bölüm 4 . O(k2)O(k2)k0k0
vqv

Yanıtlar:


5

Katkım bir örnekten oluşuyor. Noktasal karşılıklı bilgi üzerinde sınırlar verildiğinde karşılıklı bilginin nasıl sınırlanabileceğine dair bazı sınırlamaları gösterir.

Al ve tüm . Herhangi biri için izin denklemine çözüm Sonra nokta kütle yer de mil ürün puan alanda \ {1, \ ldots, n \} ^ 2 olduğu şekilde m, her satır, her sütundaki bu noktaların. (Bu çeşitli yollarla yapılabilir. Örneğin, ilk satırdaki ilk m noktaları ile başlayın ve sonra m'yi kaydırarak kalan satırları doldurun.X=Y={1,,n}X=Y={1,,n}p(x)=1/nxXm{1,,n/2}k>0mek+(nm)ek=n.

ek/n2nm{1,,n}2mmmher satır için bir döngüsel sınır koşulu ile bir sağa işaret eder). Kalan n ^ 2 - nm noktalarına e ^ {- k} / n ^ 2 nokta kütlesini yerleştiriyoruz . Bu nokta kütlelerinin toplamı \ frac {nm} {n ^ 2} e ^ {k} + \ frac {n ^ 2 - nm} {n ^ 2} e ^ {- k} = \ frac {me ^ k + (nm) e ^ {- k}} {n} = 1, böylece bir olasılık ölçüsü veriyorlar. Tüm marjinal nokta olasılıkları \ frac {m} {n ^ 2} e ^ {k} + \ frac {m - n} {n ^ 2} e ^ {- k} = \ frac {1} {n}, böylece her iki marjinal dağılım da aynıdır.ek/n2n2nmnmn2ek+n2nmn2ek=mek+(nm)ekn=1,
mn2ek+mnn2ek=1n,

Yapım tüm ve (bazılarının ardından) hesaplamalar) ile karşılıklı bilgi davranıyor için gibi için .pmi(x,y){k,k},x,y{1,,n}I(X;Y)=knmn2ekkn2nmn2ek=k(1ekekek(ek+ek)ek),

k2/2k0kk


1

Aradığınız şeyin bu olup olmadığından emin değilim, çünkü çoğunlukla cebirseldir ve p'nin bir olasılık dağılımı olmasının özelliklerini gerçekten kullanmıyor, ama burada deneyebileceğiniz bir şey var.

Pmi'deki sınırlar nedeniyle açıkça ve dolayısıyla . Biz yerini alabilir olarak elde etmek içinp(x,y)p(x)p(y)ekp(x,y)p(x)p(y)ekp(x,y)I(X;Y)I(X;Y)x,yp(x)p(y)eklog(p(x)p(y)ekp(x)p(y))=x,yp(x)p(y)ekk

Bunun yararlı olup olmadığından emin değilim.

DÜZENLEME: Daha fazla inceleme üzerine bu aslında k orijinal üst sınır daha az yararlı olduğuna inanıyorum. Bir başlangıç ​​noktasında ipucu vermesi ihtimaline karşı bunu silmeyeceğim.


Bu sınırın değeri, ve ( beri ) not ettikten sonra görünür . x,yp(x)p(y)=1k0ek1
whuber

Evet, düzenlememi yaptığımı fark ettiğimde.
Michael McGowan
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.