Olasılık olarak Karşılıklı Bilgi


11

Ortak entropi üzerinde karşılıklı bilgi olabilir mi:

0ben(X,Y)'H(X,Y)1

"X'den Y'ye bir parça bilgi aktarma olasılığı" olarak tanımlanabilir mi?

Çok naif olduğum için üzgünüm, ama hiçbir zaman bilgi teorisi üzerinde çalışmadım ve sadece bununla ilgili bazı kavramları anlamaya çalışıyorum.


1
CV'ye hoş geldiniz, luca maggi! Ne kadar güzel bir ilk soru!
Alexis

Yanıtlar:


8

Tanımladığınız ölçüme Bilgi Kalite Oranı [IQR] denir (Wijaya, Sarno ve Zulaika, 2017). IQR karşılıklı bilgi "toplam belirsizlik" (ortak entropi) ile bölünür (resim kaynağı: Wijaya, Sarno ve Zulaika, 2017).I(X,Y)H(X,Y)

resim açıklamasını buraya girin

Wijaya, Sarno ve Zulaika (2017) tarafından tarif edildiği gibi,

IQR aralığı . DWT bilgi kaybetmeden bir sinyali mükemmel bir şekilde yeniden kurabilirse en büyük değere (IQR = 1) ulaşılabilir. Aksi takdirde, en düşük değer (IQR = 0) MWT'nin orijinal bir sinyalle uyumlu olmadığı anlamına gelir. Diğer bir deyişle, belirli MWT'ye sahip yeniden yapılandırılmış bir sinyal temel bilgileri tutamaz ve orijinal sinyal özellikleri ile tamamen farklı olamaz.[0,1]

Bunu, bilgi kaybetmeden sinyalin mükemmel bir şekilde yeniden inşa edilme olasılığı olarak yorumlayabilirsiniz . Bu tür yorumlamanın, öznelliğin olasılık yorumuna , daha sonra da geleneksel, sıkça yorumlanmaya daha yakın olduğuna dikkat edin .

IQR = 1, yeniden yapılandırılmış bilginin güvenilir olduğuna inandığımız anlamına gelir ve IQR = 0 bunun tersi anlamına gelir. İkili olayların olasılıklarının tüm özelliklerini paylaşır. Ayrıca, entropiler olasılıklarla bir dizi başka özelliği paylaşır (örneğin, koşullu entropilerin tanımı, bağımsızlık vb.). Bu yüzden bir olasılık gibi görünüyor ve bunun gibi quacks.


Wijaya, DR, Sarno, R. ve Zulaika, E. (2017). Anne dalgacık seçimi için yeni bir metrik olarak Bilgi Kalite Oranı. Kemometri ve Akıllı Laboratuvar Sistemleri, 160, 59-71.


1
Nasıl için IQR fonksiyonunu tanımlanır olasılık ölçüsünün tanımlayan özellikleri karşı kontrol etmek için? X : = X I ( A ) ile I ( X , Y ) ve H ( X , Y ) ekliyor musunuz ,birΩI(X,Y)'H(X',Y')bir karakteristik fonksiyonudur? X': =Xben(bir),Y': =Yben(bir)ben
Hans

Sorum, tek başına değil, cevabınızın bir kısmına yönelik. Yeni bir soru açmamı ve bağlantıyı yanıtlamamı mı öneriyorum?
Hans

@Hans Söylediğim, bu önlemin tanıma kolayca uyması, yanılıyorsam beni düzelt. Aksiyomlar 1. ve 2. açıktır. Aksiyom 3 için, örtüşme, H ( X , Y ) toplam boşluktur, bu nedenle fraksiyon kolayca olasılık olarak görülebilir. ben(X,Y)'H(X,Y)
Tim

1
Bir olasılık, bir örnek uzayında ve onun sigma alanında . Bu olasılık ölçüsü IQR için bunların ne olduğu konusunda kafam karıştı. Rastgele X ve Y değişkenleri için tanımlanan olasılık ölçüsü için zaten bir örnek alan ve onun sigma alanı vardır . Yeni olasılık ölçüsü IQR'nin örnek alanı ve alanı, X ve Y ile ilişkili eski olasılık ölçüsüyle aynı mıdır? Değilse, nasıl tanımlanırlar? Yoksa bunların tanımlanmasının gerekmediğini mi söylüyorsunuz? O zaman aksiyomlara karşı nasıl kontrol edersiniz? (Ω,F)XYXY
Hans

@Açıkça bunun aksiyomlarla tutarlı olduğunu belirtmiştim, ancak bunun tam olarak ne olabileceğini söylemek zor. Önerdiğim yorum muhtemelen sinyali yeniden yapılandırıyor. Bu X veya Y'nin olasılık dağılımı değildir. Sanırım onu ​​yorumlamak ve anlamak için daha derine inebilirsiniz. Soru, bunun olasılık olarak yorumlanıp yorumlanamayacağı ve yanıtın resmi olarak evet olmasıydı.
Tim

2

İşte olasılık uzayının tanımı. Oradaki notasyonları kullanalım. IQR bir demetin bir fonksiyonudur (Ω,F,P,X,Y) (İlk üç bileşen, iki rastgele değişkenin tanımlandığı olasılık alanını oluşturur). Bir olasılık ölçüsü, Tim'in cevabında listelenen tanımın tüm koşullarını karşılayan bir ayar fonksiyonu olmalıdır. Bir belirtmek gerekir Θ:=(Ω,F,P,X,Y) bir kümenin bir alt kümesi olarak Ω~ . Ayrıca, Θ's alt kümelerinin bir alan oluşturmak için olan Ω~ ve bu IQR(Ω,F,P,X,Y) Tim yanıt listelenen olasılık ölçü tanımında sıralanan her üç niteliği de karşılamak zorundadır. Kişi böyle bir nesneyi inşa edene kadar, IQR'nin bir olasılık ölçüsü olduğunu söylemek yanlıştır. Biri için böyle karmaşık bir olasılık ölçüsünün faydasını görmüyorum (IQR fonksiyonunun kendisi değil, bir olasılık ölçüsü olarak). Tim'in cevabında belirtilen makalede IQR, olasılık olarak değil, bir metrik olarak çağrılır veya kullanılır (Birincisi, ikincisinin bir türüdür, ancak ikincisi, birincisi değildir.).

Öte yandan, [ 0 , 1 ] üzerindeki herhangi bir sayının olasılık olmasını sağlayan önemsiz bir yapı vardır . Özellikle bizim durumumuzda, herhangi bir düşünün İçeride ISTV melerin RWMAIWi'nin . Örnek alanı olarak iki öğeli bir dizi çekme ~ Ω : = { a , b } , alan olsun ~ F : = 2 ~ Ω ve olasılık ölçü koymuştur ~ P ( a ) : = IQR ( Θ ) . Tarafından endekslenmiş bir olasılık uzayları sınıfımız var[0,1]ΘΩ~:={a,b}F~:=2Ω~P~(bir): =IQR(Θ)Θ .


Bilginiz için, basitleştirmek ve açıklığa kavuşturmak için cevabımı düzenledim. Olasılık , bazı özel özelliklere sahip bir metriktir. Tüm olası mesaj çiftlerinden ve bunların yeniden yapılandırılmasından bahsediyoruz . Burada rastgele değişken, yeniden yapılanmanın "iyi" olup olmadığını bize bildiren karmaşık, bilinmeyen bir işlevdir. Güvenilir bir yeniden yapılanmanın geri dönüşü ikili bir olay olarak düşünülebilir, cevabım basitçe IQR'nin bu tür bir olayın olasılığı (ya da daha doğrusu yaklaşık olması) olarak düşünülebilmesidir. (xi,yi)
Tim

@Tim: Cevabınızın önceki sürümü, kişinin kontrol edebileceği net bir tanım sağladığı için çok daha iyi bir cevaptır. Bir tanımı atlatmanın bir yolu yoktur. Olasılık bir metriktir, ancak "bazı özel özelliklere" sahip tüm metrikler bir olasılık değildir. Bu metriğin tanıma uygun tüm "özel özelliklerini" doğrulayana kadar, tek değil. Ancak, bir parametre tuple tarafından indekslenen olasılık alanlarının bir sınıfı önemsiz bir yapı elde mi . Θ: =(Ω,F,P,X,Y)
Hans

Sonunda sigmoid aktivasyon fonksiyonu ile karmaşık sinir ağını kullanırsanız, çıktının metrik teorik olarak olasılık olduğunu kanıtlayabilir misiniz? Ancak, bunu sıklıkla olasılık olarak yorumlamayı seçiyoruz.
Tim

@Tim: Tabii ki yapabilirsin. Bu, geri çekme ölçüsünü kullanarak başa çıkmak için kolay bir yöntemdir. Sigmoid işlevi, işlevin etki alanı ve aralığının ( ((geleneksel) Borel alanı ile) sigma alanlarını zaten öngören ölçülebilir bir işlevdir. Bir alt olasılığı ölçüsü A numunesi boşluk, P ( A ) : = μ ( f ( A ) ) μ arasında (konvansiyonel) Borel ölçüsüdür R ve f , sigmoid fonksiyonudur. QED[0,1]birP(bir): =μ(f(bir))μR,f
Hans

Üzgünüm, ama bu tür tartışmalar ve ölçüm teorisini hiç ilginç bulamadım, bu yüzden daha fazla tartışmadan çekeceğim. Burada da açtığınız noktayı görmüyorum, özellikle de son paragrafınız tam olarak dilencilikten söylediklerimin aynısını söylüyor.
Tim
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.