Yanıtlar:
Temel (doğrusal) korelasyon kavramını, kovaryansı ("Pearson'un korelasyon katsayısı" standartlaştırılmamış ") düşünelim. İki kesikli rassal değişken ve Y olasılık kütle fonksiyonu olan p ( x ) , p ( y ) ve eklem pmf p ( x , y ) için
İkisi arasındaki Karşılıklı Bilgi,
Bu yüzden ikisi çelişkili değiller - tamamlayıcılar, iki rastgele değişken arasındaki ilişkinin farklı yönlerini tarif ediyorlar. Karşılıklı Bilginin, ilişkinin doğrusal olup olmadığına "endişe etmediği" söylenebilir, Kovaryans sıfır olabilir ve değişkenler yine de stokastik olarak bağımlı olabilir. Öte yandan, Kovaryans, ilgili olasılık dağılımlarını bilmeye gerek kalmadan doğrudan bir veri örneğinden hesaplanabilir (Karşılıklı Bilgiler, tahminini tahmin etmek için tahmin edilmesini gerektirir). bilinmeyen, Kovaryans tahminine göre çok daha hassas ve belirsiz bir çalışmadır.
Karşılıklı bilgi, iki olasılık dağılımı arasındaki bir mesafedir. Korelasyon, iki rastgele değişken arasındaki doğrusal bir mesafedir.
Bir sembol seti için tanımlanan iki olasılık arasında karşılıklı bir bilgiye sahip olabilirken, doğal olarak bir R ^ N alanına eşlenemeyen semboller arasında bir korelasyona sahip olamazsınız.
Öte yandan, karşılıklı bilgi değişkenlerin bazı özellikleri hakkında varsayımlarda bulunmaz ... Düzgün değişkenlerle çalışıyorsanız, korelasyon size onlar hakkında daha fazla bilgi verebilir; Mesela ilişkileri monotonik ise.
Önceden bazı bilgileriniz varsa, o zaman birinden diğerine geçebilirsiniz; Tıbbi kayıtlarda "genotip A" sembollerini 1 olarak ve "genotip A" sembollerini 0 ve 1 değerleriyle eşleştirebilir ve bunun bir hastalık veya başka bir ilişki ile bir korelasyonu olup olmadığını görebilirsiniz. Benzer şekilde, sürekli (örneğin: maaş) bir değişken alabilir, onu ayrı kategorilere dönüştürebilir ve bu kategoriler ile diğer simgeler kümesi arasındaki karşılıklı bilgiyi hesaplayabilirsiniz.
İşte bir örnek.
Bu iki parselde korelasyon katsayısı sıfırdır. Ancak korelasyon sıfır olsa bile yüksek paylaşılan karşılıklı bilgi alabiliriz.
İlk olarak, eğer yüksek veya düşük bir X değerine sahipsem, o zaman yüksek bir Y değeri elde edeceğimi görüyorum. Ancak eğer X değeri orta ise, o zaman düşük bir Y değerine sahibim. X ve Y tarafından paylaşılan karşılıklı bilgiler hakkında bilgi tutar. İkinci bölümde, X bana Y hakkında hiçbir şey söylemez.
Her ikisi de özellikler arasındaki ilişkinin ölçüsü olsa da, MI korelasyon katsayısı (CE) sinüsünden daha genel olsa da, CE sadece doğrusal ilişkileri hesaba katabilir ancak MI doğrusal olmayan ilişkileri de idare edebilir.