Karşılıklı bilgi fikrini bu ders notlarında (sayfa 5) açıklandığı gibi özellik seçimine uygulamaya çalışıyorum .
Platformum Matlab. Ampirik verilerden karşılıklı bilgi hesaplarken bulduğum bir problem, sayının her zaman yukarıya doğru eğimli olmasıdır. Matlab Central'da MI değerini hesaplamak için yaklaşık 3 ~ 4 farklı dosya buldum ve bağımsız rastgele değişkenlerle beslendiğimde hepsi büyük sayılar (> 0.4 gibi) veriyor.
Ben bir uzman değilim, ama sorun şu ki, MI'yı hesaplamak için sadece eklem ve marjinal yoğunlukları kullanırsanız, MI, tanım gereği pozitif olduğu için süreçte yanlılık ortaya çıkar. Karşılıklı bilgilerin doğru bir şekilde nasıl tahmin edileceği konusunda pratik tavsiyesi olan var mı?
İlgili bir soru, pratikte insanlar özellikleri seçmek için MI'yı gerçekten nasıl kullanıyor? MI, teorik olarak sınırsız olduğu için bir eşik değeri nasıl ortaya çıkacağı benim için belli değil. Ya da insanlar özellikleri MI'ya göre sıralıyor ve en iyi k özelliklerini mi alıyor?