Uzaklık korelasyonu ile karşılıklı bilgi


15

Bir süredir karşılıklı bilgilerle çalıştım. Ancak, "mesafe korelasyonu" (Brownian korelasyonu olarak da adlandırılır) denilen dağıtım bağımsızlığını ölçmek için de kullanılabilecek "korelasyon dünyasında" çok yeni bir önlem buldum: http://en.wikipedia.org/wiki/Brownian_covariance . Bu tedbirin uygulandığı kağıtları kontrol ettim, ancak karşılıklı bilgilere herhangi bir gerekçe bulamadan.

Yani, sorularım:

  • Aynı sorunu çözüyorlar mı? Değilse, problemler nasıl farklıdır?
  • Ve eğer önceki soru pozitif olarak cevaplanabilirse, birini veya diğerini kullanmanın avantajları nelerdir?

Basit bir örnek için açıkça 'mesafe korelasyonu' ve 'karşılıklı bilgi' yazmayı deneyin. İkinci durumda, ilk sıradayken logaritmalar alacaksınız.
Piotr Migdal

@PiotrMigdal Evet, bu farkın farkındayım. Bunun neden önemli olduğunu açıklayabilir misiniz? Lütfen, bir istatistikçi olmadığımı göz önünde bulundurun ...
dsign

Ma için olasılık dağılımlarının karşılıklı bağımlılığını ölçen standart bir araç karşılıklı bilgidir. Çok güzel özelliklere sahip ve yorumu basit. Bununla birlikte, mesafe korelasyonunun tercih edildiği belirli problemler olabilir (ancak hayatımda hiç kullanmadım). Peki çözmeye çalıştığınız problem nedir?
Piotr Migdal

2
Bu yorum birkaç yıl gecikti ancak Columbia Üniversitesi İstatistik Bölümü 2013-2014 akademik yılını bağımlılık ölçütlerine odaklanmanın bir yılı haline getirdi. Nisan-Mayıs 2014'te Reshef Kardeşler (MIC), Gabor Szekely (mesafe korelasyonları), Subhadeep Mukhopadhay da dahil olmak üzere bu alanda iş yapan en iyi akademisyenleri bir araya getiren bir atölye düzenlendi. İşte sunumlardan birçok pdfs içeren programın bir bağlantısı. dependsence2013.wikischolars.columbia.edu/…
Mike Hunter

Yanıtlar:


9

Bilgi / karşılıklı bilgi olası değerlere bağlı değildir, sadece olasılıklara bağlıdır, bu nedenle daha az duyarlıdır. Mesafe korelasyonu daha güçlü ve hesaplanması daha kolaydır. Karşılaştırma için bkz.

http://www-stat.stanford.edu/~tibs/reshef/comment.pdf


2
Merhaba, Cevabınız için teşekkürler! Bahsettiğiniz kağıt MIC ile ilgili, ki sanırım MI'dan biraz daha fazla. Mesafe korelasyon ölçüsünü uyguladım ve ayrık kategorik değişkenlerin temel durumu için MI'dan daha basit olduğunu düşünmüyorum. Sonra tekrar öğrendiğim bir şey, DCM'nin sürekli değişkenler için iyi tanımlanmış ve iyi davranmış olmasıdır, ancak MI ile binning veya süslü şeyler ala MIC yapmanız gerekir.
dsign

3
Bununla birlikte, DCM'nin tarafı örnek sayısı olan kare matrislere ihtiyacı olduğu görülmektedir. Başka bir deyişle, uzay karmaşıklığı karesel olarak ölçeklenir. Ya da en azından benim izlenimim, bir hata yapmak istiyorum. MIC daha iyisini yapar, çünkü bunu hassasiyet ve performans arasında bir çeşit uzlaşma ile ayarlayabilirsiniz.
dsign
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.