İki değişkenli dağılım arasındaki “mesafenin” ölçülmesi


28

Kaynak aramayı kolaylaştırmak için ne yapmaya çalıştığımı tanımlamak için iyi bir terminoloji arıyorum.

Yani, her biri iki ve X ile ilişkili iki A ve B noktası kümesine sahip olduğumu ve A ile B arasındaki "mesafeyi" ölçmek istediğimi - yani aynı dağılımdan örneklenmelerinin ne kadar muhtemel olduğunu varsayalım. (Dağılımların normal olduğunu varsayabilirim). Örneğin, eğer X ve Y, A ile korelasyon gösteriyorsa, ancak B'de değil, dağılımlar farklıdır.

Sezgisel olarak, A'nın kovaryans matrisini elde edeceğim ve sonra B'deki her bir noktanın oraya sığma olasılığına bakacağım ve bunun tersi (muhtemelen Mahalanobis mesafesi gibi bir şeyler kullanarak).

Ama bu biraz "geçici" ve bunu açıklamanın daha kesin bir yolu var (tabii ki pratikte ikiden fazla değişkenli ikiden fazla veri setine sahibim - hangisinin veri setlerimi belirlemeye çalışıyorum. outliers).

Teşekkürler!


Nedenini bilmiyorum ama bir Mantel testi görevinizi okuduğumda gözlerimin önünden geçti.
Roman Luštrik

Yanıtlar:



16

Hmm, Bhattacharyya mesafesi aradığım şey gibi görünüyor, Hellinger mesafesi de çalışıyor.


Bhattacharyya ve Helling'den sonra KL hakkında konuşan bir cevabı kabul ediyorsun… Sonunda seçimin neydi ve neden?
Simon C.

1
KL'nin ayrılışı olduğuna inanıyorum, ama ... 2010'daydı ve hafızam mükemmel olmaktan uzak.
Emile

ahah evet tahmin ettim ama yine de teşekkürler!
Simon C.

9

Sezgisel

  • Minkowsky biçimli
  • Ağırlıklı Ortalama Varyans (WMV)

Parametrik olmayan test istatistikleri

  • 2 (Ki Kare)
  • Kolmogorov-Smirnov (KS)
  • Cramer / Mises (CvM) adlı kullanıcıdan

Bilgi teorisi farklılıkları

  • Kullback-Liebler (KL)
  • Jensen – Shannon sapma (metrik)
  • Jeffrey-diverjans (sayısal olarak kararlı ve simetrik)

Yer mesafesi ölçüleri

  • Histogram kesişimi
  • Kuadratik form (QF)
  • Earth Movers Distance (EMD)


0

"İstatistiksel Farklılık" için daha az önlem var

  • Permütasyon testi (Fisher tarafından)
  • Merkez Limit Teoremi ve Slutsky teoremi
  • Mann-Whitney-Wilcoxin testi
  • Anderson - Sevgilim testi
  • Shapiro – Wilk testi
  • Hosmer – Lemeshow testi
  • Kuiper testi
  • çekirdeklenmiş Stein tutarsızlığı
  • Jaccard benzerliği
  • Ayrıca, hiyerarşik kümeleme, gruplar arasındaki benzerlik önlemleriyle ilgilidir. Grup benzerliğinin en popüler ölçüleri belki de tek bağlantı, tam bağlantı ve ortalama bağlantıdır.
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.