İki değişkenli dağılım arasındaki “mesafenin” ölçülmesi

28

Kaynak aramayı kolaylaştırmak için ne yapmaya çalıştığımı tanımlamak için iyi bir terminoloji arıyorum.

Yani, her biri iki ve X ile ilişkili iki A ve B noktası kümesine sahip olduğumu ve A ile B arasındaki "mesafeyi" ölçmek istediğimi - yani aynı dağılımdan örneklenmelerinin ne kadar muhtemel olduğunu varsayalım. (Dağılımların normal olduğunu varsayabilirim). Örneğin, eğer X ve Y, A ile korelasyon gösteriyorsa, ancak B'de değil, dağılımlar farklıdır.

Sezgisel olarak, A'nın kovaryans matrisini elde edeceğim ve sonra B'deki her bir noktanın oraya sığma olasılığına bakacağım ve bunun tersi (muhtemelen Mahalanobis mesafesi gibi bir şeyler kullanarak).

Ama bu biraz "geçici" ve bunu açıklamanın daha kesin bir yolu var (tabii ki pratikte ikiden fazla değişkenli ikiden fazla veri setine sahibim - hangisinin veri setlerimi belirlemeye çalışıyorum. outliers).

Teşekkürler!

multivariate-analysis terminology distance-functions

— Emile
kaynak

Nedenini bilmiyorum ama bir Mantel testi görevinizi okuduğumda gözlerimin önünden geçti.

— Roman Luštrik

15

Ayrıca yukarıda bahsettiğiniz Hellinger Distance ile ilgili olan Kullback-Leibler sapması da var .

— Monica - G. Simpson'ı yeniden görevlendirin
kaynak

2

Kullback-Leibler'in noktalardan farklılaştığını, noktaların geldiği temel olasılık yoğunluğunu varsaymadan hesaplayabilir mi?

— Andre Holzner,

16

Hmm, Bhattacharyya mesafesi aradığım şey gibi görünüyor, Hellinger mesafesi de çalışıyor.

— Emile
kaynak

Bhattacharyya ve Helling'den sonra KL hakkında konuşan bir cevabı kabul ediyorsun… Sonunda seçimin neydi ve neden?

— Simon C.

1

KL'nin ayrılışı olduğuna inanıyorum, ama ... 2010'daydı ve hafızam mükemmel olmaktan uzak.

— Emile

ahah evet tahmin ettim ama yine de teşekkürler!

— Simon C.

9

Sezgisel

Minkowsky biçimli
Ağırlıklı Ortalama Varyans (WMV)

Parametrik olmayan test istatistikleri

2 (Ki Kare)
Kolmogorov-Smirnov (KS)
Cramer / Mises (CvM) adlı kullanıcıdan

Bilgi teorisi farklılıkları

Kullback-Liebler (KL)
Jensen – Shannon sapma (metrik)
Jeffrey-diverjans (sayısal olarak kararlı ve simetrik)

Yer mesafesi ölçüleri

Histogram kesişimi
Kuadratik form (QF)
Earth Movers Distance (EMD)

— skyde
kaynak

7

En eksiksiz anket , Complutense Üniversitesi, Chapman Hall 2006'dan Leandro Pardo tarafından Ayrılma Önlemlerine Dayalı İstatistiksel Çıkarımda verilmiştir .

— Mark Somon
kaynak

0

"İstatistiksel Farklılık" için daha az önlem var

Permütasyon testi (Fisher tarafından)
Merkez Limit Teoremi ve Slutsky teoremi
Mann-Whitney-Wilcoxin testi
Anderson - Sevgilim testi
Shapiro – Wilk testi
Hosmer – Lemeshow testi
Kuiper testi
çekirdeklenmiş Stein tutarsızlığı
Jaccard benzerliği
Ayrıca, hiyerarşik kümeleme, gruplar arasındaki benzerlik önlemleriyle ilgilidir. Grup benzerliğinin en popüler ölçüleri belki de tek bağlantı, tam bağlantı ve ortalama bağlantıdır.

— Danylo Zherebetskyy
kaynak