Kaynak aramayı kolaylaştırmak için ne yapmaya çalıştığımı tanımlamak için iyi bir terminoloji arıyorum.
Yani, her biri iki ve X ile ilişkili iki A ve B noktası kümesine sahip olduğumu ve A ile B arasındaki "mesafeyi" ölçmek istediğimi - yani aynı dağılımdan örneklenmelerinin ne kadar muhtemel olduğunu varsayalım. (Dağılımların normal olduğunu varsayabilirim). Örneğin, eğer X ve Y, A ile korelasyon gösteriyorsa, ancak B'de değil, dağılımlar farklıdır.
Sezgisel olarak, A'nın kovaryans matrisini elde edeceğim ve sonra B'deki her bir noktanın oraya sığma olasılığına bakacağım ve bunun tersi (muhtemelen Mahalanobis mesafesi gibi bir şeyler kullanarak).
Ama bu biraz "geçici" ve bunu açıklamanın daha kesin bir yolu var (tabii ki pratikte ikiden fazla değişkenli ikiden fazla veri setine sahibim - hangisinin veri setlerimi belirlemeye çalışıyorum. outliers).
Teşekkürler!