Bir gözlem seviyesi Mahalanobis mesafesinin dağılımı


23

Çok değişkenli normal iid örneğine sahipseniz X1,,XnNp(μ,Σ) ve (sıralama vektörü örnek bir noktadan [kare] Mahalanobis mesafe olan matris kullanılarak ağırlığı için), dağılımı ne örnek (Mahalanobis mesafe örnek kovaryans matrisi kullanılarak ortalama )?a A

di2(b,A)=(Xib)A1(Xib)
aA ˉ X Sdi2(X¯,S)X¯S

olduğunu iddia eden bir makaleye , ancak bu açıkça yanlıştır: dağılımı (bilinmeyen) popülasyon ortalaması vektörünü kullanarak için elde edilmiş olur ve kovaryans matrisi. Örnek analogları takıldığında, bir Hotelling dağılımı veya ölçekli bir dağılımı veya buna benzer bir şey, . Kesin sonucu ya Muirhead'de (2005) , ne Anderson'ta (2003) , ne de Mardia, Kent ve Bibby'de (1979, 2003) bulamadım. χ 2 p d 2 i ( μ , Σ ) T 2 F ( ) χ 2 pχp2χp2di2(μ,Σ)T 2F()χp2. Görünüşe göre, bu adamlar çok değişkenli normal dağılım mükemmel olduğu ve çok değişkenli veri topladığı her zaman kolayca elde edildiği için, tanı koyucuları rahatsız etmedi: - /.

Her şey bundan daha karmaşık olabilir. Hotelling dağıtım sonucu, vektör kısmı ile matris kısmı arasındaki bağımsızlığı varsayar; bu bağımsızlık ve , fakat artık ve için .T 2X¯SXiS


Tanımında, , hala görüntülerim X i rastgele değişken olarak ya da sabit bir vektör olarak muamele şu anda? Aboneliği dahil etmek ikincisini önerir, ancak bu biraz garip görünüyor. di2Xi
whuber

1
Sadece küçük bir off-the-manşet yan not, ancak önceden olduğu göre söz konusu yan olduğunu ^ ı ve Σ ı d 2 ı ( ˉ X , S ) (olmalıdır sabit bir sabit eşittir , n - p , ya da benzer, sanırım) neredeyse kesin. XiX¯μidi2(X¯,S)np
kardinal

1
@whuber - belki de yeni bir gözlem değil, örnekten bir gözlem kullanılarak hesaplandığını vurgulamak ister misiniz?
Jbowman

1
@whuber, aşağı yukarı jbowman'ın söylediği sıralar boyunca - bunun gözlem düzeyinde bir istatistik olduğunu belirtmek için (örnek ortalama gibi bir örnek seviye istatistikine karşılık).
StasK

1
Dağılımı , bir beta n / ( n - 1 ) 2 d 2 ı ( ˉ X , S ) ~ B ( s / 2 , ( n - p - 1 ) / 2 ) , ama hala d 2 i ( μ , S ) dağılımını arıyorumdi2(X¯,S)n/(n1)2di2(X¯,S)B(p/2,(np1)/2)di2(μ,S). Dağılımları 's bağımsız değildir. di2

Yanıtlar:


18

Check out Mahalonobis Distance Kötüye Kullanmak tarafından Gauss Karışım Modelleme ( alternatif bağlantı ). Bakınız sayfa 13, İkinci sütun. Yazarlara ayrıca dağıtımı türetmek için de bazı kanıtlar verildi. Dağılım ölçeklendirilmiş beta. Lütfen bu sizin için işe yaramazsa bana bildirin. Aksi takdirde yarın SS Wilks kitabındaki ipuçlarını kontrol edebilirim.


4
Makalede verilen cevap: n(n1)2di2(X¯,S)B(p2,np12)

9

df=p

n(d2)(n1)2Beta(p2,(np1)2).
However, if the observation xi is independent of the parameter estimates, then the distribution is proportional to a Fisher's F-ratio distribution:
(nd2(np)(p(n1)(n+1))F(p,np)

Welcome to the site, @JoeSullivan. I took the liberty of using LATEX to make your equations easier to read. Please make sure they still say what you want.
gung - Reinstate Monica

can you give a reference for the F formula?
eyaler

1
one related reference, section 3 in Hardin, Johanna, and David M. Rocke. 2005. “The Distribution of Robust Distances.” Journal of Computational and Graphical Statistics 14 (4): 928–46. doi:10.1198/106186005X77685.
Josef
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.