Mahalanobis mesafesi ile Kaldıraç arasındaki ilişkiyi kanıtlıyor musunuz?


12

Wikipedia'da formüller gördüm . Mahalanobis mesafesini ve Kaldıraç ile ilgili:

Mahalanobis mesafe yakın kaldıraç istatistik ile ilgilidir , ama farklı bir ölçek varh

D2=(N--1)(h-1N-).

Bir de bağlantılı makalede , Vikipedi açıklar şu ifadelerle:h

Doğrusal regresyon modelinde için kaldıraç puan veri birimi olarak tanımlanır: şapka matris çapraz eleman ; burada matris devri anlamına gelir.benth

hbenben=('H)benben,
benth'H=X(XX)-1X

Hiçbir yerde kanıt bulamıyorum. Tanımlardan başlamaya çalıştım ama ilerleme kaydedemiyorum. Herkes bir ipucu verebilir mi?

Yanıtlar:


11

Mahalanobis mesafesinin aşağıdan yukarıya doğru açıklaması Mahalanobis mesafesinin açıklaması mı? iki temel sonuç içerir:

  1. Tanım gereği, regresörler düzgün bir şekilde değiştiğinde değişmez.

  2. x ve y vektörleri arasındaki kare Mahalanobis mesafesi ,

    D2(x,y)=(x-y)'Σ-1(x-y)
    ; burada Σ , verilerin kovaryansıdır.

(1) regresörlerin ortalamalarının sıfır olduğunu varsaymamızı sağlar. hben yi hesaplamak için kalır . Ancak, iddianın doğru olması için bir varsayım daha eklememiz gerekiyor:

Model bir durdurma içermelidir.

Buna izin vermek için, gözlem için i regresörün j değerini x i j olarak yazarak k0 regresörleri ve n verisi olsun . Bu kolon vektörü olsun , n geri çekici değerleri j yazılır x , j ve bu satır vektörü k gözlem için değerler i yazılır x i . Daha sonra örnek matrisi olanjbenxbenjnjx,jkbenxben

X=(1x11x1k1x21x2k1xn1xnk)

ve tanım gereği şapka matrisi,

H=X(XX)1X,

köşegen boyunca i girişi

(1)hi=hii=(1;xi)(XX)1(1;xi).

Bunun için merkezi matrisi tersine çevirmekten başka bir şey yok - ancak ilk anahtar sonuçtan dolayı, özellikle blok matris formunda yazdığımızda kolaydır:

XX=n(100C)

burada 0=(0,0,,0)' ve

Cjk=1nΣben=1nxbenjxbenk=n-1nCov(xj,xk)=n-1nΣjk.

( Regresörlerin örnek kovaryans matrisi için Σ yazdım .) Bu blok çapraz olduğundan, tersi sadece blokları ters çevirerek bulunabilir:

(X'X)-1=1n(10'0C-1)=(1n0'01n-1Σ-1).

Tanımdan (1) elde ederiz

hben=(1;xben)(1n0'01n-1Σ-1)(1;xben)'=1n+1n-1xbenΣ-1xben'=1n+1n-1D2(xben,0).

Kare Mahalanobis uzunluğu Dben2=D2(xben,0) verimi için çözme

Dben2=(n-1)(hben-1n),

QED .

1/nXn-1n-1n


ben


İlişkinin gerçekten geçerli olduğunu gösteren R kodu:

x <- mtcars

# Compute Mahalanobis distances
h <- hat(x, intercept = TRUE); names(h) <- rownames(mtcars)
M <- mahalanobis(x, colMeans(x), cov(x))

# Compute D^2 of the question
n <- nrow(x); D2 <- (n-1)*(h - 1/n)

# Compare.
all.equal(M, D2)               # TRUE
print(signif(cbind(M, D2), 3))

Mükemmel cevap, titizlik ve sezgi ile çok iyi yuvarlanmış. Şerefe!
cgrudz

Yazı için teşekkürler @whuber! Akıl sağlığı kontrolü için, ilişkinin gerçekten geçerli olduğunu gösteren R kodu: x <- mtcars rownames (x) <- NULL colnames (x) <- NULL n <- nrow (x) h <- hat (x, T) mahalanobis (x, colMeans (x), cov (x)) (n-1) * (h - 1 / n) hepsi eşittir (mahalanobis (x, colMeans (x), cov (x)), (n-1 ) * (h - 1 / n))
Tal Galili

1
@Tal Sağlık kontrolüne ihtiyacım olduğunu düşünmemiştim - ama kod için teşekkür ederim. :-) Onu ve çıktısını biraz açıklığa kavuşturmak için değişiklikler yaptım.
whuber

1
@whuber, eşitliğin nasıl işleyeceğini gösteren bir örnek istedim (varsayımları doğru bulduğumu açıklığa kavuşturarak). Ayrıca ilgili Wiki girişini de uzattım : en.wikipedia.org/wiki/… (uygun gördüğünüz gibi orada da harcama yapmaktan çekinmeyin :))
Tal Galili
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.