Her korelasyon matrisi pozitif olarak tanımlanmış mı?


11

Burada Pearson korelasyonlarının matrisleri hakkında konuşuyorum.

Sıklıkla tüm korelasyon matrislerinin pozitif semidefinit olması gerektiğini söylediğini duydum. Anladığım kadarıyla pozitif kesin matrislerin özdeğerleri olmalıdır , pozitif semidefinit matrislerin özdeğerleri olmalıdır . Bu, sorumun "Korelasyon matrislerinin öz değeri olması mümkün mü ?" Şeklinde yeniden yazılabileceğini düşündürüyor.0 = 0>00=0

Bir korelasyon matrisinin (ampirik verilerden üretilen, eksik veri olmadan) özdeğer veya özdeğer mü? Ya bunun yerine bir nüfus korelasyon matrisi olsaydı?< 0=0<0

Ben üst cevaba okunan kovaryans matrisleri ile ilgili bu soruya o

Üç değişken, göz önünde , ve . Kovaryans matrisi , pozitif değildir, çünkü pozitif olmadığı bir vektörü ( ) vardır .Y Z = X + Y M z = ( 1 , 1 , - 1 ) z M zXYZ=X+YMz=(1,1,-1)'z'Mz

Ancak, bir kovaryans matrisi yerine bu hesaplamaları bir korelasyon matrisi üzerinde , pozitif olarak ortaya çıkar. Dolayısıyla korelasyon ve kovaryans matrisleri için durumun belki de farklı olduğunu düşünüyorum.z'Mz

Sormamın nedeni , orada sorduğum bir soruyla ilgili olarak stackoverflow hakkında soru sormam.


Örneğin, iki özellik bir şeyse, sadece farklı isimlere sahipse, matris tekildir. İki öznitelik bir sabite eklenirse, yine tekildir, vb .
ttnphns

Kovaryans matrisi tekil ise korelasyon matrisi de tekildir.
ttnphns

2
Yakın kopyalar: Her korelasyon matrisi pozitif yarı tanımlı mı? kesin ve yarı-tanımlanmış açıya daha az odaklanan ve her kovaryans matrisi pozitif tanımlı mıdır? bu bir kovaryans esasen yeniden ölçeklenmiş bir korelasyon olduğundan önemlidir.
Silverfish

Yanıtlar:


16

Korelasyon matrislerinin pozitif kesin olması gerekmez.

Sıfır olmayan varyansa sahip skaler rastgele bir değişken X düşünün. Daha sonra X'in kendisi ile korelasyon matrisi, pozitif yarı-tanımlayıcı, ancak pozitif tanımlayıcı olmayan tüm matrislerdir.

Örnek korelasyonuna gelince, birinci gözlem 1 ve 1 ve ikinci gözlem 2 ve 2'ye sahip olan yukarıdaki örnek verileri göz önünde bulundurun.

Tam aritmetik (yani, yuvarlama hatası olmadan) hesaplanmışsa bir örnek korelasyon matrisi negatif özdeğerlere sahip olamaz.


4
Eksik değerlerin örnek korelasyon matrisi üzerindeki olası etkilerinden bahsetmeye değer olabilir . Sayısal fuzz, bir örnek korelasyon / kovaryans matrisinde negatif bir özdeğer elde etmenin tek nedeni değildir.
Silverfish

1
Evet, açık bir şekilde ifade etmedim, ancak soru ifadesine göre "eksik veri olmadan" varsayıyordum. Kayıp veri ve ayarlamalar gibi vahşi, tuhaf dünyaya girdikten sonra her şey gider.
Mark L. Stone

Evet, üzgünüm, soru "eksik veri yok" dedi oldukça haklı - sadece bir yerde söz değer düşündüm çünkü OP iştahı doymuş olsa bile gelecekteki arama ilgilenen olabilir!
Silverfish

7

@Yoki ve @MarkLStone (her ikisinde +1) yanıtları, değişkenler doğrusal olarak ilişkiliyse bir popülasyon korelasyon matrisinin sıfır öz değere sahip olabileceğine işaret eder (örneğin @MarkLStone örneğinde ve X 1 = 2 X 2 @yoki örneğinde).X1=X2X1=2X2

Buna ek olarak, bir örnek korelasyon matrisi, , yani örnek büyüklüğü değişken sayısından küçükse mutlaka sıfır öz değere sahip olacaktır. Bu durumda, kovaryans ve korelasyon matrislerinin her ikisi de n - 1 rütbesinin çoğunda olacaktır, bu nedenle en azından p - n + 1 sıfır öz değeri olacaktır. Bkz . Örnek büyüklüğü değişken sayısından az olduğunda örnek kovaryans matrisi neden tekildir? ve neden kovaryans matris sıralaması en fazla n - 1 ?n<pn-1p-n+1n-1


Doğru 'dat. Sanırım bu bilgiyi de vermiş ve vermiş olmalıydım, ama amacım OP'nin hipotezini çürütmek için bir karşı örnek üretmekti, böylece geçersizliğini gösteriyor Yine de, ikinci cümlenizi "Bu durumda kovaryans ve korelasyon matrisleri en fazla n − 1 olacak, bu yüzden en az (p − n + 1) sıfır özdeğer olacaktır. "
Mark L. Stone

4

ortalama 0 ve 1 varyansı ile bir rv olarak düşünün. Y = 2 X olsun ve ( X , Y ) ' nin kovaryans matrisini hesaplayın . Yana 2 x = Y , E [ Y, 2 ] = 4 E [ x 2 ] = σ 2 , Y , ve E : [ X, Y, ] = 2 E [ x 2 ]XY=2X(X,Y)2X=YE[Y2]=4E[X2]=σY2E[XY]=2E[X2]. Sıfır ortalama konfigürasyonu nedeniyle, ikinci momentler uygun kovaryanslara eşittir, örneğin: .Cov(X,Y)=E[XY]-EXEY=E[XY]

: Kovaryans matrisi olacak Böylece a sıfır özdeğer sahip olan. Korelasyon matrisi şu şekilde olacaktır: Λ = ( 1 1 1 1 ) ve sıfır öz değere sahip. X ve Y arasındaki doğrusal yazışma nedeniyle, bu korelasyon matrisini neden aldığımızı görmek kolaydır - doğrusal ilişki nedeniyle köşegen daima 1 ve köşegen dışı 1'dir.

Λ=(1224),
Λ=(1111),
XY

2ΛcÖv(X,Y)=E(XY)-E(X)E(Y)=2E[X2]=2(σX2+[E(X)]2)E(X2)=var(X)+[E(X)]2

dbenbirgΛ-1/2ΛdbenbirgΛ1/2

@AntoniParellada, ne demek istediğinden tam olarak emin değilim - buradaki kovaryans doğrudan bir hesaplamadır. Ama bunu düzenleyeceğim ve daha net hale getireceğim. Teşekkürler.
yoki
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.