Bir korelasyon matrisinin sıfır öz değeri için yeterli ve gerekli koşullar


11

Verilen rasgele değişken , olasılık dağılımı ile , ilinti matrisi olumlu yarı tanımlı yani, özdeğerler pozitif veya sıfır.nXiP(X1,,Xn)Cij=E[XiXj]E[Xi]E[Xj]

C'nin m sıfır öz değerine sahip olması için gerekli ve / veya yeterli olan koşullarıyla ilgileniyorum . Örneğin, yeterli bir koşul rastgele değişkenlerin bağımsız olmamasıdır: \ sum_i u_i X_i = Bazı gerçek sayılar için u_i . Örneğin, P (X_1, \ ldots, X_n) = \ ö (X_1-X_2) p (X_2, \ ldots, X_n) , daha sonra \ vec u = (1, -1,0, \ ldots, 0) olduğu bir özvektör C sıfır özdeğer ile. Bu tip X_i 'lerde m bağımsız doğrusal kısıtlamamız varsa , m sıfır özdeğer anlamına gelir .PCmiuiXi=0uiP(X1,,Xn)=δ(X1X2)p(X2,,Xn)u=(1,1,0,,0)CmXim

En az bir ek (ancak önemsiz) imkanı vardır Xa=E[Xa] bazıları için a (yani P(X1,,Xn)δ(XaE[Xa]) ) olup, bu yana case Cij nin bir sütunu ve bir satırı vardır: Cia=Cai=0,i . Gerçekten ilginç olmadığından, olasılık dağılımının bu formda olmadığını varsayıyorum.

Sorum şu: doğrusal kısıtlamalar (yukarıda verilen önemsiz istisna korusun) ya da rastgele değişkenler üzerinde doğrusal olmayan kısıtlamalar da sıfır özdeğer üretebilir sıfır özdeğerleri ikna etmenin tek yolu vardır C ?


1
Tanım olarak, sıfır vektörü içeren bir vektör koleksiyonu doğrusal olarak bağımlıdır, bu nedenle ek olasılığınız yeni veya farklı bir şey değildir. Eğer "bir sahip olarak ne anlama geldiğini açıklayabilir misiniz özdeğer"? Bu bir tür tipografik hataya benziyor. m
whuber

@whuber: evet, yazım hatası. Düzeltildi. Ben iki koşul farklı olduğunu düşünüyorum: biri değişkenler arasındaki ilişki hakkında, diğeri sadece değişken olasılığı hakkında (yani ). p(Xa)=δ(XaE(Xa))
Adam

Sorunuzun formülasyonu kafa karıştırıcı. Bu görünüyor lineer cebir bir ilköğretim teoremi gibi ama "bağımsız" rasgele değişkenlere referanslar da başka tamamen bir konuda olabilir düşündürmektedir. "Bağımsız" ifadesini her kullandığınızda, (istatistiksel olarak) bağımsız rastgele değişkenler anlamında değil, doğrusal bağımsızlık anlamında demek istediğinizi anlamak doğru olur mu? "Kayıp veri" ye göndermeniz daha da kafa karıştırıcıdır, çünkü "rastgele değişkenlerinizin" gerçekten bir veri matrisinin sütunları anlamına gelebileceğini gösterir. Bu anlamları açıklığa kavuşturmak iyi olur.
whuber

@whuber: Soruyu düzenledim. Umarım daha açıktır.
Adam

Bağımsızlık koşulu , her ortalaması sıfır olmadığı sürece mutlaka sıfır olmak zorunda değildir (herhangi bir sabit olacaktır) . X iiuiXi=0Xi
Sextus Empiricus

Yanıtlar:


6

Belki de notasyonu basitleştirerek temel fikirleri ortaya çıkarabiliriz. Beklentiler veya karmaşık formüller içermemize gerek olmadığı ortaya çıkıyor, çünkü her şey tamamen cebirsel.


Matematiksel nesnelerin cebirsel doğası

Soru, (1) vektör olarak kabul edilen sonlu rasgele değişkenler ve (2) doğrusal değişkenler kümesinin kovaryans matrisi arasındaki ilişkilerle ilgilidir .X1,,Xn

Söz konusu vektör alanı, tüm sonlu-varyans rastgele değişkenlerin (verilen herhangi bir olasılık uzayında ) modulo (bu iki rastgele değişkenler göz önünde olan ve aynı olacak şekilde vektör sıfır şans olduğunda kendi beklenti farklıdır.) bu sonlu boyutlu vektör ile tek ilgileniyor tarafından üretilen uzay bunu analitik bir problemden ziyade bir cebirsel problem yapan şeydir.L 2 ( Ω , p ) / R . X Y X - Y V X i ,(Ω,P)L2(Ω,P)/R.XYXYVXi,

Varyanslar hakkında bilmemiz gerekenler

V sadece bir vektör uzayından daha fazlasıdır: ikinci dereceden bir modüldür, çünkü varyans ile donatılmıştır. Varyanslar hakkında bilmemiz gereken tek şey iki şeydir:

  1. Varyans, tüm vektörleri için özelliğine sahip, skaler değerli bir fonksiyonQ, ( bir X ) = bir 2 Q ( x ) x .QQ(aX)=a2Q(X)X.

  2. Varyans dejenere değildir.

İkincisi biraz açıklamaya ihtiyaç var. tarafından verilen simetrik bir çift doğrusal form olan bir "nokta ürün" belirlerQ

XY=14(Q(X+Y)Q(XY)).

(Bu elbette hiçbir şey değişkenlerin kovaryans başkadır ve vektörler) ve olan ortogonal onların nokta ürün olduğunda ortogonal tamamlayıcı vektörleri herhangi kümesinin oluşur, bütün vektörler ortogonal her elemana yazılıY, . X Y 0. AV A ,XY.XY0.AVA,

A0={vVa.v=0 for all vV}.

Açıkça bir vektör alanıdır. Zaman , bir dejenere.SV0={0}Q

Açık görünse de, varyansın gerçekten dejeneral olmadığını kanıtlamama izin verin. sıfır olmayan bir öğesi olduğunu varsayalım Bu tüm için anlamına gelireşdeğer olarakV 0 . X Y = 0 Y V ;XV0.XY=0YV;

Q(X+Y)=Q(XY)

Tüm vektörlerin için çıkarak verirY = XY.Y=X

4Q(X)=Q(2X)=Q(X+X)=Q(XX)=Q(0)=0

ve böylece Bununla birlikte, (belki Chebyshev Eşitsizliğini kullanarak) sıfır varyansa sahip tek rastgele değişkenlerin neredeyse sabit olduğunu biliyoruz, bu da onları QED'deki sıfır vektörü ile tanımlamaktadır .V ,Q(X)=0.V,

Soruları yorumlama

Sorulara dönersek, önceki gösterimde rasgele değişkenlerin kovaryans matrisi , tüm nokta ürünlerinin düzenli bir dizisidir,

T=(XiXj).

Düşünmek için iyi bir yol yoktur : bu üzerinde bir lineer transformasyonu tanımlar R n herhangi bir vektör göndererek, alışılmış bir yolla X = ( x 1 , ... , x , n ) R n vektörüne T ( x ) = y = ( y 1 , ... , x , n ) olan bileşen matris çarpım kuralı ile belirlenirTRnx=(x1,,xn)RnT(x)=y=(y1,,xn)ith

yi=j=1n(XiXj)xj.

Çekirdek bu doğrusal dönüşümün sıfıra gönderir alt uzay olduğu:

Ker(T)={xRnT(x)=0}.

Yukarıdaki denklem, , herbenxKer(T),i

0=yi=j=1n(XiXj)xj=Xi(jxjXj).

Bu her için geçerli olduğundan , tarafından yayılan tüm vektörler için : yani kendisi. Sonuç olarak, ne zaman tarafından verilen vektör yatmaktadır Varyans dejenere olmadığından, anlamına gelir. Yani , orijinal rastgele değişken arasında doğrusal bir bağımlılığı tanımlar .X i V x Ker ( T ) , ji,XiVxKer(T),V 0 . j x j X j = 0. x njxjXjV0.jxjXj=0.xn

Bu akıl yürütme zincirinin geri çevrilebilir olup olmadığını kolayca kontrol edebilirsiniz:

Vektörler olarak arasındaki doğrusal bağımlılıklar , çekirdeğinin elemanları ile bire bir yazışma içindedir , T .Xj T.

(Bu açıklama hala dikkate unutmayın olan unsurları olarak, - bir konumda sürekli bir kayma kadar tanımlanan --rather olarak daha sadece rastgele değişkenler.)L 2 ( Ω , P ) / RXjL2(Ω,P)/R

Son olarak, tanım gereği, bir öz değeri ile sıfır olmayan bir vektör bulunan herhangi bir skaler Tüm , bir özdeğer, (tabii ki) ile bağlantılı özvektörler alan çekirdeği olanTx T ( x ) = λ x . λ = 0 , T .λxT(x)=λx.λ=0T.


özet

Soruların cevabına ulaştık: rasgele değişkenlerin doğrusal bağımlılık kümesi, qua elemanları, bire bir kovaryans matrisi çekirdeği. Bunun nedeni, varyansın dejenere olmayan kuadratik bir form olmasıdır. Çekirdek ayrıca sıfır özdeğeri (veya sıfır özdeğeri olmadığında sadece sıfır altuzay) ile ilişkili özdendir.T.L2(Ω,P)/R,T.


Referans

Bölüm IV'ün gösterimini ve bazı dillerini büyük ölçüde

Jean-Pierre Serre, Aritmetik Bir Kurs. Springer-Verlag 1973.


Vay, bu harika! Sadece her şeyi anladığımdan emin olmak için bir soru: " vektör olarak " , rastgele vektörleri bir vektörde (yani ) toplamak ya da değil mi? Eğer haklıysam, olasılık dağılımı varyans tanımına gizlenirken , rastgele değişken olası değerlerini bir vektöre tahmin ediyorum , değil mi? XjXiX=(X1,,Xn)Xi
Adam

Bence oldukça açık olmayan ana husus aşağıdaki (olasılık teorisinin resmi bilgim eksikliğini gösterebilir): 0 özdeğer varsa, o zaman örneğin . Bu kısıtlama, gizlenmiş olan olasılık dağılımına ( değinmez . Ama ortalama ne var olmadığını referans olmadan ? Yoksa sadece anlamına mı geliyor , ancak delta işlevinde bunun ve doğrusal bir kombinasyonu olması gerektiğini nasıl biliyoruz ? P Q X 1 = X 2 P PX1=X2PQX1=X2PX 1Pδ(X1X2)X1X2
Adam

Korkarım bu bağlamda bir “delta işlevi” kullanımınızı anlamıyorum, Adam. Bunun nedeni, kısmen ona ihtiyaç duymadığım ve kısmen de gösterim belirsiz olduğu için: örneğin bir Kronecker deltası mı yoksa Dirac deltası mı?
whuber

Değişkenlere (ayrık veya sürekli) bağlı olarak bir Kronecker veya Dirac olacaktır. Bu deltalar entegrasyon ölçüsünün bir parçası olabilir, örneğin 2'den 2'ye kadar matris (yani dört gerçek değişken , , ve biraz ağırlıkla (örneğin ), ya da bir alt grup üzerinde entegre olur. simetrik matrisler (örneğin ima ise , I resmi çarparak bu empoze) ile . Bu doğrusal kısıtlama olur Martijn Weterings'in cevabının aşağıdaki yorumlarında doğrusal olmayan kısıtlamaya bir örnek verilmiştirX 1 X 2 X 3 x 4 P = exp ( - t r ( M . M , T ) ) x 2 = X 3 p δ ( X 1 - X 2 )MX1X2X3X4P=exp(tr(M.MT))X2=X3Pδ(X1X2)
Adam

(devam) Soru şudur: Değişkenlerime ekleyebileceğim doğrusal olmayan kısıtlamaların ne olabileceği 0 özdeğerini indükleyebilir. Yanıtlarınıza göre, öyle görünüyor: sadece doğrusal kısıtlamayı ima eden doğrusal olmayan kısıtlama (Martijn Weterings'in cevabının altındaki yorumlarda örneklendiği gibi). Belki de sorun, problemi düşünme şeklimin fizikçi bir bakış açısına sahip olması ve bunu farklı bir dilde açıklamak için mücadele ediyorum (bence bu soruyu sormak için doğru yer, fizik yok.SE).
Adam

5

Doğrusal bağımsızlık sadece yeterli değil aynı zamanda gerekli bir durumdur

Varyans-kovaryans matrisinin öz değişkenleri sıfıra eşit olduğunu ve ancak değişkenlerin doğrusal olarak bağımsız olmaması durumunda, sadece "matrisin öz değerine eşit olması durumunda değişkenlerin doğrusal bağımsız olmadığını" göstermesi gerekir.

için sıfır özdeğeriniz varsa, bazı doğrusal kombinasyonlar vardır (özvektör tarafından tanımlanır )vCij=Cov(Xi,Xj)v

Y=i=1nvi(Xi)

öyle ki

Cov(Y,Y)=i=1nj=1nvivjCov(Xi,Xj)=i=1nvij=1nvjCij=i=1nvi0=0

ki bu araçlar , bir sabit ve böylece değişken olması gerekmektedir sahip bir sabit kadar eklemek ve ya sabit kendilerini (önemsiz durumda) veya lineer bağımsızdır.X iYXi

- ile denklemdeki ilk satır , kovaryansCov ( a U + b V , c W + d X ) = a cCov(Y,Y)

Cov(aU+bV,cW+dX)=acCov(U,W)+bcCov(V,W)+adCov(U,X)+bdCov(V,X)

- ikinci satırdan üçüncü satıra adım, sıfır özdeğer

j=1nvjCij=0


Doğrusal olmayan kısıtlamalar

Dolayısıyla, doğrusal kısıtlamalar gerekli bir koşul olduğundan (sadece yeterli değil), doğrusal olmayan kısıtlamalar sadece dolaylı olarak (gerekli) doğrusal bir kısıtlama ima ettiklerinde geçerli olacaktır.

Aslında, sıfır özdeğer ile ilişkili özvektörler ve doğrusal kısıtlamalar arasında doğrudan bir yazışma vardır.

Cv=0Y=i=1nviXi=const

Dolayısıyla, sıfır öz değere yol açan doğrusal olmayan kısıtlamalar, birlikte birleştirildiğinde, bir miktar doğrusal kısıtlama üretmelidir.


Doğrusal olmayan kısıtlamalar nasıl doğrusal kısıtlamalara yol açabilir?

Yorumlardaki örneğiniz bunu doğrusal olmayan kısıtlamaların türetmeyi tersine çevirerek nasıl doğrusal kısıtlamalara yol açabileceğini sezgisel olarak gösterebilir. Aşağıdaki doğrusal olmayan kısıtlamalar

a2+b2=1c2+d2=1ac+bd=0adbc=1

düşürülebilir

a2+b2=1c2+d2=1ad=0b+c=0

Bunu tersine çevirebilirsin . Doğrusal olmayan artı doğrusal kısıtlamalarınız olduğunu varsayalım, o zaman doğrusal kısıtlamaları doğrusal olmayan kısıtlamalara doldurarak doğrusal sınırlamalardan birini doğrusal olmayan bir sınırlama ile nasıl değiştirebileceğimizi hayal etmek garip değildir. Örneğin, doğrusal olmayan formda ve yerine koyduğumuzda başka bir ilişki kurabilirsiniz . Ve ve çarptığınızda elde edersiniz .b = - c a 2 + b 2 = 1 a d - b c = 1 a = d c = - b a c = - b da=db=ca2+b2=1adbc=1a=dc=bac=bd


Sanırım bu (ve whuber tarafından verilen cevap) soruma dolaylı bir cevaptır (ki: "sıfır özdeğer elde etmenin tek yolu doğrusal bağımlılıktır"): rastgele değişkenler arasındaki bağımlılık, doğrusal, her zaman sadece yazarak doğrusal bir bağımlılık olarak yeniden yazılabilir . Olası doğrusal olmayan kısıtlamaları kendileri karakterize etmenin yolunu aramama rağmen, sanırım yine de yararlı bir sonuç. Y=iνiXi
Adam

Evet, biliyorum ... söylediğim şey eğer doğrusal olmayan bir bağımlılık varsa ve sıfır özdeğer varsa, o zaman cevabınızla, doğrusal olmayan bağımlılığın bir şekilde "çarpanlarına ayrılabileceği" anlamına gelir doğrusal bir bağımlılığa dönüşüyor. Aradığım şeyin daha zayıf bir versiyonu, ama yine de bir şey.
Adam

Çalışmayan bir örnek veriyorsunuz, bu durum böyle olamayacağı anlamına gelmez ...
Adam

MM.MT=1detM=1detM=1

M 12 = X 2 M 21 = X 3 M 22 = X 4 X 2 1 +M11=X1 , , ve . Kısıtlamalar , , (yalnızca ikisi bağımsızdır). Sıfır özdeğer anlamına gelmez. Ancak, eklenmesi , 0 özdeğerli iki özvektör anlamına gelir. M12=X2M21=X3M22=X4X12+X22=1X32+X42=1X1X3+X2X4=0X1X4X2X3=1
Adam

2

karşılık gelen özdeğer sahip bir özvektörü olduğunu varsayalım , sonra . Böylece, Chebyshev eşitsizliği nedeniyle, neredeyse sabittir ve eşittir . Yani, her sıfır özdeğer, doğrusal bir kısıtlamaya karşılık gelir, yani . Herhangi bir özel durumu dikkate almaya gerek yoktur.v 0 var ( v T X ) = v T C v = 0 v T X v T E [ X ] v T X = v T E [ X ]Cv0var(vTX)=vTCv=0vTXvTE[X]vTX=vTE[X]

Böylece, şu sonuca varıyoruz:

"Lineer kısıtlamalar sıfır özdeğerleri indüklemenin tek yolu mudur [?]"

Evet.

msgstr "Rasgele değişkenler üzerindeki doğrusal olmayan kısıtlamalar da sıfır özdeğer değeri yaratabilir mi?"

Evet, eğer doğrusal kısıtlamalar ima ediyorsa.


Katılıyorum. Birinin doğrusal olmayan kısıtlamalar konusunda daha spesifik olabileceğini umuyordum, ancak kısıtlamaları belirtmezsek daha iyisini yapmanın zor olduğunu düşünüyorum.
Adam

2

Kovaryans matris, arasında Eğer olarak diagnonalize böylece simetriktir diyagonal matris içinde öz değerleri ile,Bu yeniden yazma RHS kovaryans matrisi, bir , yani lhs sıfır özdeğerler doğrusal kombinasyonlarına tekabül eden dejenere dağılımına sahip.X C = Q Λ Q T Λ . Λ = Q T C Q Q T X XCXC=QΛQTΛ.Λ=QTCQQTXX


Bu çok güzel ve özlü bir açıklama, ancak nasıl daha sezgisel hale getirebiliriz ? QTCQ=cov(QTX)
Sextus Empiricus
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.