Örneklem büyüklüğü değişken sayısından az olduğunda örnek kovaryans matrisi neden tekildir?


30

Diyelim ben var ki boyutlu değişkenli Gauss dağılımı. Ve alır , n gözlemler (bunların her a s -vector) bu dağılımdan ve örnek kovaryans matrisi hesaplamak S . Bu yazıda yazarlar, p > n ile hesaplanan örnek kovaryans matrisinin tekil olduğunu belirtmektedir .pnpSp>n

  • Nasıl doğru veya türetilmiş?
  • Herhangi bir açıklama var mı?

4
Bunun, altta yatan dağıtımdan bağımsız olarak doğru olduğunu unutmayın: Gaussian olması gerekmez.
Amip Reinstate Monica

Yanıtlar:


22

Kanıt olmadan sunulan matris dereceleriyle ilgili bazı gerçekler (ancak hepsinin veya neredeyse hepsinin kanıtları standart lineer cebir metinlerinde veya bazı durumlarda yeterli bilgi verdikten sonra alıştırmalar olarak belirlenmelidir):

Eğer A ve B daha sonra iki uyumlu matrisler, şunlardır:

(i) kolon sıralaması A = satır sıralaması A

(ii) rank(A)=rank(AT)=rank(ATA)=rank(AAT)

rank(AB)min(rank(A),rank(B))

(iv)rank(A+B)rank(A)+rank(B)

(v) , tam değerin kare matrisi ise,Brank(AB)=rank(A)

Örnek verinin matrisini düşünün , . Yukarıdan, sırası en çok .n×pyymin(n,p)

Ayrıca, yukarıdakilerden açıkça sırası, sırasından daha büyük olmayacaktır ( matris biçiminde, belki biraz sadeleştirilerek hesaplanması düşünülerek ).SyS

Eğer sonra , bu durumda .n<prank(y)<prank(S)<p


güzel cevap! Y ve S ile A ve B arasındaki ilişki tam olarak belli değil.
Matifou

S, y'den hesaplanır; (Orijinal yayında "x"). Y ile ilgili gerçekleri ve yukarıdaki kurallara göre yapılan manipülasyonları kullanabilirsiniz. S ve rütbesini almak için A ve B'nin oynadığı roller adım adım değişir.
Glen_b -Reinstate Monica

14

Sorunuzun kısa cevabı rütbe . Yani eğer , daha sonra tekil olduğunu.(S)n1p>nS

Daha ayrıntılı bir cevap için, (yansız) örnek kovaryans matrisinin şu şekilde yazılabileceğini hatırlayın:

S=1n1i=1n(xix¯)(xix¯)T.

Etkili olarak, her biri 1 değerinde olan matrisleri topluyoruz. Gözlemlerin doğrusal olarak bağımsız olduğunu , bir anlamda her gözlem 1'e ve bir 1 değerden çıkarılır ( ) çünkü her bir gözlemi . Bununla birlikte, eğer gözlemlerde çok-kutupluluk mevcutsa, o zaman rütbe azaltılabilir, bu rütbenin neden daha az olabileceğini açıklar .nxi(S)p>nx¯(S)n1

Bu sorunu incelemek için büyük miktarda çalışma yapılmıştır. Mesela, bir meslektaşım ve ben aynı konuyla ilgili bir makale yazdık ; burada , ayarında doğrusal ayrımcı analizine uygulandığında tekil olup olmadığını belirlemekle ilgilendik .Spn


4
Her bir gözlemi merkezlediğimizx¯ için neden 1'i çıkartacağınızı açıklayabilir misiniz ?
avokado


Güzel cevap! Belki sadece her biri bir rütbeye sahip olan 𝑛 matrisleri özetlediğimiz ifadesi için bir açıklama / bağlantı ekleyebilir miyim? Teşekkürler!
Matifou

10

Duruma doğru şekilde baktığınızda, sonuç sezgisel olarak anlaşılır ve anındadır.

Bu gönderi iki gösteri sunuyor. Birincisi, hemen altında, kelimelerle. En sonunda görünen basit bir çizime eşdeğerdir. Arada sözcüklerin ve çizimin ne anlama geldiğinin bir açıklaması var.


değişkenli gözlemler için kovaryans matrisi, bir matris (önerilen veriler) 'in transpose sola çarpılmasıyla hesaplanan bir matrisidir. . Bu matrislerin ürünü, vektörleri, boyutların ve olduğu bir vektör uzayları boru hattından gönderir . Sonuç olarak, kovaryans matrisi, qua doğrusal dönüşüm, , boyutu en fazla olan bir alt alana gönderilecektir . Kovaryans matrisinin rankı den daha büyük değildir . Sonuç olarak, eğern pp×pXnpXpnpnRnmin(p,n)min(p,n)p>n daha sonra seviye en olduğu kesinlikle daha az olan - ki, kovaryans matrisinin tekil --means.np

Bütün bu terminoloji bu yazının geri kalan kısmında tam olarak açıklanmıştır.

(Amip nazikçe silinmiş bir yorumda işaret ettiğinden ve ilgili bir sorunun cevabını gösterdiğinde , görüntüsü aslında bir alt uzayında yer alır (vektörlerden oluşur) bileşenleri sıfıra toplanır) çünkü sütunlarının tümü sıfır olarak yeniden girilmiştir.Bu nedenle örnek kodlama matrisi değerini aşamaz; )XRn1n1XXn1


Lineer cebir, vektör uzaylarının izlenmesi ile ilgilidir. Rütbe ve tekillik hakkında iddialar için derin bir sezgiye sahip olmak için yalnızca birkaç temel kavramı takdir etmeniz gerekir:

  1. Matris çarpımı, vektörlerin doğrusal dönüşümlerini temsil eder. Bir matrisi , -boyutlu bir uzay bir -boyutlu uzay doğrusal bir dönüşümü temsil eder . Özellikle, herhangi bir gönderir için . Bunun lineer bir dönüşüm olduğu, hemen lineer dönüşümün tanımından ve matris çarpımının temel aritmetik özelliklerinden kaynaklanmaktadır.m×nMnVnmVmxVnMx=yVm

  2. Doğrusal dönüşümler boyutları asla artıramaz. Tüm vektör uzayı görüntü, bu araçlar dönüşüm altında (bir alt-vektör alanıdır ) bir boyutundan daha büyük olmayan olabilir . Bu, boyut tanımından sonra gelen (kolay) bir teoremdir.VnMVmn

  3. Herhangi bir alt vektör uzayının boyutu, içinde bulunduğu alanın boyutunu aşamaz. Bu bir teoremdir, ancak yine de kanıtlanması kolaydır.

  4. Rank lineer dönüşümün kendi görüntüsünün boyuttur. Bir matrisin sırası, temsil ettiği doğrusal dönüşümün sırasıdır. Bunlar tanımlar.

  5. Bir tekil matris kesinlikleMmnn (etki alanının boyutu) küçüktür . Başka bir deyişle, görüntüsü daha küçük bir boyuta sahiptir. Bu bir tanımdır.

Sezgiyi geliştirmek , boyutları görmeye yardımcı olur . Bu nedenle, tüm vektörlerin ve matrislerin boyutlarını hemen sonra, ve . Böylece jenerik formülMmnxn

ym=Mmnxn

anlamına amaçlanmıştır matris , uygulandığında -vector , bir üreten -vector .m×nMnxmy

Matris ürünleri doğrusal dönüşümlerin bir "boru hattı" olarak düşünülebilir. Jenerik olarak diyelim ki bir olan doğrusal dönüşümler sonraki uygulamaları kaynaklanan boyutlu vektör ve için -vector alanı gelen . Bu, vektörünü art arda ve nihayet boyut vektör kümeleri boyunca alır .yaaMmn,Llm,,Bbc,AabnxnVnxnm,l,,c,b,a

Darboğaz Görünüş : boyutları (noktası 2) arttırmaz ve alt uzayları da (madde 3) yer aldığı, boşluk daha büyük boyutlara sahip değildir, çünkü, bu, aşağıdaki görüntüsünün boyutu geçemez küçük boyut boru hattında karşılaşıldı.Vnmin(a,b,c,,l,m,n)


Ardından, bu boru hattının şeması, ürününe uygulandığında sonucu tam olarak ispatlar :XX

! [buraya görüntü açıklamasını girin

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.