Matris bir PCA (veya SVD) yaklaşımı göz önüne alındığında ile bir matris , bunu biliyoruz en düşük rütbe tahmindir .
Bu indüklenen normuna (yani en büyük özdeğer normu) veya Frobenius normuna göre mi?
Matris bir PCA (veya SVD) yaklaşımı göz önüne alındığında ile bir matris , bunu biliyoruz en düşük rütbe tahmindir .
Bu indüklenen normuna (yani en büyük özdeğer normu) veya Frobenius normuna göre mi?
Yanıtlar:
Normları tanımlamakla başlayalım. matrisi için , operatör normali ve Frobenius normu \ | X \ | _F = \ sqrt {\ sum_ {ij} X_ {ij} ^ 2} = \ mathrm {tr} (X ^ \ top X) = \ sqrt {\ sum s_i ^ 2} , burada s_i tekil değerler X , köşegen elemanları yani S tekil değer ayrışımı olarak , X = USV ^ \ En .2 ‖ x ‖ 2 = s u s ‖ x v ‖ 2‖X‖F=√
PCA, veriler merkezlendiğinde aynı tekil değer ayrışımı ile verilir. ana bileşenlerdir, ana eksenlerdir, yani kovaryans matrisinin özvektörleridir ve sadece k en büyük tekil değerlere karşılık gelen ana bileşenlerle rekonstrüksiyonu X_k = U_k S_k V_k ^ \ top ile verilmiştir .
Teoremi Eckart-Young söylüyor rekonstrüksiyon hatasının normunu minimize matristirTüm matrisler arasında dereceli . Bu hem Frobenius normu hem de operatör normu için geçerlidir. Yorumlarda @ cardinal'in işaret ettiği gibi, ilk önce 1907'de Frobenius davası için Schmidt (Gram-Schmidt ününden) Schmidt tarafından ispatlandı. Daha sonra 1936'da Eckart ve Young tarafından yeniden keşfedildi ve şimdi çoğunlukla isimleriyle ilişkilendiriliyor. Mirsky, 1958'deki teoremi üniter dönüşümler altında değişmeyen tüm normlara yaydı ve bu, operatör 2 normunu da içeriyor. ‖ X - A ‖ A k 2
Bu teoremi bazen Eckart-Young-Mirsky teoremi olarak adlandırır. Stewart (1993), Schmidt yaklaşım teoremi olarak adlandırıyor. Schmidt-Eckart-Young-Mirsky teoremi adını bile gördüm.
Let tam rütbe olması . As rank taşımaktadır , onun boş alanı vardır boyutları. En büyük tekil değerlere tekabül eden sağ tekil vektörlerinin kapsadığı alan boyutlarına sahiptir. Bu yüzden bu iki alan kesişmeli. Let kesiştiği bir birim vektör. Ardından anladık: QED.n A k n - k k + 1 X k + 1 w ‖ X - A ‖ 2 2 ≥ ‖ ( X - A ) w ‖ 2 2 = ‖ X w ‖ 2 2 = k + 1 ∑ i = 1 s 2 i ( v ⊤ ı w ) 2 ≥ s 2
en aza indiren dereceli matrisini bulmak istiyoruz . Biz çarpanlara edebilir nerede, sahiptir ortonormal sütunları. Sabit için simge durumuna çözümünde bir gerileme sorunudur . Taktığımızda, şimdi burada , kovaryans matrisidir , yanik ‖ X - A ‖ 2 F A = B W ⊤ W k ‖ X - B W ⊤ ‖ 2 W B = X W ‖ X - X W W ⊤ ‖ 2 = ‖ X ‖ 2 - ‖ X W W ⊤ ‖ 2 = c o n s t - t r (
Bu ilk olduğu iyi bilinmektedir kovaryans matrisinin öz vektörleri. Gerçekten de, eğer , o zaman . Yazma da ortonormal sütun, bundan elde bulunur en fazla olduğunda elde . Teorem daha sonra hemen takip eder.
Aşağıdaki üç ilgili konuya bakın:
Bu kanıtı çevrimiçi bir yerde buldum ama yorumlarda @ cardinal tarafından açıklandığı gibi yanlış (bir boşluk içeriyor).
Frobenius normu üniter dönüşümler altında değişmez çünkü tekil değerleri değiştirmezler. Öyleyse anladık: burada . Devam: tüm köşegen dışı unsurları sıfır olduğunda ve tüm köşegen terimleri en büyük tekil değerlerini [burada boşluğu: açık değil] , yani ve dolayısıyla .