PCA amaç fonksiyonu: varyansı maksimize etmek ve hatayı minimize etmek arasındaki bağlantı nedir?


32

PCA algoritması, korelasyon matrisi açısından formüle edilebilir ( verilerinin Xzaten normalize olduğunu ve yalnızca ilk PC'ye yansımayı düşünüyoruz). Amaç işlevi şöyle yazılabilir:

maxw(Xw)T(Xw)s.t.wTw=1.

Bu iyi ve biz bunu çözmek için Lagrangian çarpanlarını kullanıyoruz.

maxw[(Xw)T(Xw)λwTw],

hangi eşdeğer

maxw(Xw)T(Xw)wTw,

ve bu yüzden ( burada MathWorld bkz ) değerine eşit olacak gibi görünüyor

maxwi=1n(distance from point xi to line w)2.

Ancak bu nokta ve çizgi arasındaki mesafeyi en üst düzeye çıkarmak olduğunu söylüyor ve burada okuduklarımdan itibaren , bu yanlış - fazlamin değil, olması gerekiyor max. Benim hatam nerde?

Veya, birisi bana öngörülen uzayda varyansı maksimize etmek ile nokta ve çizgi arasındaki mesafeyi minimize etmek arasındaki bağlantıyı gösterebilir mi?


Bileşenlerin diklik ölçütünü karşılamak için asgari mesafenin kullanıldığını düşünüyorum. Noktalar birbirlerine dik olan PC'lere yansıtılır, ancak art arda gelen her bileşende kalan varyans maksimize edilir.
Michael R. Chernick 12:12

İpucu: İlk önce en küçük özdeğer yerine en küçük özdeğer olduğunu düşündüğünüzde ne olur ?
whuber

@whuber En küçük özdeğer, muhtemelen nihai amaç işlevinin çözümü olan PC'ye sahiptir. Ancak bu PC orijinal amaç işlevini en üst düzeye çıkarmaz.
Cam.Davidson.Pilon

2
"Nihai" ve "orijinal" objektif işlev derken ne demek istediğinizi anlamadım. PCA (kavramsal olarak) bir optimizasyon programı değildir. Çıktı sadece bir değil, bir dizi ana yöndür. Bu yönlendirmelerin bir dizi sınırlı ikinci dereceden programın çözülmesiyle bulunabileceği (ilginç) bir matematik teoremidir, ancak bu PCA kavramları veya uygulamaları için temel değildir. Ben sadece, en büyüğünden ziyade en küçük özdeğere odaklanarak, (1) mesafeleri en aza indiren ve (2) PCA'nın optimizasyon görüntüsünü alarak iki fikrini uzlaştırabilirsiniz.
whuber

1
Sorun değil - cevabınız yapmaya çalıştığım şeyin yanlış olmayan versiyonuydu.
Cam.Davidson.Pilon

Yanıtlar:


42

Let olmak ortalanmış bir veri matrisi satır gözlemler. Let olarak da kovaryans matrisi. Let değişken alan bir eksen belirten bir birim vektör. Biz istiyoruz ilk anapara eksen olmak.XnΣ=XX/(n1)ww

İlk yaklaşıma göre, ilk ana eksen projeksiyonunun varyansını maksimize eder (ilk ana bileşenin varyansı). Bu değişiklikXw

Var(Xw)=wXXw/(n1)=wΣw.

İkinci yaklaşıma göre, ilk ana eksen ve onun yeniden yapılanması arasındaki yeniden yapılanma hatasını en aza indirir , yani orijinal noktalar ve bunların üzerine çıkarılan kare uzaklıkların toplamı . İmar hatası karesi XXwww

XXww2=tr((XXww)(XXww))=tr((XXww)(XwwX))=tr(XX)2tr(XwwX)+tr(XwwwwX)=consttr(XwwX)=consttr(wXXw)=constconstwΣw.

Ana terimden önce eksi işaretine dikkat edin. Bu nedenle, yeniden yapılanma hatasını en aza indirgemek , varyans olan değerini en üst düzeye çıkarmaktır . Dolayısıyla yeniden yapılanma hatasını en aza indirgemek, varyansı en üst düzeye çıkarmakla aynıdır; Her iki formülasyon da aynı verim .wΣww


Fark şey, değil ile ilgili olarak bir dışbükey fonksiyonu ( olarak ? PSD Nasıl gelip bunu maksimize etmeyewTΣwwΣ
Royi

@ amoeba tr () 'dan son adımda const' a nasıl geçtiğinizi açıklayabilir misiniz?
alberto,

1
@ alberto İz içindeki şey bir sayıdır (1x1 matris); Bir sayının izi bu sayının kendisidir, bu nedenle iz kaldırılabilir. Sabit, , değerine eşit olduğu için görünür , bu nedenle bu faktörü vardır. ΣXX/n1/n
amip diyor Reinstate Monica

1
@Leullame Ortonormal sütunları olan bir matris ise hesaplama için sözlü tutacaktır . Satır # 3'den satır # 4'e gitmek için ihtiyacınız var . Matris Eğer ortonormal sütun vardır, o zamana bir çıkıntı olacak sütun tarafından kapsanan matrisini (burada bir satır vektördür). WWW=IWxWWxWx
amip diyor Reinstate Monica

1
@ DanielLópez Peki, yeniden yapılanma hatasını en aza indiren 1 boyutlu bir alt uzay arıyoruz. 1 boyutlu bir alt uzay, alındığı yönünü gösteren bir birim norm vektörüyle tanımlanabilir . Yapısal olarak birim normuna sahiptir. w
amip diyor Reinstate Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.