PCA durumunda, "varyans", toplam varyans veya çok değişkenli değişkenlik veya genel değişkenlik veya toplam değişkenlik anlamına gelir . Aşağıda bazı 3 değişkenin kovaryans matrisi verilmiştir. Varyansları köşegen üzerindedir ve 3 değerin toplamı (3.448) genel değişkenliktir.
1.343730519 -.160152268 .186470243
-.160152268 .619205620 -.126684273
.186470243 -.126684273 1.485549631
Şimdi PCA, orjinal değişkenleri ortogonal olan (yani sıfır kovaryansa sahip olan) ve değişken düzende (özdeğerler denilen) varyansa sahip ana bileşenler adı verilen yeni değişkenlerle değiştirir. Dolayısıyla, yukarıdaki verilerden elde edilen ana bileşenler arasındaki kovaryans matrisi şu şekildedir:
1.651354285 .000000000 .000000000
.000000000 1.220288343 .000000000
.000000000 .000000000 .576843142
Köşegen toplamın hala 3.448 olduğunu ve bunun 3 bileşenin tümünün çok değişkenli değişkenliği oluşturduğunu söyleyin. Birinci ana bileşen, 1.651 / 3.448 = toplam değişkenliğin% 47.9'unu; ikincisi 1.220 / 3.448 =% 35.4'ü açıklar; 3. kişi .577 / 3.448 =% 16.7’yi açıklamaktadır.
Öyleyse, " PCA varyansı maksimuma çıkarır " veya " PCA maksimum varyansı açıklar " derken ne demek istiyorlar ? Tabii ki, bu üç değer arasında en büyük varyansı bulması değil 1.343730519 .619205620 1.485549631
, hayır. PCA, veri alanında, toplam varyansın dışındaki en büyük varyansa sahip boyutu (yönü) bulur . Bu en büyük varyans olurdu . Daha sonra, ikinci en büyük varyansın boyutuna, ilkine dik, kalan toplam varyansın dışına çıkar . Bu 2. boyut varyans olurdu . Ve bunun gibi. Kalan son boyut varyanstır. Ayrıca burada "Pt3" ve buradaki büyük cevaba bakınız.1.343730519+.619205620+1.485549631 = 3.448
1.651354285
3.448-1.651354285
1.220288343
.576843142
Nasıl yapıldığını daha ayrıntılı olarak açıklamak.
Matematiksel olarak PCA, öz ayrıştırma veya svd ayrıştırma adı verilen doğrusal cebir işlevleri aracılığıyla gerçekleştirilir. Bu işlevler size tüm özdeğerleri 1.651354285 1.220288343 .576843142
(ve karşılık gelen özvektörleri) bir kerede döndürür ( bkz , bkz. ).