Daki (ortalanmış) veri saklanabilir Let matris ile sütunlar ve özellikler (değişken) satır veri noktaları. Let kovaryans matrisi sütunlarında vektörlerini sahip diyagonal ve özdeğerler , böylece .n×dXdnC=X⊤X/nEDC=EDE⊤
Sonra "normal" PCA beyazlatma transformasyon tarafından verilen dediğimiz , mesela benim cevaba bakınız kullanarak veri beyazlatmak için nasıl temel bileşenler Analizi?WPCA=D−1/2E⊤
Ancak, bu beyazlatma dönüşümü benzersiz değildir. Aslında, beyazlatılmış veriler herhangi bir dönüşten sonra beyazlatılmış olarak kalacaktır; bu , ortogonal matrisli , nin de beyazlatıcı bir dönüşüm olacağı anlamına gelir. ZCA beyazlatma denilen şeyde, (kovaryans matrisinin özvektörleri birlikte yığılmış) bu ortogonal matris olarak , yaniW=RWPCARE
WZCA=ED−1/2E⊤=C−1/2.
ZCA dönüşümünün tanımlayıcı özelliklerinden biri ( bazen "Mahalanobis dönüşümü" olarak da bilinir), orijinal verilere mümkün olduğunca yakın olan beyazlatılmış verilerle sonuçlanır (en küçük kareler anlamında). Başka bir deyişle, topunun beyazlatılmasına tabi tutulmasını istiyorsanız, o zaman . İşte bir 2D resmi:∥X−XA⊤∥2XA⊤A=WZCA
Sol alt nokta verileri ve ana eksenlerini gösterir. Dağılımın sağ üst köşesindeki koyu gölgelemeye dikkat edin: yönünü işaretler. İkinci alt grafikte satırları gösterilir: bunlar verinin yansıtıldığı vektörlerdir. Beyazlattıktan sonra (altta) dağılım yuvarlak görünür, ancak döndüğünü de görürsünüz --- karanlık köşe artık Doğu-Doğu tarafında, Doğu-Doğu tarafındadır. satırları üçüncü alt bölümde gösterilir (ortogonal olmadıklarına dikkat edin!). Beyazlattıktan sonra (aşağıda) dağılım yuvarlak görünür ve orijinalle aynı şekilde yönlendirilir. Tabii ki, PCA beyazlatılmış verilerinden ile döndürülerek ZCA beyazlatılmış verilere ulaşılabilir .WPCAWZCAE
"ZCA" terimi, 1996’da Bell ve Sejnowski’de tanıtıldı.bağımsız bileşen analizi bağlamında ve "sıfır faz bileşen analizi" anlamına gelir. Daha fazla bilgi için oraya bakınız. Muhtemelen, bu terim görüntü işleme bağlamında karşılaştınız. Bir dizi doğal görüntüye (özellik olarak pikseller, her bir veri noktası olarak pikseller) uygulandığında, ana eksenlerin artan frekanslarda Fourier bileşenleri gibi göründüğü görülüyor, aşağıdaki Şekil 1'in ilk sütununa bakınız. Bu yüzden çok "küresel". Öte yandan, ZCA dönüşümünün satırları çok “yerel” görünüyor, ikinci sütuna bakın. Bu tam olarak ZCA'nın verileri olabildiğince az miktarda dönüştürmeye çalıştığından ve bu nedenle her satırın orijinal temel işlevlerine (yalnızca bir tane aktif piksel içeren görüntüler) daha yakın olması gerekir. Ve bunu başarmak mümkündür.
Güncelleme
ZCA filtrelerinin ve ZCA ile dönüştürülmüş görüntülerin daha fazla örneği Krizhevsky, 2009, Minik Resimlerden Birden Çok Özellik Katmanı Öğrenmek bölümünde verilmiştir .
Bu örneklerin ZCA beyazlamasının PCA'ya ne zaman tercih edilebileceği konusunda bir fikir verdiğini düşünüyorum. Yani ZCA ile beyazlatılmış görüntüler normal görüntülere benzerken PCA ile beyazlatılmış görüntüler normal görüntülere benzemiyor. Bu, muhtemelen komşu pikselleri bir arada ele alan ve doğal görüntülerin yerel özelliklerine büyük ölçüde dayanan evrişimli sinir ağları (örneğin, Krizhevsky'nin makalesinde kullanılan) gibi algoritmalar için önemlidir . Diğer birçok makine öğrenme algoritması için verilerin PCA veya ZCA ile beyazlatılmış olması kesinlikle önemsiz olmalıdır .