Temel bileşen analizini kullanarak verileri beyazlatma nasıl yapılır?


18

Verilerimi X varyanslar bir olacak ve kovaryanslar sıfır olacak şekilde dönüştürmek istiyorum (yani verileri beyazlatmak istiyorum). Ayrıca, araçlar sıfır olmalıdır.

Oraya Z standardizasyonu ve PCA-dönüşümü yaparak ulaşacağımı biliyorum, ama hangi sırayla yapmalıyım?

Kombine beyazlatma dönüşümünün biçiminde olması gerektiğini eklemeliyim xWx+b.

PCA'ya benzer şekilde hem bu dönüşümleri tam olarak yapan hem de yukarıdaki formun formülünü veren bir yöntem var mı?


(İlk yorumum sorunuzun yanlış anlaşılmasına dayanıyordu.) PCA size sıfır kovaryans verir; daha sonra isterseniz PC'leri standart hale getirebilirsiniz. Kulağa tuhaf geliyor, ama bunu yapabilirsiniz.
Nick Cox

@NickCox Belki de tuhaf görünüyor çünkü dönüştürülen veriler daha sonra küresel, bu da bilgilendirici değil. Ancak, sonuç olarak değil, bilmem gereken dönüşümdür. Hala dönüşümün nasıl olacağını bilmiyorum. Yine de PCA'da okumaya devam ediyorum.
Angelorf

Yanıtlar:


31

İlk olarak, ortalama çıkararak ortalama sıfırı elde edersiniz .μ=1Nx

İkincisi, PCA yaparak kovaryansları sıfır alırsınız. Eğer verilerin kovaryans matrisidir, daha sonra PCA bir eigendecomposition gerçekleştirmek tutarındadır , burada olduğu ve özvektörlerinden oluşan dikey bir dönme matrisi , diyagonal üzerinde özdeğerleri olan bir çapraz matristir. Matrix , verilerin ilişkisini kaldırmak için gereken bir döndürme sağlar (örn. Orijinal özellikleri temel bileşenlerle eşler).Σ = U Λ UU Σ Λ UΣΣ=UΛUUΣΛU

Üçüncü olarak, rotasyondan sonra her bileşen karşılık gelen bir özdeğer tarafından varyansa sahip olacaktır. Yani marka için eşit sapmalar , sen karekökü ile böl gerekir  .1Λ

Hep birlikte, beyazlatma dönüşümü . Aradığınız formu almak için köşeli parantezleri açabilirsiniz.xΛ1/2U(xμ)


Güncelleme. Daha fazla ayrıntı için bu sonraki konuya da bakın: ZCA beyazlatma ve PCA beyazlatma arasındaki fark nedir?


2
Bence özdeğerlerin kare köklerine bölmeniz gerekiyor, çünkü bu varyans değil, SD ile ölçeklendirme meselesidir.
Nick Cox

@ NickCox: evet, elbette haklısın. Cevabımı düzelttim. Teşekkür ederim!
amip diyor Reinstate Monica

1
Formülü ampirik olarak doğruladım. Bana yardım ettiğin için teşekkürler!
Angelorf
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.