FA, PCA ve ICA, 'üçü' ile ilişkilidir, çünkü bunların üçü, verinin yansıtıldığı temel vektörleri aramaktadır; Temel vektörleri sadece kapsüllenen doğrusal kombinasyonlar olarak düşünün.
Örneğin, veri matrisinizin bir x matris olduğunu varsayalım, yani iki rasgele değişkeniniz var ve bunların her biri için gözleminiz var. Öyleyse bir temel vektörünü bulduğunuzu . (İlk) sinyalini çıkardığınızda, (vektör ), şöyle yapılır:Z2NNw=[0.1−4]y
y=wTZ
Bu sadece "Verilerinizin ilk satırına göre 0,1 ile çarpın ve verilerinizin ikinci satırından 4 kez çıkarın" anlamına gelir. O zaman bu değerini verir ; bu, elbette burada insert-kriterleri-maksimize etme özelliğine sahip olan x vektördür.y1N
Peki bu kriterler nelerdir?
İkinci Derece Kriterler:
PCA'da, verilerinizin varyansını 'en iyi açıklayan' temel vektörleri buluyorsunuz. İlk (yani en üst sıradaki) temel vektör, verilerinizdeki tüm varyansa en uygun olan olacaktır. İkincisinin de bu kriteri vardır, ancak birincisine dikey olmalı, vb. (PCA için bu temel vektörlerin, verilerinizin kovaryans matrisinin özvektörlerinden başka bir şey olmadığı ortaya çıkar).
FA'de, PCA ile PCA arasında fark vardır, çünkü FA üreticidir, PCA değildir. FA'yi 'gürültülü PCA' olarak tanımladığımı, burada 'gürültünün' 'özel faktörler' olarak adlandırıldığını gördüm. Yine de, genel sonuç PCA ve FA'nin ikinci dereceden istatistiklere (kovaryans) ve yukarıdaki hiçbir şeye dayanmadığı yönündedir.
Yüksek Sipariş Kriterleri:
ICA'da yine temel vektörler buluyorsunuz, ancak bu kez sonuç veren temel vektörler istiyorsunuz, öyle ki sonuçta elde edilen vektör, orijinal verinin bağımsız bileşenlerinden biri. Bunu, dördüncü dereceden bir istatistik olan normalize kurtosisin mutlak değerini maksimize ederek yapabilirsiniz. Yani, verilerinizi bazı temel vektörler üzerine yansıtıyor ve sonucun kurtozunu ölçüyorsunuz. Temel vektörünüzü biraz değiştirirsiniz (genellikle gradyan yükselişi ile) ve sonra tekrar kurtozu vb. Ölçün bileşen.
Yukarıdaki üst şema, görselleştirmenize yardımcı olabilir. ICA vektörlerinin verinin eksenlerine nasıl karşılık geldiğini açıkça görebilirsiniz (birbirinden bağımsız olarak), PCA vektörleri varyansın maksimize edildiği yönleri bulmaya çalışır. (Sonuçta olduğu gibi).
Üst şemada PCA vektörleri neredeyse ICA vektörlerine karşılık gelirlerse, bu sadece rastlantısaldır. İşte farklı veri ve karıştırma matrisinde çok farklı oldukları bir başka örnek. ;-)