Daha sonra bağımsız bir bileşen analizi (ICA) gerçekleştirmek için dalga formlarımı önceden işlemek için uygun adımlar nelerdir ? Nasıl olduğunu anlıyorum, bununla ilgili daha fazla açıklama acı vermiyor, ama nedeniyle daha fazla ilgileniyorum.
Daha sonra bağımsız bir bileşen analizi (ICA) gerçekleştirmek için dalga formlarımı önceden işlemek için uygun adımlar nelerdir ? Nasıl olduğunu anlıyorum, bununla ilgili daha fazla açıklama acı vermiyor, ama nedeniyle daha fazla ilgileniyorum.
Yanıtlar:
Bağımsız bileşen analizi (ICA), istatistiksel olarak bağımsız ve en önemlisi Gauss olmayan † bileşenlerin doğrusal bir karışımını bileşenlerine ayırmak için kullanılır. Gürültüsüz bir ICA için standart model
burada , gözlem veya veri vektörüdür, s , bir kaynak sinyali / orijinal bileşenlerdir (Gauss olmayan) ve A , oluşturucu sinyallerin doğrusal karışımını tanımlayan bir dönüşüm vektörüdür. Tipik olarak A ve s bilinmemektedir.
ICA'da merkezleme ve beyazlatma / küreleştirme olmak üzere iki ana ön işleme stratejisi vardır. Ön işlemenin başlıca nedenleri:
G. Li ve J. Zhang'ın girişinden itibaren, "Sphering ve özellikleri", The Indian Journal of Journal, Vol. 60, Seri A, Bölüm I, s. 119-133, 1998:
Aykırı değerler, kümeler veya diğer tür gruplar ve eğriler veya yüzey olmayan yüzeylerin yakınındaki konsantrasyonlar muhtemelen veri analistlerinin ilgisini çeken önemli özelliklerdir. Genel olarak, sadece örnek ortalama ve kovaryans matrisi hakkında bilgi ile elde edilemezler. Bu durumlarda, ortalama ve kovaryans matrislerinde yer alan bilgilerin ayrılması istenir ve bizi, iyi anlaşılmış doğaların dışındaki veri setlerimizin yönlerini incelemeye zorlar. Merkezleme ve küreleme, ortalama kovaryans bilgisini ortadan kaldıran ve yapıları doğrusal korelasyon ve eliptik şekillerin ötesinde vurgulamaya yardımcı olan basit ve sezgisel bir yaklaşımdır ve bu nedenle genellikle veri kümelerinin ekranlarını veya analizlerini keşfetmeden önce gerçekleştirilir
1. Merkezleme:
Merkezleme çok basit bir işlemdir ve ortalama değerinin çıkarılması anlamına gelir . Pratikte, örnek ortalamayı kullanır ve yeni bir x c = x - ¯ x vektörü oluşturursunuz , burada ¯ x verilerin ortalamasıdır. Geometrik olarak, ortalamanın çıkarılması, koordinat merkezinin başlangıç noktasına çevrilmesine eşdeğerdir . Ortalama her zaman sonuca yeniden eklenebilir (bu mümkündür çünkü matris çarpımı dağıtıcıdır).
2. Beyazlatma:
hangi bir kovaryansa sahip olacak . Geometrik olarak, beyazlatma bir ölçeklendirme dönüşümüdür. Mathematica'da küçük bir örnek:
s = RandomReal[{-1, 1}, {2000, 2}];
A = {{2, 3}, {4, 2}};
x = s.A;
whiteningMatrix = Inverse@CholeskyDecomposition[Transpose@x.x/Length@x];
y = x.whiteningMatrix;
FullGraphics@GraphicsRow[
ListPlot[#, AspectRatio -> 1, Frame -> True] & /@ {s, x, y}]
İlk grafik, eşit olarak dağılmış iki rasgele vektörün veya bileşenlerin eklem yoğunluğudur. . İkincisi, bir dönüşüm vektörü ile çarpmanın etkisini gösterir. Kare çarpık ve eşkenar dörtgen şeklinde ölçeklendirilir. Beyazlatma matrisi ile çarpılarak, eklem yoğunluğu orijinalden hafifçe döndürülen bir kareye geri döner.
Because of the whitening transformation, in the new system that is being solved, i.e. , is an orthogonal matrix. This can be easily shown:
where the last step follows because of the statistical independence of The orthogonality condition means that there are only about half as many parameters that need to be estimated. (Note: Although this is true in this case and in my example, need not be square to begin with).
If, after the transformation, there are eigenvalues close to zero, then these can be safely discarded as they are just noise and will only hamper the estimation due to "overlearning".
3. Other pre-processing
There might be other pre-processing steps involved in certain specific applications that are impossible to cover in an answer. For example, I've seen a few articles which use the log of the time-series and a few others that filter the time-series. While it might be suited for their particular application/conditions, the results don't carry over to all fields.
†I believe it is possible to use ICA if at most one of the components is Gaussian, although I can't find a reference for this right now.
This is probably well known, but just as a fun fact, sphering comes from the change in the structure of covariance matrices in the case of Gaussian components from an -dimensional hyper ellipsoid to an -dimensional sphere due to whitening. Here's an example (use the same code as above, but replace {-1,1}
with NormalDistribution[]
)
The first is the joint density for two uncorrelated Gaussians, the second under transformation and the third is after whitening. In practice only steps 2 and 3 are visible.