Bağımsız Bileşen Analizi yapmak için uygun ön işleme adımları nelerdir?

Daha sonra bağımsız bir bileşen analizi (ICA) gerçekleştirmek için dalga formlarımı önceden işlemek için uygun adımlar nelerdir ? Nasıl olduğunu anlıyorum, bununla ilgili daha fazla açıklama acı vermiyor, ama nedeniyle daha fazla ilgileniyorum.

preprocessing ica

— jonsca
kaynak

Neden ön işleme ihtiyaç duyduğunuzdan emin değilim. Belirli bir nedeni var mı?

— Phonon

@Phonon Üzerinde ICA yapmadan önce verilerini toplayan araştırmacılarla karşılaştım. Standart bir yöntem olup olmadığını merak ettim.

— jonsca

Çok ilginç. Yapıcı bir cevap görmek isterim.

— Phonon

EEG sinyalleri üzerinde spektral analiz durumunda, insanlar spektrumun

şeklinin baskın etkisini azaltmak için beyazlar , bu da genellikle yüksek frekanslarda ilginç şeyleri gizler. Burada ek materyallerde en azından küçük bir tartışma var . Bunun özellikle ICA'dan önce ortak bir hile olup olmadığı, emin değilim. Uygulamanız EEG / MEG / LFP sinyalleri mi? Belki ICA yapan biri, önsezim haklıysa, bunu tam bir cevap haline getirebilir. İlginç bir soru - Bunu okuyacağım.

1 / f

${1}/{f}$

— ImAlsoGreg

@Gigili Bu da sorunun bir parçası. Hangileri normal adımlar olarak kabul edilir?

— jonsca

Bağımsız bileşen analizi (ICA), istatistiksel olarak bağımsız ve en önemlisi Gauss olmayan ^† bileşenlerin doğrusal bir karışımını bileşenlerine ayırmak için kullanılır. Gürültüsüz bir ICA için standart model

x = A s

$\mathbf{x}=\mathbf{As}$

burada , gözlem veya veri vektörüdür, , bir kaynak sinyali / orijinal bileşenlerdir (Gauss olmayan) ve , oluşturucu sinyallerin doğrusal karışımını tanımlayan bir dönüşüm vektörüdür. Tipik olarak ve bilinmemektedir. $\mathbf{x}$ $\mathbf{s}$ $\mathbf{A}$ $\mathbf{A}$ $\mathbf{s}$

Ön işleme

ICA'da merkezleme ve beyazlatma / küreleştirme olmak üzere iki ana ön işleme stratejisi vardır. Ön işlemenin başlıca nedenleri:

Algoritmaların basitleştirilmesi
Sorunun boyutsallığının azaltılması
Tahmin edilecek parametre sayısının azaltılması.
Ortalama ve kovaryans ile kolayca açıklanmayan veri kümesinin vurgulama özellikleri.

G. Li ve J. Zhang'ın girişinden itibaren, "Sphering ve özellikleri", The Indian Journal of Journal, Vol. 60, Seri A, Bölüm I, s. 119-133, 1998:

Aykırı değerler, kümeler veya diğer tür gruplar ve eğriler veya yüzey olmayan yüzeylerin yakınındaki konsantrasyonlar muhtemelen veri analistlerinin ilgisini çeken önemli özelliklerdir. Genel olarak, sadece örnek ortalama ve kovaryans matrisi hakkında bilgi ile elde edilemezler. Bu durumlarda, ortalama ve kovaryans matrislerinde yer alan bilgilerin ayrılması istenir ve bizi, iyi anlaşılmış doğaların dışındaki veri setlerimizin yönlerini incelemeye zorlar. Merkezleme ve küreleme, ortalama kovaryans bilgisini ortadan kaldıran ve yapıları doğrusal korelasyon ve eliptik şekillerin ötesinde vurgulamaya yardımcı olan basit ve sezgisel bir yaklaşımdır ve bu nedenle genellikle veri kümelerinin ekranlarını veya analizlerini keşfetmeden önce gerçekleştirilir

1. Merkezleme:

Merkezleme çok basit bir işlemdir ve ortalama değerinin çıkarılması anlamına gelir . Pratikte, örnek ortalamayı kullanır ve yeni bir vektörü oluşturursunuz , burada verilerin ortalamasıdır. Geometrik olarak, ortalamanın çıkarılması, koordinat merkezinin başlangıç noktasına çevrilmesine eşdeğerdir . Ortalama her zaman sonuca yeniden eklenebilir (bu mümkündür çünkü matris çarpımı dağıtıcıdır). $\mathbb{E}\{\mathbf{x}\}$ $\mathbf{x}_c=\mathbf{x}-\overline{\mathbf{x}}$ $\overline{\mathbf{x}}$

2. Beyazlatma:

$\mathbb{E}\{\mathbf{x}_c\mathbf{x}_c^T\}=\mathbf{I}$

\hat{Σ} = C . x_{c} x_{c}^{T}

$\widehat{\mathbf{\Sigma}}=C.\mathbf{x}_c\mathbf{x}_c^T$

$C$ $\mathbf{x}$

x_{w} = {\hat{Σ}}^{- 1 / 2} x_{c}

$\mathbf{x}_w=\widehat{\mathbf{\Sigma}}^{-1/2}\mathbf{x}_c$

hangi bir kovaryansa sahip olacak $\mathbf{I}$ . Geometrik olarak, beyazlatma bir ölçeklendirme dönüşümüdür. Mathematica'da küçük bir örnek:

s = RandomReal[{-1, 1}, {2000, 2}];
A = {{2, 3}, {4, 2}};
x = s.A;
whiteningMatrix = Inverse@CholeskyDecomposition[Transpose@x.x/Length@x];
y = x.whiteningMatrix;
FullGraphics@GraphicsRow[
  ListPlot[#, AspectRatio -> 1, Frame -> True] & /@ {s, x, y}]

enter image description here

İlk grafik, eşit olarak dağılmış iki rasgele vektörün veya bileşenlerin eklem yoğunluğudur. $\mathbf{s}$ . İkincisi, bir dönüşüm vektörü ile çarpmanın etkisini gösterir $\mathbf{A}$ . Kare çarpık ve eşkenar dörtgen şeklinde ölçeklendirilir. Beyazlatma matrisi ile çarpılarak, eklem yoğunluğu orijinalden hafifçe döndürülen bir kareye geri döner.

Because of the whitening transformation, in the new system that is being solved, i.e. $\mathbf{x}_w=\mathbf{A}_w\mathbf{s}_w$ , $\mathbf{A}_w$ is an orthogonal matrix. This can be easily shown:

\begin{aligned} E {x_{w} x_{w}^{T}} & = E {A_{w} s_{w} (A_{w} s_{w})^{T}} \\ = A_{w} E {s_{w} s_{w}^{T}} A_{w}^{T} \\ = A_{w} A_{w}^{T} = I \end{aligned}

$\begin{align} \mathbb{E}\{\mathbf{x}_w\mathbf{x}_w^T\}&=\mathbb{E}\{\mathbf{A}_w\mathbf{s}_w(\mathbf{A}_w\mathbf{s}_w)^T\}\\ &=\mathbf{A}_w\mathbb{E}\{\mathbf{s}_w\mathbf{s}_w^T\}\mathbf{A}_w^T\\ &=\mathbf{A}_w\mathbf{A}_w^T=\mathbf{I} \end{align}$

where the last step follows because of the statistical independence of $\mathbf{s}_i$ The orthogonality condition means that there are only about half as many parameters that need to be estimated. (Note: Although this is true in this case and in my example, $\mathbf{A}$ need not be square to begin with).

If, after the transformation, there are eigenvalues close to zero, then these can be safely discarded as they are just noise and will only hamper the estimation due to "overlearning".

3. Other pre-processing

There might be other pre-processing steps involved in certain specific applications that are impossible to cover in an answer. For example, I've seen a few articles which use the log of the time-series and a few others that filter the time-series. While it might be suited for their particular application/conditions, the results don't carry over to all fields.

^†_{I believe it is possible to use ICA if at most one of the components is Gaussian, although I can't find a reference for this right now.}

Why is it called "sphering"?

This is probably well known, but just as a fun fact, sphering comes from the change in the structure of covariance matrices in the case of Gaussian components from an $n$ -dimensional hyper ellipsoid to an $n$ -dimensional sphere due to whitening. Here's an example (use the same code as above, but replace {-1,1} with NormalDistribution[])

enter image description here

The first is the joint density for two uncorrelated Gaussians, the second under transformation and the third is after whitening. In practice only steps 2 and 3 are visible.

— Lorem Ipsum
kaynak

Wow, It's going to take me a bit to take that all in, but thanks is an understatement!

— jonsca

Sorry, I thought I'd accepted it already.

— jonsca