PCA otokorelasyonlu verilerle ne yapıyor?


9

Bazı muhabirlerin otokorelasyon hesaplama yöntemleri hakkında ilginç bir soru sordukları için, neredeyse zaman serileri ve otokorelasyon hakkında hiçbir bilgi sahibi olmadan onunla oynamaya başladım.

Muhabir verilerini düzenledi (32 bir zaman serisinin veri noktaları) her birinin yanında birer birer gecikmeli olarak kaydırılır, böylece 32x32 ilk satırın orijinal veri olduğu ikinci satır, verilerin kaydırdığı veri 1zaman birimi, bir sonraki satır diğeri vb. Bunu sonuna kadar kuyruğa yapıştırarak ve böylece "dairesel" veri setleri yaparak fark ettim.

Sonra, sadece bundan ne çıkabileceğine bakmak için, korelasyon matrisini ve bundan temel bileşenleri hesapladım. Şaşırtıcı bir şekilde, bir frekans ayrışması görüntüsü aldım ve (yine diğer verilerle) bir frekans,32 Veriler ilk temel bileşendeydi ve dört periyotla ikinci PC'deydi vb. 6 özdeğerli "ilgili" bilgisayarlar >1). İlk olarak bunun giriş verilerine bağlı olduğunu düşündüm, ancak şimdi bunun dairesel olarak (Toeplitz "matrisi olarak da bilinir) veri setinin özel setiyle sistematik olarak olduğunu varsayıyorum. PC-çözeltisinin varimax veya diğer rotasyon kriterlerine rotasyonları, biraz farklı ve muhtemelen ilginç sonuçlar verdi, ancak genel olarak böyle bir frekans ayrışımı sağladı gibi görünüyor.

İşte bağlantısıdır yaptığım resimlerin den32- nokta veri kümesi; eğriler basitçe faktörmatrisin yüklemelerinden yapılır: bir eğri yükleri bir faktör üzerindeki. İlk PC1'in eğrisi en yüksek genlikleri göstermelidir (kabaca en yüksek yükleme miktarını taşıdığı için)

Sorular:

  • Q1: bu tasarım tarafından bir özellik Olduğunu? (bu tür bir veri kümesine sahip PCA'nın)
  • S2: Bu yaklaşım gerçekten bir şekilde frekans / dalga boyu analizinde ciddi bir yaklaşım için kullanılabilir mi?

[güncelleme] İşte veri seti (umarım sizin için kopyalanabilir olur)

-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4
-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5
-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3
0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1
2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0
4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2
6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4
5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6
3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5
1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3
1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1
0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1
-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0
-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2
-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3
0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1
3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0
5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3
7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5
6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7
7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6
5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7
4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5
3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4
2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3
3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2
5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3
4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5
3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4
2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3
3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2
4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3

@Amoeba ve düzenleme için teşekkürler. Daha sonra düzenlemek istediğim sadece iki hata gördüm, soru şimdi çok daha hoş görünüyor!
Gottfried Helms

Yanıtlar:


4

Önceki yorumumu bir cevaba dönüştürmeme izin verin.

Veri matrisinizdeki satırların değişkenler veya örnekler olduğunu düşünüyor musunuz? Bunların örnek olduğunu varsayacağım: yanin=32 farklı zaman serileri (örnekler).

Sonra, eğer hepsi n=32 satırlar aynıdır, ancak yalnızca dairesel olarak kaydırılır 1 her birini konumlandırın, sonra nxnTüm sıra çiftleri arasındaki nokta ürünlerden oluşan verilerin gram matrisi Toeplitz yapısına sahip olacaktır: diyagonaline yakın yüksek değerler ve kademeli olarak ondan uzakta sıfır değerlere düşme. Toeplitz matrisleri, özvektörleri (ve Gram matrisinin özvektörleri, ölçeklendirmeye kadar ana bileşenler) olduğu için ardışık Fourier modlarına sahiptir, bu nedenle Q1'inize evet : PC olarak artan frekansların sinüzoidal dalgalarını almanız şaşırtıcı değildir.

Yararlı olup olmadığı hakkında hiçbir fikrim yok (S2). Deneyimlerime göre, can sıkıcı bir eser olarak ortaya çıkma eğilimindedir. Yani insanlar bazı verilere sahipler, PCA'dan Fourier modlarına benzeyen bir şey elde ediyorlar ve ne anlama geldiklerini merak etmeye başlıyorlar, oysa bunlar sadece orijinal zaman serisindeki zaman değişimlerinden kaynaklanıyor.


Çok güzel, teşekkürler! Evet, verileri satırlar boyunca düşündüm. Q2 de geliyor çünkü bugüne kadar Fourier analizinin tam olarak nasıl çalıştığını hiç anlamadım - ve yanlışlıkla bu bir sezgi almak için bir adım olabilirdi (ama bu belirsiz umut burada gerçekten sonuçsuz görünüyor ...)
Gottfried Helms

Bu arada, 32 değerli zaman serilerinizi paylaşmayı düşünür müsünüz? Gram matrisini gösteren bir rakam eklemek istiyorum ve bunu doğrudan verilerinizle yapabilirim.
amip

Sorumdaki bağlantıyı gördün mü? Exce.l kullanarak yaptığım bir web sayfasına yönlendiriyor. Ekranın altındaki sekme çubuğundaki bir clik tarafından kurulumumda "firefox" tarafından seçilebilen 4 veya 5 alt sayfa var. İlk alt sayfa veri listesini gösterir. Ancak dikey olarak: yeni bir tabloda ilk satır olarak almalı ve sağa bisiklet sürerken 31 satır eklemelidir. Bu rahatsız edici ise ben de benim sorum veri eklemek ...
Gottfried Helms

Vay canına, bunun sadece bir ekran görüntüsü değil, tüm çevrimiçi bir elektronik tablo olduğunu fark etmedim! Teşekkürler.
amip
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.