PCA zaman serisi verileri için uygulanabilir mi?


22

Temel Bileşen Analizinin (PCA) temel olarak kesitsel veriler için uygulanabileceğini anlıyorum. PCA, yılı zaman serisi değişkeni olarak belirterek ve PCA'yı normal şekilde çalıştırarak zaman serisi verileri için etkili bir şekilde kullanılabilir mi? Dinamik PCA'nın panel verileri için çalıştığını ve Stata'daki kodlamanın zaman serileri için değil panel verileri için tasarlandığını buldum. Zaman serisi verileri üzerinde çalışan belirli bir PCA türü var mı?

Güncelleme. Açıklayayım.

Şu anda Hindistan'da Altyapı için karayolu uzunluğu, demiryolu güzergahı uzunluğu, elektrik üretim kapasitesi, telefon abonesi sayısı vb. Değişkenler içeren bir endeks oluşturuyorum. 1 ülke için 22 yıldan 12 yıla kadar 12 değişkenim var. PCA'yı zaman serilerine ve hatta panel verilerine uygulayan makaleleri gözden geçirmiş olmama rağmen, PCA, varsayımın varsayıldığı kesitsel veriler için tasarlanmıştır. Panel ve kesitsel veriler verileri ihlal eder ve PCA, içindeki zaman serisi boyutunu dikkate almaz. Dinamik PCA'nın yalnızca panel verilerine uygulandığını gördüm. Zaman serisi uygulanan veya zaman serisi değişkeni olarak tanımlanan yıl ile statik PCA çalışan belirli bir PCA olup olmadığını bilmek istiyorum iş yapacak?


2
Tekil Spektrum Analizi (SSA) genellikle zaman serileri için PCA olarak adlandırılır. en.wikipedia.org/wiki/Singular_spectrum_analysis
Vladislavs Dovgalecs

1
Lütfen sağ taraftaki kenar çubuğundaki (->) hem PCA'ya hem de zaman serisine gönderme yapan bazı yayınları inceleyin. Sorunuz yanıtlanırsa, lütfen buradaki yorumlara bağlantı verin, ancak hiçbiri yanıt vermezse, sorunun bunlardan herhangi birinden nasıl farklı olduğunu açıklayabilirsiniz.
Glen_b -Manica Monica

Hiçbiri zaman serisi ile ilgili pca sorusuna cevap vermiyor. Konuyla ilgili özel sorular ya bilim ile ilgilidir ya da cevapsız bırakılmıştır.
Nisha Simon

5
PCA, veri dönüşümü, boyut küçültme, keşif ve görselleştirme aracı olarak herhangi bir varsayımda bulunmaz. Zaman serisi verileri de dahil olmak üzere herhangi bir veri üzerinde çalıştırabilirsiniz. Aslında, PCA genellikle zaman serisi verileri için uygulanır (bazen "fonksiyonel PCA" olarak adlandırılır, bazen değil). "Dinamik PCA" ve "statik PCA" nın ne anlama geleceğini bile bilmiyorum; endişelenmeyin ve standart PCA kullanın.
amip diyor Reinstate Monica

Özellikle zaman serileri için tasarlanmış Fonksiyonel PCA'yı kullanmayı düşünebilirsiniz. R'deki FDA paketi fPCA uyguladı. Çok değişkenli fPCA'yı bulabilirsiniz.
Anne

Yanıtlar:


8

Bir yaklaşım, durağanlığı sağlamak için 12 değişkeninizin ilk farkını almak olabilir. Sonra kovaryans matrisi hesaplayın ve üzerinde PCA gerçekleştirin. Bu, tüm zaman dilimi boyunca bir tür ortalama PCA olacaktır ve farklı zaman aralıklarının birbirini nasıl etkilediği hakkında bir şey söylemeyecektir. Ancak bu iyi bir başlangıç ​​noktası olabilir.12×12

Eğer zaman alan ayrıştırma da ilgileniyorsanız ben yorumlarda önerildiği gibi SSA kontrol ediyorum .

Serileriniz sabit olduğu varsayıldığında, tek bir kovaryans matrisi anlamlı olur. Verileriniz 1 veya daha yüksek bir sıraya entegre edilirse, olabileceğinden şüphelendiğim gibi, tek bir kovaryans matrisinin tahmini tutarlı sonuçlar vermez. Rastgele bir yürüyüş, örneğin 1. sıraya entegre edilmiştir ve iki rastgele yürüyüşün tahmini kovaryansı, birlikte hareketleri hakkında bir şey söylemez, burada birlikte entegrasyon analizi gereklidir.

Yorumlarda önerildiği gibi, PCA kendi başına durağanlık umurunda değildir, bu yüzden PCA'yı herhangi bir pozitif yarı tanımlanmış matrisi besleyebilirsiniz ve PC ayrışması PCA açısından iyi olacaktır.

Ancak tahmini kovaryans matrisiniz veriler hakkında anlamlı bir şey temsil etmiyorsa, PCA elbette her ikisini de değil.


1
+1. "İlk farklar" ile ne demek istiyorsun?
amip diyor Reinstate Monica

İlk farkı kastediyorum, on iki x'in her biri için x_t - x_t-1 yaparım.
Duffau

Bu nedenle, zaman serilerinin aksine, her zaman serisinin zaman türevleri üzerinde PCA yapmanızı öneririz. İlginç; neden bu ilk öneriniz olsun?
amip diyor Reinstate Monica

İki nedenden dolayı: 1) Kovaryans tahmininin tutarlı olması için, normal kesitsel varsayımlar iki rasgele değişkenin bağımsız ve aynı şekilde dağılmasıdır (iid). Bu, örnek ortalamanın, büyük sayılar Kanunu (LLN) olarak adlandırılan beklenen değere yakınsamasını sağlar. Zaman serileri analizinde iki stokastik sürecin varsayımı kısıtlayıcıdır. Böylece, durağanlık kavramıyla değiştirilir (birçok farklı türde). LLN'nin tutulması ve kovaryans tahmininin tutarlı olması için, iki serinin müştereken sabit bir dağılıma sahip olması gerekir.
Duffau

Eğer her bir stokastik süreç stayoner ise, o zaman (tamamen olumlu olduğum için) ortaklaşa durağan olduklarından, kovaryans tahmini mantıklıdır. İlk farklar zaman dizisini "daha durağan" hale getirmek için ekonometride standart bir tekniktir. Ve buradan tahmin ve PCA doğrudan ileri. Kısacası, kolay olduğu için :-) .... tamam ikinci bir sebep yoktu ..
Duffau

2

Evet, zaman serisinde PCA finans mühendisliği (nicel finans) ve nörolojide her zaman yapılır.

Xt×ptprt=log(Pt)log(Pt1)=log(Pt/Pt1)p×pXt×tgünlerce, satırlardaki varlıklarla birlikte kovaryans matrisi, tek bir PC ile birlikte ilişkili günleri daraltmak için, genel fikir günlerin gereksiz olabileceği - ve verileri örneğin bir sinir ağına beslerken istemiyorsunuz veri satırları gereksiz veya ilişkilendirilecek özellikler (dikey olmasını istersiniz), çünkü bir sinir ağı korelasyonu öğrenmek için zaman harcayacaktır. Ancak bu yaklaşım otokorelasyona odaklanmaz.

γ=t/nXλ+Y=FnβX^=YY^Y=f1β

Nörolojide PCA, bir EEG'den elde edilen farklı dalga boyu bantlarındaki aksiyon potansiyelleri için zaman serileri üzerinde çalışır. Aksiyon potansiyellerini ortogonal (ilişkisiz) PC skor vektörlerine dönüştürmek ve PC'leri diğer analizlere girmek, davranışsal genetik için karmaşık özelliklerin istatistiksel genetik modellemesinde istatistiksel gücün arttırılması için birincil araçtır (örneğin, iki kutuplu, yenilik için fenotipler arayış, şizotipal, schozephrenia sıklıkla örtüşür). Büyük Avustralya genetik ikiz çalışmaları, davranışsal genetikteki bu örtüşen özelliklerin ayrıştırılmasında etkili olmuştur, çünkü birlikte yetiştirilen özdeş ikizler arasında (aynı evde yetişen) hastalık farklılıkları varsa, nedensel çıkarım farklı ortamlarda maruz kalmaya işaret edebilir. özdeş genetikleri yerine daha yaşlıydılar.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.