İki zaman serisini istatistiksel olarak nasıl karşılaştırabilirim?


43

Aşağıdaki grafikte gösterilen iki zaman serim var:

Zaman Serileri Grafiği

Grafik, her iki zaman serisinin tüm ayrıntılarını gösteriyor, ancak gerektiğinde kolayca tesadüfî gözlemlere indirgeyebilirim.

Sorum şu: Zaman serisi arasındaki farkları değerlendirmek için hangi istatistiksel yöntemleri kullanabilirim?

Bunun oldukça geniş ve belirsiz bir soru olduğunu biliyorum, ancak bu konuda hiçbir tanıtım materyali bulamıyorum. Görebildiğim gibi değerlendirmek için iki farklı şey var:

1. Değerler aynı mı?

2. Trendler aynı mı?

Bu soruları değerlendirmek için ne tür istatistiksel testler önerirsiniz? Soru 1 için, farklı veri kümelerinin araçlarını açıkça değerlendirebilir ve dağılımlarda önemli farklılıklar arayabilirim, ancak verilerin zaman serisi yapısını dikkate alan bunu yapmanın bir yolu var mı?

2. soru için - iki eğilim arasındaki benzerliği arayan Mann-Kendall testleri gibi bir şey var mı? Hem veri setleri hem de karşılaştırmalar için Mann-Kendall testini yapabilirim, ancak bunun bir şeyler yapmanın geçerli bir yolu olup olmadığını veya daha iyi bir yolu olup olmadığını bilmiyorum?

Bunları R'de yapıyorum, bu yüzden eğer önereceğiniz bir R paketi varsa, lütfen bana bildirin.


9
Grafik, bu seri arasında çok önemli bir farkın ne olduğunu gizliyor gibi görünüyor: farklı frekanslarda örneklenebilirler. Siyah çizgi (Aeronet) sadece 20 kez örneklenmiş gibi görünüyor ve kırmızı çizgi (Görünürlük) yüzlerce kez veya daha fazla. Bir başka kritik faktör örneklemenin düzenliliği veya eksikliği olabilir: Aeronet gözlemleri arasındaki zaman biraz değişebilir. Genel olarak, bağlantı hatlarının silinmesine ve sadece gerçek verilere karşılık gelen noktaların gösterilmesine yardımcı olur , böylece izleyici bunları görsel olarak belirleyebilir.
whuber

İşte eşit olmayan aralıklarla zaman serileri analizi için bir Python kütüphanesi.
kjetil b halvorsen

Yanıtlar:


27

Diğerlerinin de belirttiği gibi, ortak bir ölçüm sıklığına sahip olmanız gerekir (örneğin, gözlemler arasındaki zaman). Bununla birlikte, her bir seriyi ayrı ayrı makul şekilde tanımlayan ortak bir model tanımlayacağım. Bu bir ARIMA modeli veya olası Seviye Kaydırmalarına sahip çarpma eğilimli bir Regresyon Modeli veya hem belleği (ARIMA) hem de yapay değişkenleri birleştiren birleşik model olabilir. Bu ortak model, her iki seri için küresel ve ayrı ayrı tahmin edilebilir ve daha sonra ortak bir parametre setinin hipotezini test etmek için bir F testi yapılabilir.


1
Her iki seri için de aynı frekansa sahip olmanıza gerek yok. Sadece bu kadar ücret diğer durumlar için çok az yazılım var, ancak traces.readthedocs.io/en/latest adresini ziyaret edin . Astronomi dergilerindeki ve finans ve jeofizikteki diğer vakalar hakkında çok şey yayınlanmış gibi görünüyor ... en.wikipedia.org/wiki/Unevenly_spaced_time_series sayfasındaki
kjetil b halvorsen

12

grangertest()En küçük kütüphanede düşünün .

Bir zaman serisinin diğerini tahmin etmede yararlı olup olmadığını görmek bir testtir.

Başlamanız için birkaç referans:

https://spia.uga.edu/faculty_pages/monogan/teaching/ts/

https://spia.uga.edu/faculty_pages/monogan/teaching/ts/Kgranger.pdf

http://en.wikipedia.org/wiki/Granger_causality


1
Örnek büyüklüğü <Granger'e sığdırmanız gereken parametre miktarına karşı <10 veri noktasıyla çok küçük olurdu.
Jase

1
@fionn, cevabınızdaki linkler öldü. Cevabınızı güncelleyebilir misiniz?
Davor Josipovic

0

Bu yeni geldi. İlk iki cevabınızı çizmemizdeki cevabınız, iki farklılığı görsel olarak görmek için aynı ölçeği (zaman çizelgesi) belirler. Bunu yaptınız ve kolayca göze batan farklılıklar olduğunu görebilirsiniz. Bir sonraki adım basit korelasyon analizini kullanmak ... ve korelasyon katsayısını (r) kullanarak ne kadar iyi ilişki kurduğunu görmek. Eğer r küçükse, sonucunuz onların zayıf bir şekilde ilişkili olduğu ve bu nedenle r'nin iki seri arasında iyi karşılaştırmalar önereceği yönünde arzu edilen karşılaştırmalar ve daha büyük bir değer olmadığı yönünde olacaktır. İyi korelasyonun olduğu üçüncü adım, r'nin istatistiksel önemini test etmektir. Burada, iki dizinin normal dağıldığını (boş hipotez) ya da yok (alternatif hipotez) olduğunu varsayacak Shapiro Welch testini kullanabilirsiniz. Yapabileceğiniz başka testler var ama cevabımın yardımcı olacağını ummama izin verin.


1
Zaman serilerini karşılaştırırken otomatik korelasyon ve muhtemelen zaman serisi modellerine uyar. Ne kadar benzer olduklarını belirlemeye yardımcı olabilecek ARIMA modelleri gibi. Aynı stokastik sürecin iki gerçekleşmesi, onları komplo ederken mutlaka aynı görünmüyor.
Michael Chernick

-2

Polyfit kullanarak her iki zaman serisi sinyaline düz bir çizgi yerleştirin. Sonra her iki satır için kök-ortalama-kare hatası (RMSE) hesaplayın. Kırmızı çizgi için elde edilen değer, gri çizgi için elde edilen değerden oldukça düşük olacaktır.

Ayrıca okumaları bazı ortak frekanslarda yapın.


2
Cross Validated'e hoş geldiniz ve ilk cevabınız için teşekkürler! Bununla birlikte, soruyu doğrudan cevaplamamanızdan endişe duyuyorum - önerilen yaklaşım tam olarak sorucun değerlerin ve / veya eğilimlerin benzer olup olmadığını değerlendirmesine nasıl yardımcı olur?
Martin Modrák
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.