Verilerdeki mevsimsellik tespitinde hangi yöntem kullanılabilir?


56

Aldığım verilerde mevsimsellik tespit etmek istiyorum. Mevsimsel deniz altı arsaları ve otokorelasyon arsaları gibi bulduğum bazı yöntemler var, ama işin grafiği nasıl okuyacağımı anlamıyorum, herkes yardım edebilir mi? Diğeri ise, mevsimsellik tespit etmek için grafikte nihai sonuç olsun ya da olmasın başka yöntemler var mı?


1
anlamakta zorlandığınız gerçek grafiği dahil edebilirsiniz.
Karl

Daha tercihen, "sorunlu" ACF'yi üretmek için kullanılabilecek orijinal veriler.
IrishStat


1
bakınız: journals.ametsoc.org/doi/abs/10.1175/JCLI-D-10-05012.1 Qian, C., Z Wu, C Fu ve D Wang, 2011: Değişen El Niño: Zamanla değişen yıllık bir bakış döngü, topluluklararası değişkenlik ve ortalama durum. J. İklim, 24 (24), 6486-6500

Yanıtlar:


70

Herhangi bir düzenli veri serisinde periyodikliği bulmanın gerçekten iyi bir yolu, genel eğilimi ortadan kaldırdıktan sonra güç spektrumunu denetlemektir . (Bu, toplam güç birlik gibi standart bir değere normalleştirildiğinde otomatik olarak eleme işlemine kendini iyi borç verir.) İlk eğilimin kaldırılması (ve seri korelasyonu kaldırmak için isteğe bağlı farklılık) diğer davranışlarla rahatsız edici dönemleri önlemek için esastır.

Güç spektrumu, orijinal serinin uygun şekilde düzeltilmiş bir versiyonunun otokovaryans fonksiyonunun ayrık Fourier dönüşümüdür. Zaman serilerini fiziksel bir dalga formunu örnekleme olarak düşünürseniz, dalganın toplam gücünün ne kadarının her frekansta taşındığını tahmin edebilirsiniz. Güç spektrumu (veya periodogram ) gücü frekansa karşı çizer . Döngüsel (yani, tekrarlayan veya mevsimsel modeller), frekanslarında bulunan büyük çiviler olarak ortaya çıkacaktır.

Örnek olarak, bu (simüle edilmiş) zaman artık serisini bir yıllık günlük bir ölçümden (365 değer) alın.

artık serileri

0

İşte aynı verinin başka bir grafiği, olası periyodik kalıpları görmemize yardımcı olmak için çizilmiş.

artıklar dizisi, 0 ile doldurulmuş

Gerçekten çok sert görünüyorsanız , 11 ila 12 kez meydana gelen gürültülü fakat tekrarlayan bir modeli fark edebilirsiniz. Sıfırın üzerinde ve sıfırın altındaki değerlerin uzunlamasına dizileri, bu serinin tamamen rastgele olmadığını gösteren en azından bazı pozitif otokorelasyonlara işaret eder.

İşte 91'e kadar olan frekanslar için gösterilen periodogram (toplam seri uzunluğunun dörtte biri). Bir Welch penceresi ile inşa edildi ve birim alana normalize edildi (sadece burada gösterilen kısım için değil, tüm periodogram için).

periodoğram

Güç, "beyaz gürültü" (küçük rastgele dalgalanmalar) artı iki belirgin yükselmeye benziyor. Kaçırmaları zor, değil mi? Daha büyük, 12 periyodunda gerçekleşir ve 52 periyodunda daha küçüktür. Bu yöntem, bu verilerde aylık bir döngü ve haftalık bir döngü tespit etmiştir. Orada gerçekten hepsi bu. Döngülerin algılanmasını otomatikleştirmek ("mevsimsellik"), sadece görece büyük yerel maksimuma yönelik periodogramı (bir değerler listesi olan) tarayın.

Bu verilerin nasıl oluşturulduğunu ortaya çıkarmanın zamanı geldi.

Veri sinyal artı parazite ayrışmış

Değerler, biri frekans 12'ye (kare genlik 3/4) ve diğeri frekans 52'ye (kare genlik 1/4) sahip olan iki sinüs dalgasının toplamından elde edilir. Bunlar periodogramdaki çivilerin tespit ettiği şey. Toplamları kalın siyah eğri olarak gösterilir. Açıklık Daha sonra, siyah eğriden kırmızı noktalara uzanan açık gri çubuklarla gösterildiği gibi, normal varyans gürültüsü 2 eklendi. Bu ses, periodogramın dibinde düşük-seviyeli kıpırdakları ortaya çıkardı, aksi takdirde sadece 0 olurdu. Değerlerdeki toplam varyasyonun tamamen üçte ikisi periyodik ve rastgele değil, bu yüzden çok gürültülü: işte bu yüzden Periyodikliği sadece noktalara bakarak yapmak çok zor. Bununla birlikte (kısmen çok fazla veri olduğu için) periodogram ile frekansları bulmak kolaydır ve sonuç açıktır.

Hesaplama periyogramları için talimatlar ve iyi tavsiyeler Sayısal Tarifler sitesinde görünür : "FFT kullanarak güç tayini tahmini" bölümüne bakın. Rvardır periodogram tahmini için kod . Bu resimler, Mathematica 8; periodogram "Fourier" fonksiyonu ile hesaplandı.


2
"Herhangi bir genel eğilimi ortadan kaldırdıktan sonra" varsayımı Aşil Topuğu'dur, çünkü birçok zaman eğilimi olabileceği gibi, pek çok seviye kayması örneğinizde hariç tutulmuştur. Girdi serisinin doğada deterministik olduğu düşüncesi muhtemel karşısında uçar. mevsimsel ve düzenli ARIMA yapısının varlığı. İşlenmemiş Alışılmamış Bir seferlik Değerler nedeniyle haftalık ve / veya aylık etkileri geçmişte bir noktada değişti periodoğram tabanlı prosedür başarısız olur olmayan significance.If veren periodoğram tahminlere aşağı önyargı için herhangi periodoğram tabanlı kimlik düzeni bozar
IrishStat

@Irish Bence yorumunuz biraz abartıyor olabilir. "Olağandışı Bir Kez Değerleri" (aka aykırı değerler) aramak ve tedavi etmek en basit olanıdır, bu nedenle sadece bazı zaman serisi tahmin edicilerinin aykırı değerlere duyarlı olabileceğini vurgulamaktan bahseder. “Doğada deterministik” temel fikirleri yanlış tanıtıyor: hiç kimse determinizm olduğunu düşünmüyor (simülasyondaki çok fazla gürültü tarafından kanıtlandığı gibi). Simülasyon, yalnızca periyogram ile mevsimsellik arasındaki bağlantıyı göstermek için - gerçekte yaklaşık olarak olsa bile - bir model olarak kesin bir periyodik sinyal içerir . (Devamı ...)
whuber

2
Evet, mevsimsellikteki değişiklikler periodogramı (ve acf'yi vb.), Özellikle sıklıkta (muhtemel olmayan) veya fazdaki (mümkün) değişiklikleri gizleyebilir. Gönderimdeki referanslar bununla başa çıkabilmek için bir çözüm sunar: periodogram tahmini için hareketli bir pencere kullanılmasını önerir . Bunun bir sanatı var ve açıkça tuzaklar var, savunuculuğunuz gibi birçok zaman serisi analizi uzmanlıktan yararlanacak. Ancak, soru “mevsimsellik tespit etmek için başka yöntemler” olup olmadığını ve inkar edilemez bir şekilde periodogramın istatistiksel olarak güçlü, hesaplama açısından verimli ve kolayca yorumlanabilen bir seçenek olup olmadığını soruyor.
whuber

Benim dünyamda, sinüs / kosinüs kullanmak, yılın ay göstergeleri gibi "deterministik etkiler" dir. Önceden belirlenmiş herhangi bir modelin takılması, takılan değerleri, genellikle alt standart olan, kullanıcı tarafından belirlenen bir düzenle sınırlar. Veriler, analistin / gelişmiş bilgisayar yazılımının sabit ve stokastik girdiler arasında etkili bir şekilde ayırt etmesine yardımcı olması için "dinlenmelidir" nden bahsettim. Serinin Benim düşünceme göre,
periodogramın

2
@whuber Aynı şeyi tekrarlamak faydalı olmayabilir. Bununla birlikte, sivri uçların "periyot" değil, yılda 12 ila 52 kez "sıklıkta" olduğunu söylemek için paragrafın alt kısmındaki paragrafı düzeltmek hoş olabilir. Çok fazla rahatsız edici olmadığını düşünüyorsanız, arsa da "dönem" yerine "sıklık" diyerek düzeltmek de güzel olabilir.
Celelibi

19

İşte New Jersey'deki bir şehirden log işsizlik talepleri için aylık verileri kullanan bir örnek (Stata'dan, çünkü bu verileri başlangıçta analiz ettiğim için). Mevsimsellik ACF

Çizgilerin yükseklikleri, bir değişken ile kendisinin sth gecikmesi arasındaki ilişkiyi gösterir; gri alan, bu korelasyonun anlamlı olup olmadığına dair bir fikir verir (bu aralık sadece bir kılavuzdur ve önemi test etmenin en güvenilir yolu değildir). Bu korelasyon yüksekse, seri korelasyonun kanıtı vardır. 12, 24 ve 36. periyotlarda meydana gelen humps'a dikkat edin. Bu aylık veri olduğundan, bu tam olarak 1, 2 veya 3 yıl önceki periyotlara baktığınızda korelasyonun güçlendiğini gösterir. Bu aylık mevsimsellik kanıtıdır.

Bu ilişkileri istatistiksel olarak test edebilirsiniz; değişkenliği, mevsimsellik bileşenini gösteren kukla değişkenler üzerinde gerileyerek --- burada ay kuklaları. Mevsimselliği test etmek için bu aptalların ortak önemini test edebilirsiniz.

Bu prosedür tam olarak doğru değildir, çünkü test hata terimlerinin seri olarak ilişkilendirilmemesini gerektirir. Bu nedenle, bu mevsimsellik mankenlerini test etmeden önce, kalan seri korelasyonu kaldırmamız gerekir (tipik olarak değişkenin gecikmeleri dahil). Testten uygun sonuçları elde etmek için düzeltmeniz gereken bakliyat, ara ve diğer tüm zaman serisi problemleri olabilir. Bunları sormadınız, bu yüzden ayrıntıya girmeyeceğim (artı, bu konularda çok sayıda CV sorusu var). (Sadece merakınızı beslemek için, bu seri ay kuklalarını, tek bir gecikmeyi ve seri korelasyondan kurtulmak için bir kayma bileşenini gerektirir.)


4

Mevsimsellik zaman içinde sıklıkla değişebilir ve değişebilir, dolayısıyla özet önlemler yapıyı tespit etmek için yetersiz olabilir. Biri ARIMA katsayılarında geçici olup olmadığını test etmeli ve sıklıkla “mevsimsel mankenleri” değiştirmelidir. Örneğin, 10 yıllık bir ufukta ilk k yıl için bir Haziran etkisi olmayabilir, ancak son 10 k yıl bir Haziran etkisinin kanıtı olabilir. Basit bir bileşik Haziran etkisi, etki zaman içinde sabit olmadığından önemli olmayabilir. Benzer bir şekilde mevsimsel bir ARIMA bileşeni de değişmiş olabilir. Hataların varyansının zaman içinde sabit kalmasını sağlarken yerel seviye değişimlerini ve / veya yerel zaman eğilimlerini de dikkate almaya özen gösterilmelidir. Kişi, en az Kareler / Kareler gibi dönüşümleri veya günlükler / karekökler vb. Gibi güç dönüşümlerini değerlendirmemelidir. Orijinal veriler üzerinde ancak geçici bir modeldeki hatalar hakkında. Gauss varsayımlarının, gözlemlenen verilerle hiçbir ilgisi yoktur, hepsi de modeldeki hatalarla ilgilidir. Bu, merkezi olmayan bir ki-kare değişkeninin bir merkezi ki-kare değişkenine oranını kullanan istatistiksel testlerin temellerinden kaynaklanmaktadır.

Dünyanızdan bir örnek seri yayınlamak istiyorsanız, size ve listeye mevsimsel yapının tespitine yol açan ayrıntılı bir analiz sunmaktan memnuniyet duyarım.


1

Charlie'nin cevabı iyi ve başlayacağım yer burası. ACF grafiklerini kullanmak istemiyorsanız, mevcut k zaman periyodları için k-1 boş değişkenleri oluşturabilirsiniz. Daha sonra kukla değişkenlerin kukla değişkenlerle (ve muhtemelen bir eğilim terimiyle) bir regresyonda anlamlı olup olmadığını görebilirsiniz.

Verileriniz üç ayda bir ise: bu ikinci çeyrek ise kukla Q2 1, diğer üçüncü çeyrek ise 0 kukla Q3 1, dördüncü çeyrek ise 0 kukla Q4 1, dördüncü çeyrek ise 0 kukla Q4 1 temel durum (tümü üç aptal sıfır)

Ayrıca, genellikle "klasik ayrışma" olarak adlandırılan Minitab'taki "zaman serisi ayrışmasını" kontrol etmek de isteyebilirsiniz. Sonunda, daha modern bir şey kullanmak isteyebilirsiniz, ancak bu başlamak için basit bir yer.


0

IrishStat kullanıcısından veya gerçek dünyadaki örnek serilerimdeki herhangi birinden yardım teklifini almak istiyorum. Son 5 yıllık Ham Petrol vadeli fiyatlarına dayanan mevsimsel bir endeks üretmeye çalışıyorum. Burada görülebilen basit ortalamalar Mevsimsel üretmeyi başardım .

Bununla birlikte, bir haddeleme yıllık mevsimsel grafiğini yeniden oluşturmak istiyorum (sanırım haddeleme yılın başlangıcı ve bitişinin aynı değerde olduğu anlamına gelir) ve aşağıdaki resimde gösterildiği gibi sıfır ile 100 arasında bir ölçekte: görüntü tanımını buraya girin

İndirilebilir elektronik tablodaki günlük fiyat seviyesi verilerinin 15 yılı vardır . Örnek veya yukarıdakilerin nasıl elde edileceğine dair herhangi bir ipucu çok takdir edilecektir.


-1

Ben kendim için biraz yeniyim, ancak ACF fonksiyonunu anlamam, dikey çizginin üst kesikli çizginin üstüne veya alt kesikli çizginin altına düşmesi durumunda, bir miktar otoregresyon (mevsimsellik dahil) olur.


Sinüslere / kosinüslere vb. Uymak bazı fiziksel / elektriksel zaman serileri için faydalı olabilir, ancak MSB, Model Spesifikasyon Yanlılığının farkında olmalısınız.
IrishStat

1
Otoregresyon mevsimsellik anlamına gelmez.
Jens
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.