ACF ve PACF grafiklerini analiz edin


21

ACF ve PACF arazilerimin analizinde doğru yolda olup olmadığımı görmek istiyorum:

görüntü tanımını buraya girin

Arkaplan: (Reff: Philip Hans Franses, 1998)

  1. Hem ACF hem de PACF önemli değerler gösterdiğinden, ARMA modelinin ihtiyaçlarıma cevap vereceğini düşünüyorum.

  2. ACF, MA parçasını tahmin etmek için kullanılabilir, yani q değeri, PACF, AR parçasını, yani p değerini tahmin etmek için kullanılabilir.

  3. Bir model sırasını tahmin etmek için a.) ACF değerlerinin yeterince ölüp ölmediğine bakıyorum, b.) ACF'nin fazla fark etmesinin sinyalleri olup olmadığını ve c).

  4. ACF ve PACF sadece bir model değil, diğer tanı araçlarını düşündükten sonra seçmem gereken birçok model önerebilir

Bunu göz önünde bulundurarak devam edeceğim ve en belirgin modelin ACF değerleri gecikme 4'te çıktığı ve PACF'in 1 ve 2'deki artışları gösterdiği için ARMA (4,2) gibi göründüğünü söyleyebilirim.

Analiz etmenin bir diğer yolu, PACF'imde iki önemli yükselme ve ACF'imde bir önemli yükselme gördüğümden sonra bir ARMA (2,1) olacaktır (bundan sonra değerler çok daha düşük bir noktadan başlayarak ölür (0.4)).

Örnek-tahmin sonuçlarıma bakıldığında (basit bir Ortalama Mutlak Yüzde Hatası kullanarak) ARMA (2,1), ARMA'dan (4,2) çok daha iyi sonuçlar verir. Bu yüzden ARMA (2,1) kullanıyorum!

ACF ve PACF alanlarını analiz etme yöntemimi ve bulgularımı doğrulayabilir misiniz?

Takdir yardım!

DÜZENLE:

Tanımlayıcı istatistikler:

count  252.000000
mean    29.576151
std      7.817171
min     -0.920000
25%     26.877500
50%     30.910000
75%     34.915000
max     47.430000

Skewness of endog_var: [-1.35798399]

Kurtsosis of endog_var: [ 5.4917757]

Augmented Dickey-Fuller Test for endog_var: (-3.76140904255411, 0.0033277703768345287, {'5%': -2.8696473721448728, '1%': -3.4487489051519011, '10%': -2.5710891239349585}

Zaman serisi:

görüntü tanımını buraya girin

Artıklar (ARMA (2,1):

görüntü tanımını buraya girin

Artıkların ACF / PACF'leri:

görüntü tanımını buraya girin

EDIT II:

Veri:

14.37561
23.95561
25.41561
13.88561
23.31561
33.12561
35.30561
35.78561
37.21561
35.23561
37.34561
38.28561
39.03561
36.34561
39.08561
39.34561
38.80561
40.10561
34.13561
35.42561
27.29561
34.13561
39.89561
47.77561
40.57561
36.15561
33.66561
30.97561
24.90561
23.41561
0.31561
8.45561
37.36561
33.40561
13.97561
11.62561
35.07561
36.15561
37.09561
36.95561
37.85561
32.31561
35.41561
36.35561
37.34561
35.90561
37.40561
36.44561
37.37561
36.16561
35.24561
38.47561
39.18561
39.61561
29.55561
35.50561
38.05561
40.32561
44.39561
37.65561
46.27561
29.41561
40.41561
33.44561
37.04561
35.34561
25.24561
30.23561
15.40561
26.79561
35.38561
40.22561
43.14561
36.96561
41.93561
11.30561
6.87561
32.92561
34.54561
38.27561
36.40561
25.44561
37.26561
26.39561
31.13561
35.90561
38.41561
33.66561
33.16561
31.96561
30.34561
37.77561
32.25561
33.21561
38.37561
36.63561
40.78561
35.60561
36.37561
34.42561
42.67561
33.40561
31.49561
24.81561
23.82561
37.34561
30.73561
21.04561
18.20561
27.36561
18.49561
25.41561
27.92561
29.42561
25.91561
27.56561
28.69561
29.89561
31.47561
29.34561
25.35561
21.98561
28.61561
33.87561
20.07561
27.36561
26.48561
20.37561
22.33561
28.52561
21.24561
10.77561
18.69561
30.19561
33.89561
29.81561
27.55561
22.37561
20.32561
22.43561
31.89561
32.10561
27.67561
36.93561
36.51561
26.96561
21.27561
34.68561
34.13561
35.80561
25.38561
33.42561
9.28561
8.70561
30.36561
30.29561
29.56561
28.41561
33.40561
18.47561
16.48561
18.51561
26.35561
25.40561
19.92561
21.26561
10.90561
32.71561
26.71561
29.99561
28.87561
28.55561
14.07561
10.97561
24.92561
26.40561
21.40561
29.08561
30.18561
30.27561
16.15561
21.96561
32.29561
29.57561
30.24561
30.82561
28.83561
27.30561
26.53561
28.39561
29.76561
29.50561
31.81561
34.79561
24.14561
31.34561
33.14561
35.04561
33.20561
33.53561
35.28561
29.84561
35.02561
33.63561
35.65561
35.73561
35.35561
37.18561
27.38561
34.40561
33.69561
29.05561
34.55561
31.76561
30.91561
34.70561
35.87561
28.31561
30.39561
28.03561
30.72561
30.57561
23.93561
25.11561
32.15561
26.74561
28.76561
32.49561
34.79561
27.90561
33.05561
29.50561
31.67561
34.36561
36.88561
32.31561
26.24561
26.66561
33.59561
37.64561
38.26561
36.20561
33.27561
29.94561
29.19561
27.41561
37.24561
36.26561
30.84561
35.46561
32.24561
31.44561
33.40561
30.71561
33.03561
36.43561
33.44561
22.32561
18.65561
31.97561
27.00561
29.66561
30.76561
33.44561
29.19561
12.32561
33.41561
37.13561
33.43561
37.35561
40.17561
29.38561
19.70561
35.44561
30.48561
30.72561
16.09561
30.82561
30.55561
34.38561
35.45561
34.87561
33.78561
33.87561
29.83561
26.35561
26.44561
28.72561
30.85561
28.18561
12.18561
31.82561
18.01561
27.57561
29.38561
20.32561
22.36561
34.01561
34.40561
20.23561
-0.57439
9.87561
29.55561
31.01561
30.00561
28.12561
13.47561
7.42561
22.01561
20.38561
27.57561
31.54561
29.90561
16.40561
21.27561
26.22561
31.47561
31.11561
32.97561
32.34561
29.36561
32.40561
31.16561
32.05561
31.78561
32.34561
33.87561
31.80561
29.90561
30.09561
32.36561
28.15561
26.30561
15.32561
31.03561
33.47561
33.44561
33.71561
28.30561
12.70561
10.17561
43.96561
9.58561
35.38561
33.82561
41.37561
33.40561
33.64561
20.30561
27.85561
29.01561
32.36561
28.33561
29.90561
27.19561
0.39561
8.40561
0.24561
11.87561
29.15561
20.40561
0.42561
29.29561
23.39561
19.36561

Veriler biraz sapık görünüyor, belki de durağan değil. Bana, artıklarla ilgili bazı potansiyel meseleler, hatta koşullu heteroskedasticity gibi görünüyor.
Glen_b -Regan Monica

Bence çarpıklık, yalnızca orijinal verilerin analizi ile doğrulanabilecek anormal değerler (bakliyatlar) önermektedir.
IrishStat,

Yanıtlar:


8

ACF'nize ve PACF'inize bakmak, analizinizin tüm bağlamında da yararlıdır. Ljung-Box Q istatistikiniz; p-değeri; güven aralığı, ACF ve PACF birlikte görülmelidir. Örneğin burada Q testi:

acf, ci, Q, pvalue = tsa.acf(res1.resid, nlags=4,confint=95,  qstat=True, unbiased=True)

Burada - otokorelasyon için Q testimiz, grafiksel yorumlamamızın genel bir bağırsak kontrolüdür.

Statsmodels'taki Zaman Serileri analiziyle ilgili taslak notlar: http://conference.scipy.org/proceedings/scipy2011/pdfs/statsmodels.pdf


14

ACF ve PACF'ye, 60'lı yılların ortalarında önerilen araçları kullanan tek güven, benzetilmiş veriler dışında bazen nadiren doğrudur. AIC / BIC gibi Model Tanımlama araçları, faydalı bir modeli neredeyse hiç doğru bir şekilde tanımlamaz, ancak varsayımlarla ilgili küçük yazıları okumadığınızda ne olacağını gösterir. Mümkün olduğu kadar basit bir şekilde başlamanızı öneririm, ama çok da basit değil ve geçici bir model tahmin edin; Glen_b tarafından önerildiği gibi AR (1). Bu geçici modelin kalıntıları / analizi, potansiyel model artışını veya model basitleştirmesini öneren başka bir ACF ve PACF'yi hesaplamak için kullanılabilir. Referanslarınızdaki yorumların şu andaki serinin / kalıntıların herhangi bir deterministik yapı içermediğini, yani bakliyat, seviye kayması, Yerel Zaman Eğilimleri ve Mevsimsel Nabız ve dahası, serilerin sürekli hata varyansına sahip olduğunu ve geçici modelin parametrelerinin zaman içinde değişmez olduğunu gösterir. İsterseniz verilerinizi gönderebilir ve size yararlı bir model oluşturmanıza yardımcı olmaya çalışırım.

VERİLERDEN SONRA EDİT RAPORLANDI:

365 değer teslim edildi ve analiz edildi, bu da belirlenen AR (1) modelini belirlenmiş Darbeler ve 2 Seviye Değişimleri ile sağladı. görüntü tanımını buraya girin. Bunun popüler bir tahmin olduğunu unutmayın. Bu modelden kalanlar burada çizilir görüntü tanımını buraya girin. Bir varyans heterojenikliği önerisi var ancak bu bir belirti ve sonuçta bulacağımız doğru tedaviyi bulmak gerekiyor. Burada gösterilen artıkların acf işlemine devam edilmesi, görüntü tanımını buraya girinbir model yetersizliği önerisi sergiler. Artıkların acf tablosuna daha yakından bakmak buradagörüntü tanımını buraya girin7. ve 14. gecikmelerdeki yapıyı öne sürmek. İki ipucunu bir araya getirmek (örneklem büyüklüğü 365 ve önemli haftalık yani 7 gecikmeli yapı), bunun gerçekten günlük veriler olup olmadığını araştırmaya karar verdim. Yeni kullanıcılar, bilgisayarları her şeyi anlamayacak kadar akıllı olması gerektiği yönündeki verilerini yanlış yerde tanımladıkları zaman çok önemli bilgileri ihmal ederler. Gecikme 7 ve gecikme 14 ipuçlarının OP'S ACF ve PACF alanlarına gömüldüğünü not edin. Kalıntılardaki deterministik yapının varlığı hata farkını arttırır, böylece acf'yi baskılayabilir. Aykırı değerler / nabızlar / seviye kaymaları tespit edildikten sonra acf, o zaman hesaba katılması gereken otoregresif bir yapı / günlük göstergelerin varlığını ortaya koydu.

Daha sonra, yazılımın günlük veri olduğu ipucuyla devam etmesine izin veren verileri analiz ettim. Sadece 365 değerle, 1 yıldan fazla veri ile mümkün olan mevsimsel / tatil öngörücülerini içeren BUT modellerini uygun şekilde oluşturmak mümkün değildir.

Bulunan model, burada görüntü tanımını buraya girin5 günlük manken, iki Seviye Kayması, bir dizi bakliyat ve formun bir arima modelini (1,0,0) (1,0,0) içermektedir. Artıkların komploları artık daha iyi bir model olduğu için sabit olmayan yapıyı kanıtlamamaktadır. görüntü tanımını buraya girin. Pe görüntü tanımını buraya girinartıkların e acf daha temiz. Gerçek / Temizlenmiş grafik olağandışı nabız noktalarını vurgular. görüntü tanımını buraya girin. Buradaki ders, verileri günlük zaman serileri olduğuna dair kritik bilgi olmadan analiz ettiğinde, yetersiz bir temsili (veya belki de günlük ipucunun ileri düzey bilgisini) yansıtan bir ton atım olduğu anlamına gelir. Gerçek / Sığdır ve Tahmini burada sunulmaktadır görüntü tanımını buraya girin.

Aynı veri seti ile başkalarının ne yapacağını görmek ilginç olurdu. Tüm analizlerin, piyasada satılan bir yazılım kullanılarak serbest konuşma modunda yapıldığına dikkat edin.


1
sabahın erken saatlerinde yanlış oku ... Normalde
grafiğimdeki

1
Beni de ilk başta kandırdı.
Glen_b -Regan Monica

Cevabınız için teşekkürler. Zaman serisi tahmini alanında tecrübesi olmayan biri olarak, doğru modeli seçme prosedürünü tam olarak anlamak zordur, çünkü resmi olarak doğru bir yol yoktur. Maalesef ham verilerimi göndermeme izin verilmedi. Ek bilgilerin yararlı olacağını umuyorum (bkz. 'EDIT:')
Peter Knutsen,

Sunmadan önce verilerinizi ölçeklendirebilir / maskeleyebilirsiniz. Grafiğe bakıldığında, eğer aşağı doğru tedavi edilmezse acf ve pacf'i yanlış bir şekilde yeterli olduğuna işaret eden alışılmadık değerler olabilir. Aşağı yönlü bir eğilimin görsel bir önerisi var, bunu izleyen bir eğilim yok, ancak bu şu an için bir tahmin.
IrishStat,

Sadece kullanabileceğiniz bazı verileri ekledim ..
Peter Knutsen

11

Bana 0'da dikenleri sayıyormuşsun gibi geldi.

PACF'iniz, gecikme 1'de AR (1) 'i öneren oldukça büyük bir ani artış gösterir. Bu elbette ACF'de (genel olarak konuşursanız, gördüğünüz) geometrik bir azalmaya neden olacaktır. Hem AR hem de MA olmak üzere aynı bağımlılığa iki kez uymaya çalışıyor gibi görünüyorsunuz.

Daha önce AR (1) 'i denemeye çalıştım ve endişelenmeye değer bir şey olup olmadığını görmeye başladım.


Peter; cevabımın içinde bir yazım hatası vardı (son paragrafta AR (1) doğru vardı, fakat ikinci paragrafta MA (1) yazdım).
Glen_b -Regan Monica

Cevabınız için teşekkürler. 0 gecikmesinden saymak elbette önemli bir hatadır! AR (1) 'i denedim ve sonuç ARMA (2,1) kadar iyi değildi!
Peter Knutsen,

Bu kadar iyi olmadığı durumda olabilir - yine de, AR (1) başlangıç ​​yeri olacaktır. Mesela artık PACF neye benziyordu? Orijinal seri neye benziyor? Verilerin bir ACF ve PACF'sinden kolayca toplanamayan birçok şey olabilir.
Glen_b -Regan Monica

Teşekkürler. Yeni görüşlere yol açabilecek bazı ek bilgiler gönderdim.
Peter Knutsen,
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.