Bir ARIMA modelini takmadan önce bir zaman serisini ne zaman günlüğe dönüştüreceğiniz


26

Önceden tek değişkenli zaman serilerini tahmin etmek için tahmini pro kullanmıştım , ancak iş akışımı R'ye değiştiriyorum. .arima (). Bazı durumlarda, tahmin uzmanı tahmin yapmadan önce dönüşüm verilerini günlüğe kaydetmeye karar verir, ancak bunun nedenini henüz anlamadım.

Öyleyse sorum şu: ARIMA yöntemlerini denemeden önce zaman serilerimi ne zaman log-dönüşüm yapmalıyım?

/ edit: cevaplarınızı okuduktan sonra, x'in zaman serilerimde olduğu gibi böyle bir şey kullanacağım:

library(lmtest)
if ((gqtest(x~1)$p.value < 0.10) {
    x<-log(x)
}

Bu mantıklı mı?

Yanıtlar:


21

Devam etmeden önce bazı uyarılar. Öğrencilerime sık sık önerdiğim gibi, auto.arima()şeyleri yalnızca nihai sonucunuza ilk yaklaşım olarak kullanın ya da rakip teoriye dayalı modelinizin daha iyisini yapıp yapmadığını kontrol ederken eşitlikçi bir model elde etmek istiyorsanız.

Veri

Çalıştığınız zaman serileri verilerinin açıklamasından açıkça başlamak zorundasınız. Makro-ekonometride, genellikle toplanmış verilerle çalışırsınız ve geometrik araçlar (şaşırtıcı bir şekilde) makro zaman serisi verileri için daha fazla deneysel kanıtlara sahiptir, çünkü büyük olasılıkla çoğu katlanarak artan bir eğilime dönüşebilir .

Bu arada, Rob'ın önerisi “görsel olarak” , mevsimsel kesimi açık olan zaman serileri için işe yarıyor , çünkü yavaş yavaş değişen yıllık veriler, varyasyonlardaki artışlar için daha az açık. Neyse ki üssel olarak büyüme eğilimi görülüyor (doğrusal görünüyorsa, günlüklere gerek kalmadan).

model

Analiziniz, bazı ağırlıklı geometrik ortalamaların daha fazla bilinen olduğunu söyleyen bazı teorilere dayanıyorsa çarpımsal regresyon modeli , çalışmak zorunda olduğunuz modeldir . Sonra, genellikle parametrelerde ve değişkenlerinizin çoğunda doğrusal olan bir log-log regresyon modeline geçersiniz, ancak bazı büyüme hızları dönüştürülür.Y(t)=X1α1(t)...Xkαk(t)ε(t)

Finansal ekonometride kütükler, kütük getirilerinin popülerliğinden dolayı yaygın bir şeydir, çünkü

Log dönüşümleri hoş özelliklere sahiptir

Log-log regresyon modelinde , de ' nin esnekliği olarak demek, tahmini parametrenin yorumlanmasıdır . Y ( t ) X i ( t )αiY(t)Xi(t)

Hata düzeltme modellerinde, oranların mutlak farklılıklardan daha sabit ( durağan ) olduğu konusunda daha güçlü bir varsayım var .

Finansal ekonometride, zaman içindeki geri dönüşleri toplamak kolaydır .

Burada bahsedilmeyen başka birçok neden var.

En sonunda

Günlük dönüşümünün genellikle negatif olmayan (seviye) değişkenlere uygulandığını unutmayın. İki zaman serisinin (örneğin, net ihracat) farklılıklarını gözlemlerseniz, günlüğü almak bile mümkün değildir, ya orijinal verileri seviyelerde aramanız ya da çıkartılan ortak eğilim şeklini almanız gerekir.

[ edit after edit ] Eğer log dönüşümünün ne zaman yapılacağına ilişkin istatistiksel bir kriter hala istiyorsanız , basit bir çözüm heteroscedasticity için herhangi bir test olacaktır. Varyansın artması durumunda, Goldfeld-Quandt Testini veya buna benzerlerini öneririm . R 'de bulunur library(lmtest)ve gqtest(y~1)fonksiyon ile belirtilir . Eğer herhangi bir regresyon modeline sahip değilseniz, sadece intercept teriminde gerileme, ybağımlı değişkeninizdir.


bilgi için teşekkürler. GQ testi ile, p değeri ne kadar düşükse, dağılım heteroskedastic olabilir mi?
Zach

@Zach: Veri madenciliği için gitmeyi planlamıyorsanız, elbette, tam olarak örneğin% 5 alın. Ben şahsen model varsayımlarından başlıyorum.
Dmitrij Celov

@Dmitrij. Teşekkür ederim. Sadece çıktıyı doğru yorumladığımdan emin olmak istiyorum.
Zach

29

Zamana karşı verinin grafiğini çizin. Serinin seviyesi ile değişim artar gibi görünüyorsa, günlükleri alın. Aksi takdirde orijinal verileri modelleyin.


3
İşte bir soru: günlükleri alırsanız ve bunun için çağrılmazsanız etkisi nedir? Bir log dönüşümü gerektiren zaman serileriyle çalışırken hoşuma gitti, çünkü (anladığım kadarıyla) katsayılar oranlar ve küçük değerlerde neredeyse yüzdeler. (Örn: exp (0.05) = 1.051.)
Wayne

4

Meyvelerinden Ye Onları Tanıyacak

Varsayım (test edilecek), modeldeki hataların sabit varyansa sahip olduğu şeklindedir. Bunun varsayılan bir modeldeki hatalar anlamına gelmediğine dikkat edin. Basit bir grafiksel analiz kullandığınızda, esasen zaman içinde doğrusal bir model varsayıyorsunuzdur.

Bu nedenle, zamana karşı verinin geçici bir grafiği tarafından önerilebilecek yetersiz bir modeliniz varsa, bir güç dönüşümüne olan ihtiyaç hakkında yanlış bir şekilde karar verebilirsiniz. Box ve Jenkins, Havayolu Verileri örneğiyle bunu yaptılar. En son verilerde olağandışı 3 değeri hesaba katmadılar, bu nedenle hatalı olarak serilerin en üst seviyesindeki rezidülerde daha fazla değişiklik olduğu sonucuna vardılar.

Bu konuda daha fazla bilgi için lütfen http://www.autobox.com/pdfs/vegas_ibf_09a.pdf adresini ziyaret edin.


1

Serileri bir şekilde doğal bir şekilde geometrik olduklarında veya yatırımın zaman değerinin pozitif bir geri dönüşü olan minimum bir risk tahviliyle karşılaştıracağınızı ima ettiği durumlarda log-dönüşümü yapmak isteyebilirsiniz. Bu onları daha "doğrusallaştırılabilir" hale getirecek ve bu nedenle basit bir farklılaşma nüks ilişkisi için uygun olacaktır.


1
Dönüşümler uyuşturucular gibidir: Bazıları sizin için iyidir, bazıları değildir. Eğer tou istatistiksel hipotezi test etmekle ilgilenmiyorsa, istediğiniz bir şeyi varsayabilirsiniz. Parametrik hipotez testleri, hataların fiyatlandırılmasıyla ilgili varsayımlara sahiptir, bunları tehlikeye atmayın.
IrishStat

1
Çok doğru. Sürecin geometrik olması gerektiğini söyledim. Dönüştürmeyi başaramamak, çıkarımda da hatalara yol açabilir. Birinin geçerli çıkarım koşulları ile ilgili varsayımları görmezden geldiğini önerdiğimi anlamıyorum.
DW

1
stats.stackexchange.com/questions/6498/… ne zaman ve neden dönüşümün yapılacağına dair bir tartışma içeriyordu. Orijinal boyaların "geometrik" olduğu "gerçeği", yeterli bir modelden kalanların ortalamaya orantılı olan standart bir sapmaya sahip olduğu sonucunu vermez. Ancak deneysel olarak kanıtlanmış veya en azından test edilmiş olması gerekebilir.
IrishStat
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.