VAR modellerim neden sabit verilerle sabit verilerden daha iyi çalışıyor?


9

Finansal zaman serisi verilerini modellemek için python'un istatistik modellerini VAR kitaplığını kullanıyorum ve bazı sonuçlar beni şaşırttı. VAR modellerinin zaman serisi verilerinin durağan olduğunu varsaydığını biliyorum. Yanlışlıkla iki farklı menkul kıymet için sabit olmayan bir dizi log fiyatına uyuyorum ve şaşırtıcı bir şekilde takılan değerler ve örnek içi tahminler nispeten önemsiz, durağan kalıntılarla çok doğruydu. içinde örnek tahmini% 99 idi ve tahmin kalıntı seri standart sapması tahmin değerlerinin yaklaşık% 10 idi.R,2

Ancak, log fiyatlarının farkına vardığımda ve bu zaman serisini VAR modeline uyduğumda, takılan ve tahmin değerleri ortalamanın üzerinde dar bir aralıkta sıçrayan işaretin çok dışında. Sonuç olarak, artıklar, günlük değerlerini öngörülen değerlerden daha iyi tahmin ederek daha iyi bir iş çıkarır; tahmin artıklarının standart sapması, yerleştirilen veri serilerinden 1500 daha büyük tahmin serisi için bir .007 değeridir.R,2

VAR modelinde kalanlara karşı takılmış mı yoksa başka bir hata mı yapıyorum? Durağan olmayan bir zaman serisi neden aynı temel verilere dayanarak durağan olandan daha doğru tahminlerle sonuçlanır? Aynı python kütüphanesinden gelen ARMA modelleriyle iyi çalıştım ve bu tek seri verileri modelleme gibi bir şey görmedim.


5
İki gerçek: (1) Rastgele bir yürüyüşe başka bir rastgele yürüyüşte gerilediğinde ve yanlış durağanlık varsaydığınızda , bağımsız süreçler olsa bile neredeyse her zaman istatistiksel olarak önemli sonuçlar elde edersiniz ! . (2) İki değişken birlikte entegre edilirse , diğerinde gerileme yapabilirsiniz ve tahmin ediciniz, süper tutarlılık olarak bilinen bir sonuç olan normal regresyondan daha hızlı birleşecektir.
Matthew Gunn

Çok teşekkür ederim. Gerçek 1, sabit olmayan serilerin sonuçlarını kesinlikle açıklar. Sabit seriden elde edilen sonuçlar kesinlikle süper tutarlılık dediğiniz şeyi gösteriyormuş gibi davranıyor, ancak iki serinin anlatabildiğim kadarıyla bütünleşmemiş olması. İki fiyat serisinde doğrusal bir gerileme yaptım ve artıklar sabit olmaktan uzaktı. Bu nedenle, iki dönüş serisinin güçlü bir şekilde otomatik korelasyonlu olmadığı için VAR modelinin çok kötü tahmin ettiğini varsaymak zorundayım. Granger testi de bunu teyit ediyor.
jpeginternet

@MatthewGunn, yorumunuz cevap olarak daha uygun olabilir.
Richard Hardy

Yanıtlar:


9

İki gerçek:

  1. Rastgele bir yürüyüşe başka bir rastgele yürüyüşte gerilediğinizde ve yanlış durağanlık aldığınız zaman, yazılımınız bağımsız süreçler olsa bile genellikle istatistiksel olarak önemli sonuçlar verir. Örneğin, bu ders notlarına bakınız. (Sahte rastgele yürüyüş için Google ve çok sayıda bağlantı ortaya çıkacak.) Sorun nedir? Genel OLS tahmini ve standart hatalar, rastgele yürüyüşler için geçerli olmayan varsayımlara dayanır.

    Her zamanki OLS varsayımlarının geçerli olduğunu varsaymak ve iki bağımsız rastgele yürüyüşün birbirine gerilemesi genellikle büyük çaplı gerilemelere yol açacaktır. R,2, son derece önemli katsayılar ve hepsi tamamen sahte! Rastgele bir yürüyüş olduğunda ve OLS için olağan varsayımların ihlal edildiği seviyelerde bir gerileme gerçekleştirdiğinizde, tahmininizt, normal merkezi limit teoremi geçerli değildir ve regresyonunuzun tükettiği t-istatistikleri ve p-değerleri yanlıştır .

  2. İki değişken birlikte entegre edilirse , diğerinde gerileme yapabilirsiniz ve tahmin ediciniz, süper tutarlılık olarak bilinen bir sonuç olan normal regresyondan daha hızlı birleşecektir. Örneğin. ödeme John Cochrane'in Zaman Serisi çevrimiçi kitap ve aramak "superconsistent."

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.