Harici değişkenli tahmin zaman serisi verileri


10

Şu anda bir zaman serisi verisi (aylık veri) tahmini yapmak için bir proje üzerinde çalışıyorum. Tahmin yapmak için R kullanıyorum. 1 bağımlı değişken (y) ve 3 bağımsız değişkenim var (x1, x2, x3). Y değişkeninin 73 gözlemi vardır, diğer 3 değişken de öyle (alos 73). Ocak 2009'dan Ocak 2015'e kadar. Korelasyonları ve p-değerini kontrol ettim ve hepsi bir modele koymak önemlidir. Sorum şu: Tüm bağımsız değişkenleri kullanarak nasıl iyi bir tahmin yapabilirim? Bu değişkenler için gelecekteki değerlerim yok. Diyelim ki 2 yılda (2017'de) y değişkenimin ne olduğunu tahmin etmek istiyorum. Bunu nasıl yapabilirim?

Aşağıdaki kodu denedim:

    model = arima(y, order(0,2,0), xreg = externaldata) 

Bu kod ile 2 yıldan uzun bir y değeri tahmin edebilir miyim?

Ayrıca bir regresyon kodu denedim:

    reg = lm(y ~ x1 + x2 + x3) 

Ancak bu kodda nasıl zaman ayırırım? Y değerinin ne olacağını nasıl tahmin edebilirim 2 yıl diyelim? İstatistikler ve tahminlerde yeniyim. Gecikme değeri boyunca bazı okuma ve cam yaptım, ancak tahmin yapmak için modelde bir gecikme değerini nasıl kullanabilirim?

Aslında genel sorum, gelecekteki değeri olmayan harici değişkenlere sahip bir zaman serisi verilerini nasıl tahmin edebilirim?


Regresyonu asla zaman serisi verileriyle kullanmayın. Aktarım İşlevi modeli yaklaşımını kullanın.
Tom Reilly

2
Merhaba efendim, bana bir transfer fonksiyonu modeli hakkında daha fazla bilgi verebilir misiniz? Ve neden regresyonu asla zaman serisi verileriyle kullanmamalıyım? Çoğu çalışma zaman serileri ile regresyon kullanımını önermektedir.
SB

Transfer Fonksiyonu modeli Bölüm 10'daki Box-Jenkins ders kitabında açıklanmıştır. Amaç, her bir nedensellik için bir model oluşturmak (beyazlatma öncesi) ve daha sonra kalıntıları Y ile korelasyonlar bulmak için kullanmaktır (çapraz korelasyon). Bu, hangi değişkenlerin önemli olduğunu ve herhangi bir olası satış veya gecikme ilişkisi olup olmadığını belirlemenize yardımcı olacaktır. Bu denklemde veya X değişkenlerinde paydada ARIMA'ya ihtiyaç olabilir. Aykırı değerler, eğilim, seviye, mevsimsellik, parametreler ve varyansta değişiklikler olabilir.
Tom Reilly

Bir Regresyon da zamanın önemli olmadığını varsayabilir. Regresyon Galton tarafından Sweat Peas'ı incelemek için kullanıldı ... zaman serisi problemi değil. Aktarma İşlevi, sorunu tahmin etmek için işlemin bazı kısımlarını kullanır.
Tom Reilly

Yanıtlar:


11

Bir modeli harici değişkenler kullanarak sığdırırsanız ve bu modelden tahmin etmek istiyorsanız, harici değişkenlerin gelecekteki değerlerine (basit ve basit) ihtiyacınız olacaktır. Etrafta yol bulunmuyor.

Açıklayıcı değişkenlerinizi tahmin etmenin elbette farklı yolları vardır. Son gözlemlenen değeri ("naif rastgele yürüyüş" tahmini) veya genel ortalamayı kullanabilirsiniz. Bu onlar için yararlı bir değerse bunları sıfıra ayarlayabilirsiniz (örneğin, geçmişte tekrarlanması beklenmeyen bir deprem gibi meydana gelen özel olaylar). Veya bir zaman serisi modelini bu açıklayıcı değişkenlerin kendilerine sığdırabilir ve tahmin edebilirsiniz, örn auto.arima.

Alternatif olarak, bir modeli yAçıklayıcı değişkenleri olmayan değerleri , xregparametreyi kaldırarak ve sonraybu modeli kullanarak. Bir avantajı, bunun açıklayıcı değişkenlerinizdeki düzenlilikleri bile yakalayabilmesidir. Örneğin, dondurma satışlarınız sıcaklıktan kaynaklanıyor olabilir ve birkaç ay öncesinden sıcaklık için iyi tahminleriniz yok ... ancak sıcaklık mevsimsel, bu nedenle sadece bir modelin sıcaklık olmadan takılması mevsimsel bir model verir ve mevsimsel hatta eğer tahminler aslında oldukça iyi olabilir yok satışların fiili sürücüsünü içerir.

Ben tavsiye bu ücretsiz çevrimiçi öngörme ders kitabı , özellikle çoklu regresyon bu bölümü (maalesef Arimax hakkında hiçbir şey yoktur) yanı sıra Rob Hyndman blog post "Arimax modeli karışıklık" .


1

Yogi Berra'nın dediği gibi, "Özellikle gelecek hakkında tahminlerde bulunmak zor."

Birçok stat yazılım modülü, gelecekte Proc Tahmini veya SAS'da mevcut herhangi bir sayıda ARIMA modülü olmadığında gelecekteki herhangi bir bilginin yokluğunda tek değişkenli zaman serilerine dayanan tahminler üretecektir. Bu tahminler, verilerinizin geçmiş davranışlarına dayanan projeksiyonlardır.

Bize verilerinizin aylık olduğunu söylersiniz, ancak kaç adet döneminiz olduğunu söylemezsiniz. Başka bir yaklaşım, üç IV'ünüzün DV'ye göre 24 ay geri ayarlanmasıdır, böylece tahmin ettikleri süre t + 24'tür. Bu, hem modeli başlatmak hem de ilgili mevsimsellikleri uygun şekilde kalibre etmek için yeterli miktarda tarihinizin olduğunu varsayar.


Metnimi düzenledim. Sorularıma şimdi cevap verebilir misin?
SB

Yeterli miktarda bilginiz olduğu göz önüne alındığında, zamanı modelinize entegre etmenin birçok yolu vardır. Yıllar (örneğin, 2009, 2010, vb.), Çeyrekler, zaman serilerindeki her ay için veya mevsimsellik hesaplamasına bir yaklaşım olarak yılın her ayı için kukla değişkenler oluşturabilirsiniz. Başka bir yaklaşım, zamanı sayısal bir eğilim işlevi, örneğin doğrusal (Ocak 2009 = 1, Şub = 2 vb. İle başlayan dönemlerin sayısında olduğu gibi) veya doğrusal eğilime dayalı herhangi bir sayıda polinom eğilimi olarak ele almaktır. örneğin, ikinci dereceden (doğrusal eğilim kare) ve üstü. Başka ne bilmek istersin?
Mike Hunter

Fakat zaman bağımsız bir değişken olamaz, değil mi? Peki, 3 harici değişkeni kullanarak y değişkenimi nasıl tahmin edebilirim? Aslında tahmin yapacak bir model seçmekte zorlanıyorum?
SB

Önceki yorumda belirtildiği gibi, zaman bağımsız bir değişken olacaktır. Bence regresyon, ekonometri ve zaman serileri literatürünü okumalısınız. Bu sitede, bu soruları ele alan ve makaleler, kitaplar vb. Öneren birçok konu bulunmaktadır. Endişelerinizle ilgili daha fazla konu için bu web sayfasının sağ tarafına göz atın.
Mike Hunter

Çok fazla okuma yaptım ve bir çözüm bulamadım. Bu soruyu burada sordum. Kullanabileceğim bazı literatürlerin bazılarını söyleyebilir misiniz? Yoksa doğru web sayfası mı?
SB

1

Gördüğüm gibi üç seçeneğiniz var:

  1. Bağımsız değişkenleriniz için yayınlanmış bir tahmin kullanın veya tahmin etmek için bir model bulun. Örneğin, Sayım tahmin edilen nüfus verilerine sahip olacaktır.
  2. Sahip olduğunuz veri kümesini kullanarak, bağımsız değişkenlerinizin her birini zamana göre gerileyin ve ardından bu sonuçları bağımsız değişkenler için tahmin modelinizi kullanın
  3. Bağımsız değişkenleri bırakın ve bağımlı değişkeninizi zamanın ve y'nin gecikmiş değerlerinin bir fonksiyonu olarak modelleyin.

Her yaklaşımın kendi güçlü ve zayıf yönleri vardır, bu nedenle en iyisi belirli bağlama bağlıdır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.