Her tarih için birden çok gözlem içeren bir zaman dizisi oluşturma


11

Üç yıllık örneklenmiş verilere (hayvan biyokütlesi) 10 yıllık bir süre içinde, çeyrek başına 3 tekrar ile bir zaman serisi uygulamaya çalışıyorum. Yani 40 tarih ama toplam 120 gözlem.

Shumway ve Stoffer'ın Zaman Serisi Analizinde SARIMA'a kadar okudum ve uygulamaları ve aynı zamanda yağsız Woodward, et. al. Uygulamalı Zaman Serisi Analizi ve benim anlayışım her model zaman serisinin her noktasında tek bir gözlem üzerine kuruludur.

SORU: Modelimdeki her bir gözlemdeki varyasyonu nasıl ekleyebilirim? Ortalama üzerine bir seri oluşturabilirdim, ancak her gözlemdeki varyasyonu kaybederdim ve bunun ne olduğunu anlaması için kritik olduğunu düşünüyorum.


SARIMA sizin için uygun olabilecek çok değişkenli kasaya genişletilebilir. Bu durumda anahtar kelime VAR şeklindedir. Bu, her zaman aralığı için bir sayı yerine bir sayı vektörünü gözlemlediğiniz anlamına gelir.
mpiktas

Yanıtlar:


4

Tam olarak ne demek istediğinize bağlı olarak "çeyrek başına 3 tekrar" bir panel veri ( wikipedia ) modeli mantıklı olabilir. Bu, zaman içinde aynı kalan üç ayrı kaynağın her birinden biri olmak üzere, üç ayda bir üç ölçüm yaptığınız anlamına gelir. Verileriniz şuna benzer:

obs quarter value
  A       1   2.2 
  A       2   2.3 
  A       3   2.4 
  B       1   1.8 
  B       2   1.7 
  B       3   1.6 
  C       1   3.3 
  C       2   3.4 
  C       3   3.5 

Eğer bakıyorsanız, panel verileriyle çalışmak için birkaç model var. İşte bu iyi bir tanıtım olduğunu kapakları Panel verilerle bakmak için kullanacağı temel Ar bazılarıdır. Bu belge ekonometri açısından da olsa biraz daha derinlere inmektedir.

Ancak, verileriniz panel veri yöntemlerine tam olarak uymuyorsa, "birleştirilmiş veriler" için kullanılabilecek başka araçlar da vardır. Bu makaleden bir tanım (pdf) :

Verilerin havuzlanması, çoklu popülasyonlara ilişkin çoklu veri kaynakları kullanan istatistiksel analiz anlamına gelir. Bilginin ortalamasını, karşılaştırmasını ve ortak yorumlarını içerir. İlgili veri kaynaklarının ve popülasyonlarının aynı / benzer veya farklı olmasına bağlı olarak farklı senaryolar ve sorunlar da ortaya çıkar.

Gördüğünüz gibi, bu tanımdan, kullanacağınız teknikler, verilerinizden tam olarak ne öğrenmeyi beklediğinize bağlı olacaktır.

Başlamanız için bir yer önerirsem, her çeyrek için üç çektiğinizin zaman içinde tutarlı olduğunu varsayarsak, panel veri modelinizle sabit bir etki tahmincisi (iç tahminci olarak da bilinir) kullanarak başlayın diyebilirim . veri.

Yukarıdaki örneğim için, kod şöyle görünecektir:

> Panel = data.frame(value=c(2.2,2.3,2.4,1.8,1.7,1.9,3.3,3.4,3.5), 
                     quarter=c(1,2,3,1,2,3,1,2,3), 
                     obs=c("A","A","A","B","B","B","C","C","C"))
> fixed.dum <-lm(value ~ quarter + factor(obs), data=Panel)
> summary(fixed.dum)

Bu bize aşağıdaki çıktıyı verir:

Call:
lm(formula = value ~ quarter + factor(obs), data = Panel)

Residuals:
         1          2          3          4          5          6          7 
-1.667e-02 -8.940e-17  1.667e-02  8.333e-02 -1.000e-01  1.667e-02 -1.667e-02 
         8          9 
 1.162e-16  1.667e-02 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)   2.13333    0.06055  35.231 3.47e-07 ***
quarter       0.08333    0.02472   3.371 0.019868 *  
factor(obs)B -0.50000    0.04944 -10.113 0.000162 ***
factor(obs)C  1.10000    0.04944  22.249 3.41e-06 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

Residual standard error: 0.06055 on 5 degrees of freedom
Multiple R-squared: 0.9955, Adjusted R-squared: 0.9928 
F-statistic: 369.2 on 3 and 5 DF,  p-value: 2.753e-06 

Burada katsayıdaki zamanın çeyrek değişkeni üzerindeki etkisini ve ayrıca B grubu veya C grubundaki (A grubunun aksine) etkisini açıkça görebiliriz.

Umarım bu sizi doğru yönde bir yere yönlendirir.


3

Bunun ilginç olduğunu düşünüyorum. Benim önerim, düzgün bir zaman serisi elde etmek için üç veri noktasını ortalamak olacaktır. Bunu yaptığınızda, bilgiyi attığınız üç gözlemin ortalamasını aldığını görmezden gelirseniz. Ancak her zaman noktası için kare sapmaları ortalamadan toplayabilirsiniz. Bu karelerin toplamını tüm zaman aralıklarında toplayın ve n-1'e bölün, burada n hesaplamada kullanılan toplam nokta sayısıdır. Zaman serisi yapısına sahip bir modeliniz varsa (ör. Trendler, mevsimsel bileşen, AR bağımlılığı yapısı) bu hesaplama, modeldeki hata teriminin varyansının bağımsız ve tarafsız bir tahmini olabilir.


1
Kolayca yürütülen ve teorik olarak geçerli olan yararlı bir fikir için +1. Ancak küçük bir düzeltme: zaman periyodunda değer gözlemlenecektir . Toplamını bölecek bir varyans tarafsız tahmini ile sapmaları kare yerine ya da (ya da bir esas olarak farklı olan ve yanlış). Muhtemelen bunların hepsini bir havuzda toplamanın meşru olup olmadığını değerlendirmek için, muhtemelen zaman içinde bireysel varyans tahminlerini (her zaman için bir tane) planlamalıdır. 3nn3n2nn13n1
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.