Tam olarak ne demek istediğinize bağlı olarak "çeyrek başına 3 tekrar" bir panel veri ( wikipedia ) modeli mantıklı olabilir. Bu, zaman içinde aynı kalan üç ayrı kaynağın her birinden biri olmak üzere, üç ayda bir üç ölçüm yaptığınız anlamına gelir. Verileriniz şuna benzer:
obs quarter value
A 1 2.2
A 2 2.3
A 3 2.4
B 1 1.8
B 2 1.7
B 3 1.6
C 1 3.3
C 2 3.4
C 3 3.5
Eğer bakıyorsanız, panel verileriyle çalışmak için birkaç model var. İşte bu iyi bir tanıtım olduğunu kapakları Panel verilerle bakmak için kullanacağı temel Ar bazılarıdır. Bu belge ekonometri açısından da olsa biraz daha derinlere inmektedir.
Ancak, verileriniz panel veri yöntemlerine tam olarak uymuyorsa, "birleştirilmiş veriler" için kullanılabilecek başka araçlar da vardır. Bu makaleden bir tanım (pdf) :
Verilerin havuzlanması, çoklu popülasyonlara ilişkin çoklu veri kaynakları kullanan istatistiksel analiz anlamına gelir. Bilginin ortalamasını, karşılaştırmasını ve ortak yorumlarını içerir. İlgili veri kaynaklarının ve popülasyonlarının aynı / benzer veya farklı olmasına bağlı olarak farklı senaryolar ve sorunlar da ortaya çıkar.
Gördüğünüz gibi, bu tanımdan, kullanacağınız teknikler, verilerinizden tam olarak ne öğrenmeyi beklediğinize bağlı olacaktır.
Başlamanız için bir yer önerirsem, her çeyrek için üç çektiğinizin zaman içinde tutarlı olduğunu varsayarsak, panel veri modelinizle sabit bir etki tahmincisi (iç tahminci olarak da bilinir) kullanarak başlayın diyebilirim . veri.
Yukarıdaki örneğim için, kod şöyle görünecektir:
> Panel = data.frame(value=c(2.2,2.3,2.4,1.8,1.7,1.9,3.3,3.4,3.5),
quarter=c(1,2,3,1,2,3,1,2,3),
obs=c("A","A","A","B","B","B","C","C","C"))
> fixed.dum <-lm(value ~ quarter + factor(obs), data=Panel)
> summary(fixed.dum)
Bu bize aşağıdaki çıktıyı verir:
Call:
lm(formula = value ~ quarter + factor(obs), data = Panel)
Residuals:
1 2 3 4 5 6 7
-1.667e-02 -8.940e-17 1.667e-02 8.333e-02 -1.000e-01 1.667e-02 -1.667e-02
8 9
1.162e-16 1.667e-02
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.13333 0.06055 35.231 3.47e-07 ***
quarter 0.08333 0.02472 3.371 0.019868 *
factor(obs)B -0.50000 0.04944 -10.113 0.000162 ***
factor(obs)C 1.10000 0.04944 22.249 3.41e-06 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.06055 on 5 degrees of freedom
Multiple R-squared: 0.9955, Adjusted R-squared: 0.9928
F-statistic: 369.2 on 3 and 5 DF, p-value: 2.753e-06
Burada katsayıdaki zamanın çeyrek değişkeni üzerindeki etkisini ve ayrıca B grubu veya C grubundaki (A grubunun aksine) etkisini açıkça görebiliriz.
Umarım bu sizi doğru yönde bir yere yönlendirir.