Google Trends haftalık verileri döndürür, böylece günlük / aylık verilerimle birleştirmenin bir yolunu bulmam gerekir.
Şimdiye kadar yaptığım, örnek için her seriyi günlük verilere bölmek:
dan:
2013-03-03 - 2013-03-09 37
için:
2013-03-03 37 2013-03-04 37 2013-03-05 37 2013-03-06 37 2013-03-07 37 2013-03-08 37 2013-03-09 37
Ama bu benim problemime çok fazla karmaşıklık katıyor. Son 6 aylık değerlerden veya aylık verilerdeki 6 değerden Google aramalarını tahmin etmeye çalışıyordum. Günlük veriler 180 geçmiş değer üzerinde bir çalışma anlamına gelecektir. (10 yıllık verilerim var, bu yüzden aylık verilerde 120 puan / haftalık verilerde 500+ / günlük verilerde 3500+)
Diğer yaklaşım, günlük verileri haftalık / aylık verilerde "birleştirmek" olacaktır. Ancak bu süreçten bazı sorular ortaya çıkıyor. Bazı verilerin ortalaması alınabilir, çünkü toplamları bir şeyi temsil eder. Yağış, örneğin, belirli bir haftadaki yağmur miktarı, haftaları oluşturan her güne ait miktarların toplamı olacaktır.
Benim durumumda fiyatlar, finansal oranlar ve diğer şeylerle uğraşıyorum. Fiyatlar için benim alanımda değiş tokuş hacmini dikkate almak yaygındır, bu nedenle haftalık veriler ağırlıklı bir ortalama olacaktır. Finansal oranlar için biraz daha karmaşıktır, günlük oranlardan haftalık oranlar oluşturmak için bazı formüller söz konusudur. Diğer şeyler için altta yatan özellikleri bilmiyorum. Bu özelliklerin anlamsız göstergelerden kaçınmak için önemli olduğunu düşünüyorum (ortalama fiancial oranlar örneğin bir anlam ifade etmeyecektir).
Üç soru var:
Bilinen ve bilinmeyen mülkler için günlükten haftalık / aylık verilere nasıl geçmeliyim?
Yaptığım gibi günlük / aylık verileri günlük verilere bölmek biraz yanlış gibi hissediyorum çünkü gerçek hayatta hiçbir anlamı olmayan miktarları tanıtıyorum. Yani neredeyse aynı soru:
Bilinen ve bilinmeyen mülkler için haftalık / aylık verilerden günlük verilere nasıl geçmeliyim?
Son fakat en az değil: farklı zaman adımlarına sahip iki zaman serisi verildiğinde, daha iyi olan nedir: En Düşük veya en büyük zaman adımını kullanma? Bunun veri sayısı ve modelin karmaşıklığı arasında bir uzlaşma olduğunu düşünüyorum, ancak bu seçenekler arasında seçim yapmak için güçlü bir argüman göremiyorum.
Düzenleme: kolayca yapmak için bir araç (hatta R Python Excel'de) biliyorsanız çok takdir edilecektir.