Zaman serilerinde eksik veriler nasıl doldurulur?


16

2 yıl boyunca her 10 dakikada bir kaydedilen çok sayıda kirlilik verisine sahibim, ancak verilerde bir takım boşluklar var (bazıları aynı anda birkaç hafta süren).

Veriler oldukça mevsimsel gibi görünüyor ve gün boyunca değerlerin çok fazla değişmediği ve veri noktalarının daha düşük olduğu geceye göre büyük bir varyasyon var.

Ben gündüz ve gece saat alt kümelerine ayrı ayrı (bunlar arasında bariz bir fark olduğu için) bir eksik model takmayı ve daha sonra eksik verilerin değerlerini tahmin etmeyi ve bu noktaları doldurmayı düşündüm.

Bunun bu soruna yaklaşmanın uygun bir yolu olup olmadığını ve öngörülen noktalara yerel varyasyon eklemeye ihtiyaç olup olmadığını merak ediyordum.

Yanıtlar:


20

Cevap, çalışma tasarımınıza bağlı olacaktır (örneğin, kesitsel zaman serileri? Kohort zaman serileri, seri kohort zaman serileri?). Honaker ve King, bu tür verileri etkilemek için Amelia II içeren R paketi Amelia dahil olmak üzere kesitsel zaman serileri için (muhtemelen varsayımlarınıza bağlı olarak seri gruplar zaman serileri için yararlı) bir yaklaşım geliştirmiştir . Bu arada Spratt & Co. bazı kohort zaman serileri tasarımlarında kullanılabilecek ancak yazılım uygulamalarında seyrek olarak farklı bir yaklaşım tanımlamışlardır.

Bir kesit zaman serisi tasarımı (paneli çalışma tasarımı da bilinir) (örneğin, aynı değişkenlerin, araçlar, vs. bir popülasyon (ler) tekrar tekrar örneklenir (lar) la edildiği bir (örneğin, her yıl) aynı çalışma protokolü kullanıldığında ). Örnekleme stratejisi temsili ise, bu tür veriler çalışmadaki her bir popülasyon için bu değişkenlerin dağılımlarının yıllık bir resmini (katılımcı veya konu başına bir ölçüm) üretir.

Bir kohort zaman serisi tasarımı (aynı zamanda tekrarlanan kohort çalışma tasarımı, bazen panel çalışma tasarımı olarak da adlandırılan boylamsal çalışma tasarımı), bireysel analiz birimlerinin bir kez örneklendiği ve uzun bir süre boyunca takip edildiği bir tasarımdır. Bireyler, bir veya daha fazla popülasyondan temsili bir şekilde örneklenebilir. Bununla birlikte, temsili bir kohort zaman serisi örneği , zaman geçtikçe hedef popülasyonun (en azından insan popülasyonlarında) gittikçe daha zayıf bir temsilcisi haline gelecektir , çünkü insanlar hedef popülasyonda doğuyor veya yaşlanıyor ve ondan ölüyor veya yaşlanıyor. göç ve göç ile.

Bir seri kohort zaman serisi tasarımı (aka tekrarlanan çok ve çok kohortları veya panel çalışma tasarımı) bir popülasyon (ler) tekrar tekrar örneklenir (lar) la edildiği bir (örneğin, her yıl) aynı çalışma protokolü kullanılarak (bir örneğin, değişim oranı ölçütleri oluşturmak için, bir popülasyon içindeki tek tek analiz birimlerini dönem boyunca (örneğin yıl boyunca) iki noktada ölçen aynı değişkenler, araçlar, vb.). Örnekleme stratejisi temsili ise, bu tür veriler çalışmadaki her popülasyon için bu değişkenlerdeki değişim oranlarının yıllık bir resmini oluşturur.

Kaynaklar
Honaker, J. ve King, G. (2010). Zaman serisi kesit verilerindeki eksik değerler hakkında ne yapmalı ? Amerikan Siyaset Bilimi Dergisi , 54 (2): 561-581.

Spratt, M., Carpenter, J., Sterne, JAC, Carlin, JB, Heron, J., Henderson, J. ve Tilling, K. (2010). Boyuna çalışmalarda çoklu impütasyon stratejileri . Amerikan Epidemiyoloji Dergisi , 172 (4): 478-4876.


Cevabın için teşekkürler. Sadece bu tür bir çalışma için nispeten yeni olduğum ve daha önce bu terimlerle karşılaşmadığım için farklı zaman serilerini (kohort, kesitsel vb.) Tanımlayıp tanımlayamayacağınızı merak ediyordum.
Jamesm131

@ Jamesm131 Düzenlediğim yanıtı görün.
Alexis

7

r'de imputeTS paketini kullanabilirsiniz . Üzerinde çalıştığınız verilerin tek değişkenli zaman serileri olduğuna inanıyorum. İmputeTS paketi (tek değişkenli) zaman dizisi ithalatı üzerinde uzmanlaşmıştır. Birkaç farklı impütasyon algoritması uygulaması sunar. Paketleme algoritmalarının ötesinde paket, eksik veri istatistiklerinin çizim ve yazdırma işlevlerini de sağlar. Eksik Değerler için Durum Uzay Modellerine bakmanızı tavsiye ederim.Bu paket analizinizde size yardımcı olacaktır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.