Birden çok zaman serisini birleştirirken hangi sorunlara dikkat etmeliyim?


10

Diyelim ki bir dizi zaman serim var, örneğin bir bölgedeki çeşitli istasyonlardan bir dizi sıcaklık kaydı. Bölgesel iklimin yönlerini tanımlayabildiğim tüm bölge için tek bir sıcaklık kaydı almak istiyorum. Sezgisel yaklaşım, her bir zaman dilimindeki tüm istasyonların ortalamasını almak olabilir, ancak istatistiksel örümcek algım (ki henüz henüz iyi bir şekilde iletişimde değilim) bana bunun bu kadar kolay olmayabileceğini söylüyor. Özellikle, tüm bölgenin ortalamasının ilginç sıcaklık aşırılıklarının bir kısmını ortadan kaldıracağını ve yakın istasyonlar arasında bağımlılık konusunda sorun yaşayabileceğimi hayal ediyorum.

Böyle bir strateji denediğimde başka hangi sorunlarla karşılaşabilirim ve bunların üstesinden gelmenin yolları veya bu tür verileri birleştirmenin daha mantıklı yöntemleri var mı?

Not: Yanıtlar sağladığım uzamsal örnekten daha genel olabilir.


1
Sorun "tüm bölge için tek bir sıcaklık kaydı" ile bölge içi varyasyona olan ilginiz arasındaki çatışmanızda olabilir. Bir çözüm, varyansın bölgeler arası ve bölgeler arası bileşenlere bölünmesi gibi bu iki konuyu uzlaştırmanın bir yolunu içerebilir.
Peter Ellis

@PeterEllis, evet, bunu belirsiz bir şekilde düşünüyordum. Sorunun amaçları için, bölgeler arası mekansal değişkenliği umursamadığımı varsayalım.
naught101

Bu durumda, endişelenmeniz gereken ana şey yakın istasyonlar arasındaki bağımlılık olduğunu düşünüyorum. Yandaki istasyonu etkili bir şekilde çoğaltan gözlemleri azaltmanın bir yolunu bulun ve iyi olmalısınız.
Peter Ellis

@PeterEllis: tamam, ama bunu yapmanın makul bir fiziksel yolu olmayabilir - İstasyonların yakınlığı mutlaka daha bağımlı oldukları anlamına gelmez - yani. bir dağ aralığının karşı taraflarındaki iki yakın istasyon, geniş bir ovadaki iki uzak istasyondan daha az benzer olabilir. Bağımlılığı istatistiksel olarak tanımlamanın güvenilir bir yolu var mı? Kovaryans, sanırım ... Sonuçta elde edilen seride hala daha az tepe noktası var (sanırım fiziksel durumu yansıtıyor - geniş bir bölgedeki geçici değişikliklerin tek bir yerden daha yavaş ve daha kararlı olması muhtemeldir).
naught101

@naught, sorunuzun mekansal yönüyle ilgili olarak bölgeleriniz nasıl tanımlanıyor? Yorumunuzda, bir dağın karşı taraflarındaki iki yakın istasyonun geniş bir ovadaki iki uzak istasyondan farklı olabileceğini belirtiyorsunuz. İstasyon bölgelerini analiziniz için yakınlık ve benzerlik temelinde yeniden tanımlamayı düşündünüz mü? Mutlaka geleneksel bölgesel sınırlarla eşleşmeleri gerekmeyecekti. Bunun yerine, geleneksel bir harita üzerinde çizilebilen analitik bir katman haline gelebilirler.
dav

Yanıtlar:


1

İlk olarak, bir yorum ekleyeceğimi söylemek istiyorum, ama bunu henüz yapamıyorum (rep), ama soruyu beğendim ve katılmak istedim, işte bir "cevap". Ayrıca, bunun eski olduğunu görüyorum, ama ilginç.

İlk olarak, zaman serilerini yoğunlaştırmak için PCA gibi bir boyut küçültme tekniği kullanmak mümkün müdür? İlk özdeğer büyükse, belki bu özvektör kullanımınızın dinamiklerin çoğunu temsil edeceği anlamına gelir.

İkincisi ve daha genel olarak, zaman serilerini istediğiniz şekilde kullanmak nedir? Başka bir şey bilmeden, sıcaklıkların biraz değişebileceğini tahmin ediyorum. Örneğin, bazı sıcaklık kayıtları şehirlerin yakınındaysa, "ısı adası" tipi bir etki elde edebilirsiniz. Ya da belki de yanal mesafedeki küçük bir değişiklik, dikey mesafede büyük bir değişiklik meydana getirir - bir konum deniz seviyesinde ve okyanusta, diğeri "çok uzakta" değil, bir kilometre yükseklikte olabilir. Bunlar kesinlikle farklı sıcaklıklara sahip olacaktı!

Bunlar sadece bazı düşünceler. Belki başka biri atlayabilir ve daha iyi bir cevap verebilir.


1
İyi bir nokta. Dürüst olmak gerekirse, bu sorunun etrafındaki bağlamın ne olduğunu hatırlayamıyorum ve yorumlarımın yanıltıcı olduğunu hissediyorum. Özellikle tüm istasyonlarda ortak olan değişkenliği kaybetmemekle, faz dışı kalmakla ilgileniyordum. Bir kıtanın her tarafındaki istasyonları ve karşısındaki soğuk cepheyi düşünün. Basit bir mekansal ortalama temel olarak soğuk cepheyi kaldırabilir, bu da her istasyonun güçlü bir şekilde, ancak farklı zamanlarda göstereceği için gerçekten iyi bir şey değildir. Muhtemelen her bir istasyonda bir çeşit PCA çalıştırmak ve sonuçların bir şekilde ortalamasını almak bunun üstesinden gelmenin bir yolu olabilir.
naught101

Vay canına, tamam, bu yüzden bölgedeki zaman serisindeki eğilimi karakterize etmeye çalışıyorsanız, belki zaman serisini sabit ve her biri ortalama 0 olacak şekilde yapmalısınız. her biri (veya günlük ortalamaları alın). Daha sonra sıcaklıkta düşük frekanslı değişikliklerle kalırsınız, her biri ortalama 0 civarında ortalanır. Bunu yaptıktan sonra, belki de PCA gibi bir boyut azaltma tekniği kullanarak ortalanmış + sabit zaman serilerini yoğunlaştırabilirsiniz. Sorunun bağlamından biraz bahsettiğinize sevindim, b / c gerçekten yardımcı oluyor. İyi şeyler!
rbatt
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.