Zaman serilerinin istatistiksel benzerliği


15

Birinin periyot, maksimum, minimum, ortalama vb. gerçek veriler varsayılan modele ne kadar uyuyor? Serideki veri noktalarının sayısı 10 ile 50 arasında değişecektir.

Benim çok basit bir ilk düşüncem sinüs dalgasının yönlü hareketine bir değer atfetmekti, yani +1 +1 +1 +1 -1 -1 -1 -1 -1 -1 -1 -1 +1 +1 +1 +1, aynısını gerçek verilerle yapın ve sonra bir şekilde yön hareketinin benzerlik derecesini ölçün.

Düzenleme: Verilerimle gerçekten ne yapmak istediğimi daha fazla düşündükten ve orijinal soruma verilen yanıtların ışığında, ihtiyacım olan şey, rakip varsayımlar arasında seçim yapmak için bir karar verme algoritması: yani verilerim temelde doğrusal (veya eğilim) döngüsel elemanlara sahip olabilen gürültü ile; verilerim temelde döngüseldir ve konuşmak için hiçbir yönelimi yoktur; veri aslında gürültüdür; ya da bu devletlerin herhangi biri arasında geçiş yapıyor.

Şimdi düşüncelerim Bayesian analizi ve Öklid / LMS metriğini bir araya getirmektir. Bu yaklaşımdaki adımlar

Veri ölçümlerinden varsayılan sinüs dalgası oluşturma

Verilere bir LMS düz çizgi takın

Yukarıdakilerin her biri için orijinal verilerden çıkışlar için bir Öklid veya LMS metriği türetme

Bu metriğe göre her biri için bir Bayesian oluşturun, yani birleşik kalkışların% 60'ı birine,% 40'ı diğerine eklenir, bu nedenle% 40'ı tercih eder

bir pencere veri boyunca bir veri noktası kaydırın ve bu biraz değiştirilen veri seti için yeni% metrikler elde etmek için yukarıdakileri tekrarlayın - bu yeni kanıttır - bir posterior oluşturmak ve her varsayımı destekleyen olasılıkları değiştirmek için Bayesian analizini yapın

bu sürgülü pencereyle (pencere uzunluğu 10-50 veri noktası) tüm veri seti (3000+ veri noktası) boyunca tekrarlayın. Umut / niyet, veri setinin herhangi bir noktasında baskın / tercih edilen varsayımı ve bunun zamanla nasıl değiştiğini tanımlamaktır

Bu potansiyel metodoloji hakkındaki herhangi bir yorum, özellikle de Bayes analizi bölümünü gerçekte nasıl uygulayabileceğim konusunda memnuniyetle karşılanacaktır.

Yanıtlar:



5

Karşılaştırma yapmak istediğiniz belirli bir modeliniz varsa: Olası parametre değerlerini belirli bir veri kümesine göre en aza indirmek ve puanlamak için En Küçük Kareleri bir metrik olarak öneririm. Temel olarak tek yapmanız gereken parametre tahminlerinizi girmek, tahmin edilen değerleri oluşturmak için bunları kullanmak ve gerçek değerlerden ortalama kare sapmayı hesaplamaktır.

Ancak, sorunuzu biraz tersine çevirmeyi düşünebilirsiniz: "Hangi model verilerime en uygun?" Bu durumda, normal olarak dağıtılmış bir hata terimi varsayımı yapmayı öneririm, tartışılabilecek bir şey en küçük kareler varsayımına benzer. Daha sonra, model seçiminize bağlı olarak , diğer model parametrelerinin nasıl dağıtıldığını (daha önce bir Bayesci atama) ve parametrelerin dağılımından örneklemek için R'den MCMC paketi gibi bir şey kullanma hakkında bir varsayım yapabilirsiniz. Sonra hangi modelin en uygun olduğuna dair bir fikir edinmek için posterior araçlara ve sapmalara bakabilirsiniz.


Verilerime uyması için iki olası modelim varsa, orijinal sorumda açıklandığı gibi sinüs dalgası ve bir LMS düz çizgi uyumu, sinüs dalgasının gerçek veri değerlerinden ortalama kare sapmayı, LMS fit çizgisini seçin ve daha sonra bu modelin verilere daha doğru bir uyum gösterdiği gerekçesiyle daha düşük toplam değere sahip modeli seçin? Öyleyse, her bir modelin zamanla nasıl daha iyi hale gelebileceğini / kötüleşebileceğini görmek için aynı sinüs dalgası / LMS kullanarak verileri yarıya bölmek ve her yarıyı ayrı ayrı yapmak da geçerli midir?
babelproofreader

Emin değilim. Benim önerim En Küçük Kareler metriğini kullanmaktı, ancak doğrusal regresyon çalıştırmak istemedim. Periyodik Regresyon'a göz atabilirsiniz .
M. Tibbits

Diğer sorunuzla ilgili olarak, verileri yarıya indirebilir misiniz, bunu yaparken çok dikkatli olurum - çünkü bu, düşünebileceğiniz minimum frekansı iki katına çıkarır. Sanırım Fourier katsayılarına bakmanız gerekebilir (bir FFT veya DCT alın ve üzerlerinde gerileme mi?!? - Emin değilim ). Ya da belki de yukarıda belirtildiği gibi periyodik regresyon.
M. Tibbits

3

Sadece yön hareketini nitel olarak temsil eden "basit ilk düşünceniz", zaman serisini karşılaştırmak için ruh olarak Keogh'un SAX algoritmasına benzer. Şuna bir göz atmanızı tavsiye ederim: Eamonn Keogh & Jessica Lin: SAX .

Düzenlemenizden, şu anda sorunu farklı bir şekilde ele almayı düşündüğünüz anlaşılıyor, ancak SAX'ın bulmacanın bir parçasını sağladığını görebilirsiniz.


0

Partiye biraz geç kalırken, sinüzoidal bir şey düşünüyorsanız, dalgacık dönüşümleri de cebinizde olması için iyi bir araçtır. Teoride, bir diziyi çeşitli "parçalara" ayrıştırmak için dalgacık dönüşümlerini kullanabilirsiniz (örneğin, farklı şekil / frekans dalgaları, trendler gibi dalga dışı bileşenler, vb.). Bir ton kullanılan belirli bir dalga dönüşümü biçimi Fourier dönüşümüdür, ancak bu alanda çok fazla çalışma vardır. Güncel bir paket önermek isterim, ancak uzun süredir sinyal analizi yapmadım. Bununla birlikte, bu damar üzerinde işlevselliği destekleyen bazı Matlab paketlerini hatırlıyorum.

Sadece döngüsel verilerdeki eğilimleri bulmaya çalışıyorsanız gidilecek bir diğer yön de Mann-Kendall Trend testi gibi bir şey. Mevsimsel etkileri güçlü olan hava veya su kalitesindeki değişiklikleri tespit etmek için çok kullanılır. Bazı daha gelişmiş yaklaşımların çan ve ıslıklarına sahip değildir, ancak kıdemli bir istatistiksel test olduğu için yorumlanması ve raporlanması oldukça kolaydır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.