Sıfır değerine sahip zaman serilerinin analizi


19

Bu sorun aslında yangın algılama ile ilgilidir, ancak bazı radyoaktif bozunma algılama problemlerine çok benzerdir. Gözlenen fenomen hem sporadik hem de oldukça değişkendir; bu nedenle, bir zaman serisi değişken değerlerle kesintiye uğramış uzun sıfır dizelerinden oluşacaktır.

Amaç sadece olayları (sıfırdaki kopuşları) yakalamak değil, aynı zamanda olayların kendilerinin niceliksel karakterizasyonu. Ancak, sensörler sınırlıdır ve bu nedenle "gerçeklik" sıfır olmasa bile bazen sıfır kaydeder. Bu nedenle sensörleri karşılaştırırken sıfırlar dahil edilmelidir.

Sensör B, Sensör A'dan daha hassas olabilir ve bunu istatistiksel olarak tanımlamak istiyorum. Bu analiz için "gerçeğim" yok, ama Sensörler A&B'den bağımsız bir Sensör C'ye sahibim. Dolayısıyla benim beklentim, A / B ve C arasındaki daha iyi anlaşmanın "gerçek" ile daha iyi anlaşmaya işaret etmesidir. (Bu titrek görünebilir, ancak bana güvenmeniz gerekecek - sensörler hakkındaki diğer çalışmalardan bilinenlere dayanarak burada sağlam bir zemindeyim).

O halde sorun "zaman serilerinin daha iyi anlaşılması" nın nasıl ölçüleceğidir. Korelasyon açık bir seçenektir, ancak tüm bu sıfırlardan (dışarıda bırakılamaz) etkilenecektir ve elbette orantısız olarak maksimum değerlerden etkilenecektir. RMSE de hesaplanabilir, ancak sıfıra yakın bir durumda sensörlerin davranışlarına doğru güçlü bir şekilde ağırlıklandırılır.

S1: Zaman serisi analizinde sıfırlarla birleştirilecek sıfır olmayan değerlere logaritmik ölçeklendirme uygulamanın en iyi yolu nedir?

S2: Sıfır olmayan değerlerde davranışın odaklandığı, ancak sıfır değerlerin baskın olduğu ve dışlanamayacağı bu tür bir zaman serisi analizi için hangi "en iyi uygulamalar" önerilebilir?

Yanıtlar:


11

“Analist, belirli bir örüntü izlemeyen uzun süren hiçbir taleple nasıl başa çıkıyor?” Sorunuzu yeniden ifade etmek için.

Sorunuzun cevabı Aralıklı Talep Analizi veya Seyrek Veri Analizi. Bu, normalde sıfır olmayanların sayısına göre "çok fazla sıfır" olduğunda ortaya çıkar. Sorun iki rasgele değişken olmasıdır; etkinlikler arasındaki süre ve etkinliğin beklenen boyutu. Söylediğiniz gibi, tüm okuma setinin otokorelasyonu (acf), acf'yi yanlış şekilde artıran sıfır dizisi nedeniyle anlamsızdır. Veri tabanlı bir prosedürden ziyade model tabanlı bir prosedür olan "Croston'un yöntemi" gibi konuları takip edebilirsiniz Croston'un yöntemi, aykırı değerlere ve talep oranında değişime / eğilimlere / seviye değişimlerine yani talebin Çok daha titiz bir yaklaşım, "Seyrek Veriler - Eşsiz Aralıklı Veriler" i takip etmek veya bunun gibi aramalar yapmak olabilir. OSU'dan Prof. Ramesh Sharda tarafından bana oldukça ustaca bir çözüm önerildi ve danışmanlık uygulamamda bunu birkaç yıldır kullanıyorum. Bir seride satışların meydana geldiği zaman noktaları ve satış gerçekleşmediği uzun süreler varsa, gözlemlenen satışların satış yapılmadığı sürelere bölünerek ve böylece oran elde edilerek satışların dönem başına satışa dönüştürülmesi mümkündür. Daha sonra oran ile öngörülen bir oranla tahmin edilen satışlar ve öngörülen bir aralık arasındaki aralık arasındaki bir modeli tanımlamak mümkündür. Bununla ilgili daha fazla bilgiyi autobox.com ve google "aralıklı talep" adresinde bulabilirsiniz. Bir seride satışların meydana geldiği zaman noktaları ve satış gerçekleşmediği uzun süreler varsa, gözlemlenen satışların satış yapılmadığı sürelere bölünerek ve böylece oran elde edilerek satışların dönem başına satışa dönüştürülmesi mümkündür. Daha sonra oran ile öngörülen bir oranla tahmin edilen satışlar ve öngörülen bir aralık arasındaki aralık arasındaki bir modeli tanımlamak mümkündür. Bununla ilgili daha fazla bilgiyi autobox.com ve google "aralıklı talep" adresinde bulabilirsiniz. Bir seride satışların meydana geldiği zaman noktaları ve satış gerçekleşmediği uzun süreler varsa, gözlemlenen satışların satış yapılmadığı sürelere bölünerek ve böylece oran elde edilerek satışların dönem başına satışa dönüştürülmesi mümkündür. Daha sonra oran ile öngörülen bir oranla tahmin edilen satışlar ve öngörülen bir aralık arasındaki aralık arasındaki bir modeli tanımlamak mümkündür. Bununla ilgili daha fazla bilgiyi autobox.com ve google "aralıklı talep" adresinde bulabilirsiniz.


1
Aralıklı talep ile öngörü sorunum var. Çözmem istendi. Bu tahmin zamanına özgü birkaç yazılım olduğunu biliyorum, ancak ücretsiz değil. Bu sorunu çözmek için açık kaynaklı yazılımda (örneğin R gibi) yerleşik işlevler biliyor musunuz? Aradım ama şimdiye kadar bulamadım ... Teşekkürler!
Assu

1
@assu: İhtiyaçlarınızı karşılayan herhangi bir özgür yazılımın farkında değilim.
IrishStat

4
@assu. croston()İşlev forecastR paketin tahmin aralıklı talep veri CROSTON yöntemi uygulayacaktır.
Rob Hyndman
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.