Kısa süreli seriler için en iyi yöntem


35

Kısa zaman serilerinin modellenmesi ile ilgili bir sorum var. Bunları modellemek bir soru değil , nasıl yapılır? Kısa zaman serilerinin modellenmesi için hangi yöntemi önerirsiniz (uzunluk )? "En iyisi" derken, burada en sağlam olanı kastetmiştim; bu, sınırlı sayıda gözlemden dolayı hatalara en az eğilimi gösterir. Kısa serilerde, tek gözlemler tahminleri etkileyebilir, bu nedenle yöntem, tahminlere bağlı hataların ve olası değişkenliğin temkinli bir tahminini sağlamalıdır. Genel olarak tek değişkenli zaman serileriyle ilgileniyorum ancak diğer yöntemler hakkında da bilgi sahibi olmak ilginç olurdu.T20


Zaman birimi nedir? Verileri gönderebilir misiniz?
Dimitriy V. Masterov

8
Hangi varsayımları yaparsanız yapın - mevsimsellik, durağanlık hakkında & c. - kısa süreli bir seri size sadece en sinirli ihlalleri tespit etme şansı verecek; bu nedenle, varsayımların etki alanı bilgisine dayanması gerekir. Model yapmak mı yoksa sadece tahmin yapmak mı gerekiyor? M3 yarışması, serideki çeşitli "otomatik" tahmin yöntemlerini, bazıları 20 kadar kısa olan çeşitli alanlardan karşılaştırdı.
Scortchi - Reinstate Monica

5
Scortchi'nin yorumu ile +1 arası. Bu arada, 3.003 M3 serisinden ( McompR için pakette bulunur), 504 20 veya daha az gözleme sahiptir, özellikle yıllık serilerin% 55'i. Böylece orijinal yayına bakabilir ve yıllık veriler için neyin iyi çalıştığını görebilirsiniz. Veya M3 yarışmasına gönderilen ve Mcomppaketin (listede M3Forecast) bulunan orijinal tahminleri bile inceleyin .
S. Kolassa - Monica

Merhaba, cevaba hiçbir şey eklemeyeceğim, ancak soruyu başkalarının burada başkalarının sorunu anlamalarına yardımcı olabileceğini umduğum bir şeyi paylaşacağım: sağlam bir tane söylediğinizde , sınırlı olduğu için hatalara en az eğilimli olan gözlem sayısı . Sağlamlığın istatistiklerde önemli bir kavram olduğuna inanıyorum ve burada çok önemlidir, çünkü herhangi bir modelleme uyumu, modelin kendisinin veya aykırı değerlerinin varsayımlarına büyük ölçüde bağlı olacaktır. Sağlamlık ile, bu kısıtlamaları daha az güçlü hale getirir, sonuçlarınızı sınırlandırma varsayımına izin vermezsiniz. Umarım bu yardımcı olur.
Tommaso Guerrini

2
@ TommasoGuerrini sağlam yöntemler daha az varsayımda bulunmaz, farklı varsayımlarda bulunurlar.
Tim

Yanıtlar:


31

Öyle çok daha karmaşık yöntemler daha iyi performans "geçmiş ortalama tahmini" gibi son derece basit tahmin yöntemleri için ortak. Bu kısa süreli seriler için daha muhtemeldir. Evet, ilke olarak 20 veya daha az gözlem için bir ARIMA veya daha da karmaşık bir modele uyabilirsin, ancak tahminlerin üzerine gelip daha kötü tahminlerde bulunma ihtimalin yüksek olacak.

Yani: basit bir kıyaslama ile başlayın, örn.

  • tarihsel ortalama
  • Ek sağlamlık için tarihsel medyan
  • rastgele yürüyüş (son gözlemi tahmin et)

Bunları örneklem dışı verilerde değerlendirin. Daha karmaşık modelleri bu karşılaştırma ölçütleriyle karşılaştırın. Bu basit yöntemlerden daha iyi bir performans göstermenin ne kadar zor olduğunu görünce şaşırabilirsiniz. Ek olarak, farklı metotların sağlamlıklarını bu basit metotlarla karşılaştırın; örneğin, yalnızca örnek dışı ortalama doğruluğu değil , aynı zamanda en sevdiğiniz hata ölçütünü kullanarak hata varyansını da değerlendirerek .

Evet, Rob Hyndman , Aleksandr'ın link verdiği yazısında yazdığı gibi, örnek dışı testlerin kısa seriler için kendi başına bir sorun olduğunu - ancak bunun gerçekten iyi bir alternatifi olmadığını söyledi. ( Do not in-numune uyum kullanmak tahmin doğruluğu hiçbir kılavuzdur .) AIC ortanca ve rastgele yürüyüş ile size yardımcı olmayacaktır. Ancak, olabilir kullanmak zaman serisi çapraz doğrulama zaten AIC yaklaşır.


Az önce cevabınızı keşfettiniz (+1). İlgilenmek ve açıklığa kavuşturmak istemeniz durumunda başka bir yorumda bulundum.
Aleksandr Blekh

17

Yine bir soruyu zaman serileri hakkında daha fazla bilgi edinmek için bir fırsat olarak kullanıyorum - ilgilendiğim konuların başında geliyor. Kısa bir araştırmadan sonra, bana kısa zaman serileri modelleme sorununa birkaç yaklaşımın var olduğunu düşünüyorum.

İlk yaklaşım standart / lineer zaman serisi modellerini (AR, MA, ARMA, vb.) Kullanmak, ancak bu yazıda [1] tanımlandığı gibi Rob Hyndman tarafından açıklanan bazı parametrelere dikkat etmektir . zaman serileri ve tahmin dünyası. İkinci yaklaşım, kullanıyorum önermek, gördük ilgili literatür çoğu tarafından ifade doğrusal olmayan zaman serisi modelleri , özellikle, eşik modelleri yer alır [2], eşik kendiliğinden gerileyen modeli (TAR) , kendi kendine çıkan TAR ( SETAR) , eşik otoregresif hareketli ortalama modeli (TARMA) ve TAR genişleten TARMAX modelieksojen zaman serileri modeli. Eşikli modeller de dahil olmak üzere doğrusal olmayan zaman serisi modellerine mükemmel bir bakış , bu yazıda [3] ve bu yazıda [4] bulunabilir.

Son olarak, IMHO ile ilgili bir başka araştırma makalesinde [5], doğrusal olmayan sistemlerin Volterra-Weiner temsiline dayanan ilginç bir yaklaşım açıklanmaktadır - bakınız bu [6] ve bu [7]. Bu yaklaşımın kısa ve gürültülü zaman serileri bağlamında diğer tekniklerden daha üstün olduğu iddia edilmektedir .

Referanslar

  1. Hyndman, R. (4 Mart 2014). Modelleri kısa süreli serilere uyarlama. [Blog yazısı]. Http://robjhyndman.com/hyndsight/short-time-series adresinden alındı
  2. Pensilvanya Devlet Üniversitesi. (2015). Eşik modelleri [Çevrimiçi kurs materyalleri]. STAT 510, Uygulamalı Zaman Serileri Analizi. Https://onlinecourses.science.psu.edu/stat510/node/82 adresinden alındı
  3. Zivot, E. (2006). Doğrusal olmayan zaman serisi modelleri. [Sınıf notları]. ECON 584, Zaman Serileri Ekonometrisi. Washington Üniversitesi Http://faculty.washington.edu/ezivot/econ584/notes/nonlinear.pdf adresinden alındı
  4. Chen, CWS, Öyleyse, MKP, ve Liu, F.-C. (2011). Finansta eşik zaman serisi modellerinin gözden geçirilmesi. İstatistikler ve Arayüzü, 4 , 167–181. Http://intlpress.com/site/pub/files/_fulltext/journals/sii/2011/0004/0002/SII-2011-0004-0002-a012.pdf adresinden alındı
  5. Barahona, M., ve Poon, C.-S. (1996). Kısa, gürültülü zaman serilerinin doğrusal olmayan dinamiklerinin tespiti. Nature, 381 , 215-217. Http://www.bg.ic.ac.uk/research/m.barahona/nonlin_detec_nature.PDF adresinden alındı
  6. Franz, MO (2011). Volterra ve Wiener serileri. Burslu, 6 (10): 11307. Http://www.scholarpedia.org/article/Volterra_and_Wiener_series adresinden alındı
  7. Franz, MO, ve Scholkopf, B. (nd). Wiener ve Volterra teorisi ve polinom çekirdeği regresyonu birleştirici bir bakış açısı. Http://www.is.tuebingen.mpg.de/fileadmin/user_upload/files/publications/nc05_%5B0%5D.pdf adresinden alındı

4
+1 Bu yazıların referanslarını cevabınıza yazabilir misiniz? Kısa süre önce makalelere olan bağlantıların bir süre sonra çürümekte olduğunu, sonunda da makalenin yazarları, başlıkları vb.
whuber

2
@whuber: Teşekkürler. Hiç sorun değil, cevabımı bu akşam referanslarla güncelleyeceğim.
Aleksandr Blekh

2
Rob Hyndman'ın gönderisine bağlantı için +1. (Ancak, karmaşık modeller için için -1 ayartmıştı. Ben olurdum son derece eşiğini veya 20'den az gözlem süresi serisinde başka doğrusal olmayan zaman serisi yöntemleri kullanarak dikkatli. Sen gider, overfit edeceği kesin olan doğrudan sayaç OP'nin sağlam bir metot gereksinimine göre .)
S. Kolassa - Monica

3
[2,3,4], kısa zaman serilerinden bahsetmiyor ve [2]:> 120 gözlemdeki parsellere bakıyorlar. [4] 20'den fazla gözleminiz olduğu finansmana odaklanıyor. [5] “kısa süreli seri, tipik olarak 1000 puan uzunluğunda” hakkında yazıyor (p. 216). <20 gözlemle, bir TAR veya benzer modele veya bağlantı kurduğunuz daha karmaşık modellerden herhangi birine güvenilir ve sağlam bir şekilde oturmanın bir yolunu görmüyorum. (BTW: Aynı zamanda bazı çıkarımsal istatistikler de yapıyorum ve 20'den az gözlemle, gerçekten ortalama ve bir parametreden daha fazlasını tahmin edemezsiniz.)
S. Kolassa - Monica

5
Bir şey değil ;-) Paket servisi olan restoran "kısa" içeriğe çok bağımlı: Sanırım: Sensör okuma serisi veya finans için 1000 veri noktası "kısa" - ancak tedarik zinciri yönetiminde 20 aylık gözlem neredeyse normal ve "kısa" sadece 12 veya daha az gözlemde başlayacaktır.
S. Kolassa - Monica

11

T20

Aşağıdaki kalitatif yöntemler pratikte çok kısa veya hiç veri olmadan iyi çalışır:

  • Bileşik tahminler
  • Anketler
  • Delphi yöntemi
  • Senaryo oluşturma
  • Analojiyle Tahmin
  • Yönetici görüşü

Çok iyi çalıştığını bildiğim en iyi yöntemlerden biri, kısa vadeli tahminleri tahmin etmek ve tahmin etmek için kullanmak istediğiniz kategorideki benzer / analog ürünleri aradığınız yapısal analojilerin kullanılmasıdır (yukarıdaki listede 5.) . Örnekler için bu makaleye bakın ve bunu elbette SAS kullanarak nasıl yapacağınızla ilgili SAS makalesi . Bir sınırlama, analojilere göre yapılan tahminin sadece sizin için iyi analojilere sahip olacağıdır, aksi takdirde yargı tahminine güvenebilirsiniz. İşte Forecastpro yazılımından, Forecastpro gibi bir aracın analojiyle tahmin yapmak için nasıl kullanılacağına ilişkin başka bir video . Bir analoji seçmek bilimden çok bir sanattır ve benzer ürünler / durumlar seçmek için alan uzmanlığına ihtiyacınız vardır.

Kısa veya yeni ürün tahmini için iki mükemmel kaynak:

  • Armstrong'un Tahmini İlkesi
  • Kahn'dan Yeni Ürün Tahmini

Aşağıdaki açıklama amaçlıdır.Ben sadece Sinyal ve Gürültü okumayı bitirdimNate Silver tarafından, ABD ve Japon (ABD pazarına benzer) konut piyasası kabarcığı ve tahmininde iyi bir örnek var. Aşağıdaki tabloda 10 veri noktasında durup ekstrapolasyon yöntemlerinden birini kullanırsanız (üstel smooting / ets / arima ...) ve sizi nereye götürdüğünü ve gerçekte nerede bittiğini görün. Yine sunduğum örnek, basit eğilim ekstrapolasyonundan çok daha karmaşık. Bu sadece sınırlı veri noktaları kullanarak eğilim ekstrapolasyonunun risklerini vurgulamak içindir. Ayrıca, ürününüz mevsimsel bir düzen içeriyorsa, tahmin için bazı benzer ürünler durumu kullanmanız gerekir. Journal of Business araştırmasında, eczacılıkta 13 haftalık ürün satışınız varsa, benzer ürünleri kullanarak verileri daha doğru bir şekilde tahmin edebileceğinizi düşündüğüm bir makale okudum.

görüntü tanımını buraya girin


Farklı bir yaklaşıma dikkat çektiğiniz için teşekkürler! Ve katılıyorum, Nate Silvers kitabı harika.
Tim

5

Gözlem sayısının kritik olduğu varsayımı, bir modeli tanımlamak için minimum örneklem büyüklüğü ile ilgili GEP Box tarafından yapılan açık bir yorumdan geldi. İlgilendiğim kadarıyla daha ayrıntılı bir cevap, model tanımlamanın sorun / kalitesinin yalnızca örneklem büyüklüğüne değil, sinyalin verilerdeki gürültüye oranına dayanmasıdır. Gürültü oranına dair güçlü bir sinyaliniz varsa daha az gözlem gerekir. Düşük s / n değerine sahipseniz tanımlamak için daha fazla örneğe ihtiyacınız var. Veri setiniz aylıksa ve 20 değeriniz varsa, verilerin mevsimsel olabileceğini düşünüyorsanız NASIL bir mevsimsel modeli tanımlamak mümkün değildir. O zaman bir ar (12) belirterek modelleme işlemine başlayabilir ve daha sonra model teşhisi yapabilir ( önemli testler) yapısal olarak eksik olan modelinizi azaltmak veya arttırmak için


5

Çok sınırlı verilerle, Bayesian tekniklerini kullanarak verilere uymaya daha meyilli olurdum.

Bayesian zaman serisi modelleriyle uğraşırken durağanlık biraz zor olabilir. Bir seçenek parametreler üzerindeki kısıtlamaları zorlamaktır. Ya da yapamazsın. Parametrelerin dağılımına sadece bakmak istiyorsanız, bu gayet iyi. Bununla birlikte, posterior öngörücüyü oluşturmak istiyorsanız, patlayacak birçok tahmininiz olabilir.

Stan dokümantasyonu durağanlığı sağlamak için zaman serisi modellerinin parametreleri üzerinde kısıtlamalar koydukları birkaç örnek sunar. Bu, kullandıkları nispeten basit modeller için mümkündür, ancak daha karmaşık zaman serileri modellerinde oldukça imkansız olabilir. Durağanlığı güçlendirmek istiyorsanız, bir Metropolis-Hastings algoritması kullanabilir ve uygun olmayan tüm katsayıları atabilirsiniz. Bununla birlikte, bu hesaplanması gereken çok sayıda özdeğer gerektirir, bu da işleri yavaşlatacaktır.


0

Akıllıca belirttiğiniz sorun sabit listeye dayalı prosedürlerin neden olduğu "fazla uydurma". Akıllı bir yol, ihmal edilebilir bir miktarda veriniz olduğunda, denklemi basit tutmaya çalışmaktır. Birçok aydan sonra, AR (1) modelini kullanırsanız ve adaptasyon oranını (ar katsayısı) veri işlerine oldukça iyi karar verebileceğini öğrendim. Örneğin, tahmin edilen ar katsayısı sıfıra yakın ise, bu genel ortalamanın uygun olacağı anlamına gelir. eğer katsayı +1.0'a yakınsa, bu, (sabit için ayarlanan son değerin daha uygun olduğu anlamına gelir. Katsayı, -1.0'a yakın ise son değerin negatifi (sabit için ayarlanan) en iyi tahmin olacaktır. Katsayısı aksi takdirde, geçmişin ağırlıklı bir ortalamasının uygun olduğu anlamına gelir.

Bu tam olarak AUTOBOX ile başlayan şeydir ve daha sonra "küçük bir gözlem sayısı" ile karşılaşıldığında tahmin edilen parametreye ince ayar yapıldığında anomalileri atar.

Bu, saf veri odaklı bir yaklaşımın uygulanabilir olmadığı durumlarda "tahmin sanatı" örneğidir.

Aşağıda 12 veri noktası için geliştirilen ve anomaliler için endişe duymayan otomatik bir model gösterilmektedir. görüntü tanımını buraya girinBurada Gerçek / Uygun ve Tahmin ile burada görüntü tanımını buraya girinartık arsagörüntü tanımını buraya girin

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.