Topluluk zaman serisi modeli


13

Zaman serisi tahminini otomatikleştirmem gerekiyor ve bu serilerin özelliklerini (mevsimsellik, trend, gürültü, vb.) Önceden bilmiyorum.

Amacım her dizi için mümkün olan en iyi modeli elde etmek değil, oldukça kötü modellerden kaçınmaktır. Diğer bir deyişle, her seferinde küçük hatalar almak sorun değil, arada sırada büyük hatalar almaktır.

Bunu farklı tekniklerle hesaplanan modelleri birleştirerek başarabileceğimi düşündüm.

Yani, ARIMA belirli bir seri için en iyi yaklaşım olsa da, başka bir seri için en iyi seçenek olmayabilir; üstel yumuşatma için aynıdır.

Bununla birlikte, her bir teknikten bir modeli birleştirirsem, bir model çok iyi olmasa bile, diğeri tahmini gerçek değere yaklaştırır.

ARIMA'nın uzun vadeli iyi kalpli seriler için daha iyi çalıştığı iyi bilinirken, üstel yumuşatma kısa süreli gürültülü serilerle öne çıkıyor.

  • Benim fikrim daha sağlam tahminler elde etmek için her iki teknikten üretilen modelleri birleştirmek, mantıklı mı?

Bu modelleri birleştirmenin birçok yolu olabilir.

  • Bu iyi bir yaklaşımsa, bunları nasıl birleştirmeliyim?

Tahminlerin basit bir ortalaması bir seçenektir, ancak ortalamanın modelin bazı iyilik ölçüsüne göre ağırlıklandırılması durumunda belki daha iyi tahminler alabilirim.

  • Modelleri birleştirirken varyansın tedavisi ne olur?

Fikirleriniz kulağa hoş geliyor, ancak otomatik olarak uygun ARIMA modellerini kullanmaktan emin değilim . Tek değişkenli seriler için ... Geleneksel bilgelik, Holt-Winters'in otomatik olarak oldukça sağlam kullanılmasıdır, bu nedenle yöntemler arasındaki örnek dışı karşılaştırmalar için temeliniz olabilir.
Scortchi - Monica'yı eski durumuna döndürün

@Scortchi Tüm serilerin tek değişkenli olduğunu söylemeyi unuttum! ;) Holt-Winters'in otomatik olarak kullanıldığında gerçekten iyi performans gösterdiğini kabul ediyorum, ancak tahminlerin çok iyi olmadığı durumlardan kaçınmak için başka bir modelden bir kez daha görüş almak istiyorum. Bazen HW garip eğilim davranışı gösterir.
João Daniel

1
Tek değişkenli durumda bile otomatik bir prosedür hayal etmek için mücadele ediyorum - düşünmek için eğilim (stokastik veya deterministik), olası dönüşümler, mevsimsellik (çarpımsal veya katkı maddesi) var ve bir modele ulaşmak için çok fazla ön bilgi kullandığımı görüyorum belirli bir dizinin gerçekte neyi temsil ettiği için neyin mantıklı olacağı konusunda. Yine de, pudingin kanıtı yemekte - gerçekten sadece basit tekniklerle örnek dışı karşılaştırmalar yapmayı unutmamayı söylemek istedim - onunla çok iyi şanslar.
Scortchi - Monica'yı eski durumuna döndürün

Yanıtlar:


15

Tahminleri birleştirmek mükemmel bir fikirdir. (Bunun akademik tahmincilerin üzerinde anlaştığı birkaç şeyden biri olduğunu söylemek abartı değil.)

Bir süre önce, tahminleri birleştirirken ağırlıklandırma için farklı yollara bakarak bir kağıt yazdım: http://www.sciencedirect.com/science/article/pii/S0169207010001032 Temel olarak, (Akaike) ağırlıkları kullanmak kombinasyonları sürekli olarak iyileştirmedi basit veya kesilmiş / winsorized araçlar veya medyanlar üzerinde, bu yüzden kişisel olarak belirli bir fayda sağlayamayacak karmaşık bir prosedür uygulamadan önce iki kez düşünürdüm (yine de, kombinasyonların seçim kriterlerini tutarlı bir şekilde bilgi kriterlerine göre daha iyi performans gösterdiğini hatırlayın). Bu elbette sahip olduğunuz belirli zaman serilerine bağlı olabilir.

Yukarıdaki makalede tahmin aralıklarını birleştirmeye baktım, ancak varyansı bu şekilde birleştirmeye bakmadım. Bu odak ile IJF'de çok uzun olmayan bir makaleyi hatırlıyorum , bu yüzden IJF'nin geri sorunları aracılığıyla "birleştirmek" veya "kombinasyon" aramak isteyebilirsiniz.

Tahminleri birleştirmeyi inceleyen birkaç makale daha (1989'dan, ancak bir gözden geçirme) ve burada ve burada (ayrıca yoğunluklara da bakar) ve burada ve burada. Bunların birçoğu, tahmin kombinasyonlarının neden seçilen tek modellerden daha iyi performans gösterdiğini hala iyi bilmemektedir. İkinci ve son makale M3 tahmin yarışmasında; temel bulgularından biri, (çeşitli şekillerde kombinasyonun doğruluğu, ortalama olarak, birleştirilen spesifik yöntemlerden daha iyi performans gösterir ve diğer yöntemlerle karşılaştırıldığında iyi sonuç verir). Bu makalelerin sonuncusu, kombinasyonların mutlaka tek modellerden daha iyi performans göstermediğini, ancak felaket başarısızlığı riskini önemli ölçüde azaltabildiğini bulmaktadır (bu, hedeflerinizden biridir). Daha literatür içinde kolayca bulunması gerektiğini Öngörü International Journal , Tahmin Journal ve ekonometri veya tedarik zinciri literatüründeki daha spesifik uygulamalar için.


1
Modelleri birleştirmek için harika bir bakış açısı! Cevabınız çok yapıcıydı!
João Daniel

@Stephan Kolassa, Burg'un yönteminde olduğu gibi ileri ve geri yordayıcıları birleştirme konusunda yorumlarınız olur mu?
denis

@denis: Tahminleri / tahminleri (aka topluluk yöntemleri) birleştirmenin genellikle faydalı olacağını varsayarsam da, ileri veya geri tahmin edicilere veya Burg'un yöntemine aşina değilim.
Stephan Kolassa

Merhaba Stephan, harika bir makale. Günlük sitesi değişmiş görünüyor ve artık R kodunuzu ana siteden indirmek mümkün görünmüyor. Barındırma şimdi farklı bir sitede mi?
Ian

@Ian: abone değilseniz buna erişemeyebilirsiniz. Bana bir e-posta gönder ( adresimi burada bul ), komut dosyalarını göndereceğim Onları kazmam için bana birkaç gün ver.
Stephan Kolassa

1

Neden daha fazla belirtmiyorsunuz? Üreteceğiniz herhangi bir modelin belirli bir seçimden daha iyi veya yeterince iyi olabileceğini düşünmüyorum.

Bununla birlikte, seçimlerinizi test edebileceğiniz seçeneklere biraz daraltabilirseniz ve veri girişi standartlaştırılabilirse, neden R'de otomatik bir test prosedürü yazmıyorsunuz?

Verilerinizin beş model ve bir "yedek" tarafından tahmin edilmek üzere bir aralığa düşeceğine karar verdiğinizi varsayalım. Girişi farklı testlerle karakterize edebileceğinizi varsayalım. Sonra devam edin ve bunu sizin için çalıştıran bir R (veya bunun gibi bir program) algoritması yazın. Bu, test verilerine dayanarak hangi modelin çalıştırılacağı bir akış şeması üretebiliyorsanız, yani karar ağacının herhangi bir noktası ikili ise işe yarar.

Karar ikili olmayabileceğinden bu bir seçenek değilse, geçerli testlere dayalı bir derecelendirme sistemi uygulamanızı ve sonuçların aradığınız şey olup olmadığını görmek için ızgarada bazı "uç durumlar" simüle edilmiş verileri çalıştırmanızı öneririm.

Bunları açık bir şekilde birleştirebilirsiniz, örneğin durağan olmayanlık için test kesin bir evet-hayır verebilir, diğer özellikler ise çoklu bağlantı gibi bir aralığa düşebilir.
Bunu önce kağıda çizebilir, sonra inşa edebilir, olmasını beklediğiniz bilinen dağılımlarla simüle edebilirsiniz.

Daha sonra yeni veriler her geldiğinde R programını çalıştırın. Birkaç modeli elinizin altında bulunan hesaplama yetenekleri ile birleştirmeye gerek görmüyorum.


Verileri açıkça mevsimsel ise, mevsimsel olmayan yöntemleri kullanmamak gibi seçenekleri daraltmak iyi bir fikirdir. Ancak o zaman bile, birden çok mevsimsel modelin (katkı maddesi ile çarpımsal mevsimsellik, trend olan veya olmayan) ortalamalarının tahmin doğruluğunu artıracağını iddia ediyorum . En azından bu, tahmin topluluğunun yanı sıra M3 ve benzeri tahmin yarışmalarına da biraz maruz kaldığım izlenimidir.
Stephan Kolassa

Bununla ilgili başka makaleleriniz var mı? Demek istediğim, bu basit ama alakalı bir araştırma konusu olacak. Çok ilginç bir fikir, ancak sezgisel olarak, dinamik bir model ızgarasından daha iyi olacağı konusunda hemfikir değilim.
IMA

İyi bir nokta. Cevabımı daha fazla literatür işaretçisi içeren ek bir paragraf içerecek şekilde düzenledim. Bunun basit ve alakalı olduğunu kabul ediyorum ve tahmin ortalamasının genellikle doğruluğu neden geliştirdiğini hala iyi anlaşılmıyor.
Stephan Kolassa

Evet, yani her türlü dağıtım problemini modelleyebilir, hesaplama ve temelde ona saldırabilirsiniz. Makaleler için teşekkürler, çok ilginç.
IMA

0

İki tahmin yöntemini birleştirmek için güzel ve basit bir formül vardır, sadece birincisini bir diğeriyle (1 - a) çarparak ağırlıklandırırsınız, burada a bu kombine tahminin varyansını en aza indirerek bulunur. Her iki öngörme yönteminin hatalarını da bildiğiniz gibi, "a" ya bağlı kombinasyonun hatalarını hesaplayabilirsiniz. Her yöntemin ortalaması = 0 olduğunda hesaplama basittir. 2'den fazla yöntemi birleştirmek için formüller, analitik olarak "elle" hesaplayabilmeniz veya EXCEL'den Çözücü seçeneğini kullanabilmeniz açısından "basit" tir.


Bu yönteme referans verebilir misiniz?
horaceT
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.