Auto.arima vs autobox farklı mı?


16

Bu sitedeki yazıları okuduktan sonra ( pakette ) bir R işlevi olduğunu biliyorum . Ben de biliyorum IrishStat , bu sitenin bir üyesi ticari paket inşa autobox 1980'lerin başında. Bu iki paket bugün mevcut olduğundan ve verilen veri setleri için otomatik olarak arima modellerini seçtiklerinden farklı olarak ne yapıyorlar? Aynı veri seti için muhtemelen farklı modeller üretecekler mi?auto.arimaforecast


@Wayne düzenlemesi için teşekkürler. Ben R tahmin paketi ile familar değilim ama eminim o autobox ile karşılaştırmak ne demek.
Michael R. Chernick

("Auto-arima" yı "auto.arima" ya ikinci bir küçük değişiklik yaptım.) auto.arimaBaşka paketlerde başka işlevler de olabilir , ancak forecastaçıklaması olan " kesinlikle en iyi ARIMA modelini döndürür." işlev AIC, AICc veya BIC değerine dönüştürülür. İşlev, sağlanan sipariş kısıtlamaları dahilinde olası model üzerinde arama yapar. "
Wayne

1
AUTOBOX, otomatik tanımlamayı bütünsel bir şekilde ele alarak, otomatik tanımlamayı yineleyerek tanımlanabilir yapıdan arındırılmış bir hata sürecine sahipken sadece istatistiksel olarak önemli parametrelere sahip bir model oluşturmak için teşhis artırımı ve düşürme prosedürleri gerçekleştirir. Bu şekilde yinelemenin senaryosunu takip eder. 1975 dolaylarında AUTOBOX'un ilk versiyonları "tek bir istatistik yaklaşımı" kullanmaya çalışmıştı, ancak bu, tanımlanmış modellerin ya gereksiz ya da aptal bir yapıya (örneğin 5,1,2) sahip olduğu ya da yetersiz bir yapıya sahip olmaları istendiğinde bulundu.
IrishStat

1
@IrishStat Kulağa iyi bir yaklaşım gibi geliyor. Gereksinimlerinizi karşılayan iki rakip model bulursanız ne yaparsınız? Mümkün görünüyor. Belirli kriterlere göre "optimal" bir model önerir misiniz? Sadece "istatistiksel olarak anlamlı parametreler" olan bir modelin seçimini parsimony tercih etme eğiliminde olduğunun farkındayım, ancak düşük parametreli AR süreci ve tüm parametrelerin istatistiksel olarak önemli olduğu ve artıkların beyaz gibi göründüğü başka bir düşük dereceli AEMA modeline sahip olmak mümkün değil gürültü, ses?
Michael R. Chernick

1
@IriehStat. Size katılıyorum. Sonunda kullanıcı için ne yaparsınız. Sadece bir model sağlıyor musunuz yoksa rakip kabul edilebilir modellerin sıralı bir listesini verebilir misiniz? İkincisi değilse, listeyi küçük bir sayı ile sınırladığınız yere eklemek için iyi bir seçenek olabilir.
Michael R. Chernick

Yanıtlar:


9

michael / wayne

Aşağıdaki koşullardan biri veya daha fazlası yerine getirilirse AUTOBOX kesinlikle farklı bir model teslim eder / tanımlar

1) Verilerde Bakliyat Var

2) Veride 1 veya daha fazla seviye / adım kayması var

3) Verilerde mevsimsel darbeler varsa

4) Verilerde basitçe düzeltilmeyen 1 veya daha fazla yerel zaman eğilimi var

5) modelin parametreleri zaman içinde değişirse

6) hataların varyansı zaman içinde değişirse ve hiçbir güç dönüşümü yeterli değilse.

Belirli bir örnek olarak, ikinizin de bir zaman serisi seçmesini / yapmasını ve her ikisini de web'e göndermesini öneririm. Verileri katılımsız modda analiz etmek için AUTOBOX kullanacağım ve modelleri listeye göndereceğim. Daha sonra R programını çalıştırırsınız ve her biriniz her iki sonucun ayrı bir objektif analizini yapar ve benzerlikleri ve farklılıkları gösterirsiniz. Bu iki modeli, son hata şartları da dahil olmak üzere mevcut tüm destekleyici materyallerle birlikte yorumlarım için bana gönder. Bu sonuçları özetleyin ve listeye sunun ve ardından listenin okuyucularından hangi prosedürün kendileri için en iyi göründüğünü VOTE'ye sorun.


Eğer böyle bir yarışma ifade ediyor bu bir ?
whuber

@whuber Evet. Belki de bir fon olarak kullanılabilecek bazı "bilinmeyen / kodlu ders kitabı örneği" kullanmak.
IrishStat

22

İki benzer fakat farklı soruna iki farklı yaklaşımı temsil ederler. Ben yazdım auto.arimave @IrishStat yazarıdır Autobox.

auto.arima()sürüklenme terimlerini içeren (mevsimsel) ARIMA modellerine uyar. Autoboxseviye değişimlerini ve aykırı değerleri yönetmek için transfer fonksiyonu modellerine uyar. ARIMA modeli, transfer fonksiyonu modelinin özel bir halidir.

Seviye kaymalarını ve aykırı algılamayı kapatmış olsanız bile , ARIMA parametrelerini tanımlamada farklı seçenekler nedeniyle Autoboxfarklı bir ARIMA modeli elde edersiniz auto.arima().

M3 ve M-rekabet verileri üzerinde yaptığım testte, bu verilerden auto.arima()daha doğru tahminler üretiyor Autobox. Ancak, Autoboxbüyük aykırı değerler ve seviye değişimleri içeren verilerle daha iyi sonuç verir.


3
Yıllar önce AUTOBOX'un bir versiyonundan bahsettiğinize inanıyorum. AUTOBOX bu yıllar boyunca önemli ölçüde değişti. Eğer yanılmıyorsam sadece 1 orijinli doğrulukları karşılaştırmış olursunuz ki bu 1'in bir örneğidir.
IrishStat

15
Binlerce seri arasında yayınlanan karşılaştırmaları kastediyorum. Uluslararası Tahmin Dergisi'nin Genel Yayın Yönetmeni olarak, tahminlerin nasıl değerlendirileceği hakkında bir fikrim olduğunu düşünüyorum.
Rob Hyndman

2
Bu sorunun kimin en iyi tahmin algoritmasına sahip olduğu hakkında argüman getirmesini istemedim. Sanırım hem autobox hem de auto.arima muhtemelen çok iyi paketler. Kafa kafaya karşılaştırma pek çok nedenden dolayı adil olmayabilir. 1) Kullanıcı, onları nasıl yargılayacağını bilecek kadar uzman olmayabilir. 2) Tek bir zaman serisinde tahmin doğruluğu saçmalık. Tahminde daha düşük bir ortalama kare hatası olabilir, ancak rastgelelik söz konusu olduğunda dikkate alınmalıdır. Birkaç seriye bakmanız gerekiyor ve IrishStat'ın önerdiği gibi farklı başlangıç ​​noktalarına bakmanız gerekiyor.
Michael R. Chernick

Öngörmeyi başlatmak için farklı noktalar da yararlı olacaktır. 3) ARIMA dünyasında aynı zaman serisi modeli için birden fazla temsil vardır, sonlu AR süreçleri sonsuz hareketli ortalama gösterimlere sahiptir ve bunun tersi de geçerlidir. Dolayısıyla, düşük dereceli bir AR, yüksek dereceli bir hareketli ortalama veya bir ARMA ile neredeyse aynı olabilir. Kutu her zaman parsimony prensibine göre önerdi. Ancak çok fazla veriniz varsa, parametrelerin iyi tahminlerini alabilirsiniz ve yüksek dereceli model, parsimonious ile aynı tahminleri üretebilir. 4) İki paketin farklı hedefleri vardır.
Michael R. Chernick

3
Yöntem zamanla gelişti. Dave Reilly, IrishStat olarak bu sitede çok aktif ve genel anlamda nasıl çalıştığını açıklamak konusunda çok açık. Ticari sırlara ve özel algoritmalara sahip olmak işin vazgeçilmez bir öğesidir. Onun bakış açısından R, SPlus için olduğu gibi işini incitiyor. Ama acı göstermiyor ve yazılımını bugün gördüğünüz gibi göstermeye çok istekli. Ayrıca rakiplere karşı testler yapmaya hazır ve ben de zaman serisi tahmin yarışmalarına girdiğine inanıyorum.
Michael R. Chernick

11

DÜZENLEME: Yorumunuza göre, birçok seçeneği kapatırsanız autobox, muhtemelen benzer bir yanıt alacağınıza inanıyorum auto.arima. Ancak, yapmazsanız ve aykırı değerlerin varlığında kesinlikle bir fark olacaktır: auto.arimaaykırı değerlere aldırmazken, autoboxonları tespit edip uygun şekilde idare eder, bu da daha iyi bir model verir. Başka farklılıklar da olabilir ve eminim IrishStat bunları tarif edebilir.


autoboxEn iyi AR, I ve MA katsayılarını aramanın ötesinde aykırı değerleri ve diğer şeyleri tespit ettiğine inanıyorum . Bu doğruysa, benzer işlevselliğe sahip olmak için daha fazla analiz ve birkaç başka R işlevi gerektirir. IrishStats bu topluluğun değerli bir üyesidir ve oldukça arkadaş canlısıdır.

Elbette, R ücretsizdir ve ARIMA'nın ötesinde bazilyon şeyler yapabilir.

Ekonomi tarzı ARIMA için ücretsiz olan bir diğer seçenek X13-ARIMA SEATS, açık kaynak olan ABD Sayım Bürosu'ndan. Windows ve Linux için ikili dosyalar var, ancak gnu'nun gfortran derleyicisini zaten yüklediğim göz önüne alındığında, Mac'imde doğrudan derlendi. X12-ARIMAYıllarca süren geliştirme ve testlerin ardılı ve son birkaç gün içinde piyasaya sürüldü. (X12'yi günceller ve SEATS / TRAMO özelliklerini de ekler. X12 resmi ABD aracı, SEATS / TRAMO ise İspanya Merkez Bankası'ndan ve "Avrupa aracı" dır.)

X12'yi (ve şimdi X13'ü) çok seviyorum. Eğer makul miktarda teşhis çıkarır ve bunları okur ve ne anlama geldiğini öğrenirseniz, bunlar aslında ARIMA ve zaman serilerinde oldukça iyi bir eğitimdir. Kendi iş akışımı geliştirdim, ancak R x12içinden en fazla işi yapmak için bir R paketi var (X12 için hala giriş modeli (".spc") dosyasını oluşturmanız gerekiyor).

X12'nin "ekonomi tarzı" ARIMA'da iyi olduğunu ve 3 yıldan fazla veriyle aylık veri anlamına geldiğini düşünüyorum. (Bazı tanılama özelliklerini kullanmak için 5 yıldan fazla veriye ihtiyacınız vardır.) Bir aykırı tanımlama özelliği vardır, her türlü aykırı özellikleri işleyebilir ve tatiller, yüzen tatiller, ticaret günü efektleri ve bir dizi ekonomik şeyle başa çıkabilir. ABD hükümetinin mevsimsellikten arındırılmış veriler oluşturmak için kullandığı araç.


Sorum, iki algoritmanın muhtemelen farklı model seçimleri üreteceği bir veri seti verildi. Gerçekten ilgilendiğim otomatik bölüm ve bir diğer değil hve olabilir diğer tanı özellikleri qny değil. ARMA modelleri ailesinin ve ailede iki modelin aynı modelin tam veya neredeyse tam alternatif gösterimleri olabileceği bilinmektedir. Bu yüzden seçim prosedürlerinde küçük farklılıklar varsa, farklı model seçenekleri verebileceklerini düşünürdüm.
Michael R. Chernick

3
@MichaelChernick: Ah. Tahminimce tüm otomatik şeyleri kapatırsanız autoboxaynı cevabı alırsınız. Ancak kullanım noktalarından biri, autoboxaykırı değerleri tespit edip bu şekilde ele almasıdır, bu nedenle, aykırı değerler varsa, geri gönderilen model farklı olacaktır.
Wayne

@Wayne +1, X13-ARIMA SEATS ve SEATS / TRAMO hakkında daha fazla bilgi için.
Graeme Walsh

@Wayne Bu arada, başka bir "Avrupa Aracı" DEMETRA + .
Graeme Walsh
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.