Zaman serisi analizinin amacı nedir?


29

Zaman serisi analizinin amacı nedir?

Regresyon ve makine öğrenmesi gibi, belirgin kullanım durumları olan birçok başka istatistiksel yöntem vardır: regresyon iki değişken arasındaki ilişki hakkında bilgi sağlayabilirken, makine öğrenmesi tahmin için mükemmeldir.

Ancak bu arada, zaman serileri analizinin ne için iyi olduğunu anlamıyorum. Elbette, bir ARIMA modelini takıp tahmin için kullanabilirim, ancak bu öngörü için güven aralığının çok büyük olması ne işe yarar ki? Dünya tarihindeki en veriye dayalı endüstri olmasına rağmen hiç kimsenin borsayı tahmin edememesinin bir nedeni var.

Aynı şekilde sürecimi daha iyi anlamak için nasıl kullanabilirim? Elbette, ACF'yi çizip "aha! Bazı bağımlılıklar var!" Diyebilirim, peki ya sonra? Amaç ne? Elbette bağımlılık var, bu yüzden başlamak için zaman serisi analizi yapıyorsunuz. Bağımlılık olduğunu zaten biliyordun . Ama onu ne için kullanacaksın?


13
İyi çalıştıkları finans ve ekonomi dışında başka kullanım durumları da var.
user2974951 19:18

29
Diğer istatistiksel ve makine öğrenme yöntemlerini kullanarak borsa tahmin edemezsiniz, bu da onları işe yaramaz hale getirir mi?
Tim

16
ARIMA'nın bir tür regresyon olmadığını ima ediyor gibisiniz. Bu.
Firebug

10
Cevap uzmanlara açık görünse bile, bunun iyi bir soru olduğunu düşünüyorum.
gung - Monica'yı yeniden

6
Ben ve diğerleri ile farklı olmak için yalvarıyorum, çünkü en az araştırma çabası buna cevap verecektir.
whuber

Yanıtlar:


54

Bir ana kullanım . Bir süpermarketin yarın bir üründen kaç tane satacağını tahmin ederek ailemi on yıldan fazla bir süredir besliyorum, bu yüzden yeterince stok sipariş edebilir, ama çok fazla değil. Bunun içinde para var.

Diğer tahmin kullanım durumları, Uluslararası Öngörü veya Öngörü Dergisi gibi yayınlarda verilmektedir . (Tam açıklama: Öngörünün Yardımcı Editörüyüm .)

Evet, bazen s çok büyüktür. ( değil PI demek istediğinizi varsayalım . Bir fark var. ) Bu basitçe sürecin tahmin edilmesi zor olduğu anlamına gelir. O zaman hafifletmelisin. Süpermarket satışlarını tahmin ederken, bu çok fazla güvenlik stoğuna ihtiyacınız olduğu anlamına gelir. Deniz seviyesinin yükseleceğini tahmin ederken, bu, daha yüksek seviyelerde leve inşa etmeniz gerektiği anlamına gelir. Geniş bir tahmin aralığının faydalı bilgi sağladığını söyleyebilirim.

Ve tüm tahmin kullanım senaryoları için analizi faydalıdır, ancak tahmin daha büyük bir konudur. Zaman serilerinizdeki bağımlılıkları hesaba katarak tahminleri sık sık iyileştirebilirsiniz; bu nedenle, onları sadece bağımlılıkların varlığından haberdar olmaktan daha özel olan analiz yoluyla anlamanız gerekir .

Artı, insanlar tahmin etmeseler bile zaman serileriyle ilgileniyorlar. Ekonometristler makroekonomik zaman serilerindeki değişim noktalarını tespit etmeyi severler. Veya vergi kanunları değişikliği gibi bir müdahalenin GSYİH veya başka bir şey üzerindeki etkisini değerlendirin. Daha fazla ilham almak için en sevdiğiniz ekonometri günlüğüne göz atmak isteyebilirsiniz.


14
+1. Başka yerlerde de yararlıdır. Bir zaman serisi analizi yapmak, sizi ilgilendiğiniz sonucu etkileyen olayları (bilmediğiniz) kesinlikle uyaracaktır. Ben ve tüm meslektaşlarım salı sabahları genel olarak ürün kimyasal analizleri üzerinde daha kötü davrandığımızı fark ettim. Bazı zayıf yönleri olan iyi niyetli bir temizlik programına geri döndük. Yıl boyunca bir milyona yakın tasarruf sağladık ve ppk ürününü 1,7'den 1,9'a yükselttik. Alınan ders: Değişkenlik çerçeveli herhangi bir problem için daima basit bir zaman serisi analizi yapın.
Stian Yttervik

+1. @Stephan Kolassa, cevabınız OP'nin sorusunu yorumladığım gerçek dünyada tahminlerin nasıl kullanıldığını vurgulamaktadır. Tahmin aralığı noktası ve (yarım) uzunluk, azaltma stratejilerinin planlanması için tam olarak önem verdiğiniz bilgilerdir. Manhattan'ın taşmasını engellemek için vergi indirimleri yapıyorsanız ve yeni zaman serisi yönteminiz tahmin aralığını yeterince azaltırsa, yalnızca gerekli kaynakları kullanarak vergi inşaatının maliyetini düşürebilirsiniz. Mutatis mutandis bakkaliye örneğiniz için geçerlidir.
Lucas Roberts

13

M. Dettling'in ders slaytlarından TS Analizindeki Hedefler:

1) Keşif Analizi: Serinin özelliklerinin görselleştirilmesi

  • zaman serileri grafiği
  • trend / mevsimsel düzen / rastgele hataya ayrışma
  • bağımlılık yapısını anlamak için korelogram

2) Modelleme: Serinin en önemli özelliklerini temsil eden ve yansıtan verilere stokastik bir model yerleştirmek

  • keşif veya önceki bilgilerle yapılır
  • model seçimi ve parametre tahmini çok önemlidir
  • çıkarım: model verilere ne kadar uyuyor?

3) Tahmin: Belirsizliğin ölçülmesi ile gelecekteki gözlemlerin tahmini

  • çoğunlukla model tabanlı, bağımlılık ve geçmiş verileri kullanıyor
  • bir ekstrapolasyondur, bu nedenle genellikle bir tuz tuzu ile alınır.
  • dikiz aynasına bakarak araba kullanmaya benzer

4) Süreç Kontrolü: Bir (fiziksel) işlemin çıktısı bir zaman serisini tanımlar.

  • gözlenen verilere stokastik bir model yerleştirilmiştir
  • bu hem sinyal hem de gürültüyü anlama imkanı sağlar
  • normal / anormal dalgalanmaları izlemek mümkündür

5) Zaman Serileri Regresyonu: 1 veya daha fazla giriş serisini kullanarak yanıt süresi serisinin modellenmesi Bu modelin iid hatası varsayımı altında kurulması:

  • tarafsız tahminlere neden olur, ancak ...
  • genellikle kaba yanlış standart hatalar
  • bu nedenle, güven aralıkları ve testler yanıltıcıdır

Stokta işaretli sorun hakkında:

  • Bu TS çok değişken, modellemesi zor.
  • Örneğin, şirketi ilgilendiren bir kanunda yapılan değişiklik, TS sürecinde bir değişikliğe yol açabilir ... herhangi bir istatistiksel araç bunu nasıl öngörebilir?

Seri korelasyon hakkında:

  • Çok değişkenli istatistiklerin aksine, bir zaman serisindeki veriler genellikle tanımlanmaz, ancak seri olarak ilişkilendirilir.
  • Bu bilgiler ayrıca, örneğin kirli bir laboratuvar aleti gibi, bulunmaması gereken bir şeyin tespit edilmesi için ne olması gerektiği konusunda da faydalı olabilir.

1
Sınıflandırma ekleyeceğim, örneğin, telefonunuzun ivmeölçer verilerini analiz etmeye dayalı olarak etkinliğinizi tanıyan çok sayıda uygulama var.
SaiBot

İlginç! Bunu nasıl yapıyorsun?
Nicole Origami Fox

1
Bence birçok farklı yol var. Bir yol, kullanıcıların etkinliklerini etiketleyerek eğitim verilerini üretmelerine izin vermektir. Bunu yaptıktan sonra zaman çizelgelerini (örtüşen) aralıklarla (örneğin, 3 saniye) kesebilir ve bir makine öğrenme modeli eğitebilirsiniz. Daha sonra etiketlenmemiş etkinlikleri sınıflandırmanız mümkün olacaktır.
SaiBot

Teşekkürler SaiBot. Görüyorum ki, farklı araçların kombinasyonunu daha sık düşünmeliyim :)
Nicole Origami Fox

11

Sorunuzu yanıtlamanın en kolay yolu, kabaca veri setlerinin çoğu zaman kesitsel , zaman serileri ve panel olarak sınıflandırıldığını anlamaktır . Kesitsel regresyon , kesitsel veri kümeleri için kullanılan bir araçtır. Çoğu insanın bildiği ve ifade ettiği bir gerileme terimi budur . Zaman serileri gerilemesi bazen zaman serilerine uygulanır, ancak zaman serileri analizi, regresyonun ötesinde çok çeşitli araçlara sahiptir.

Kesitsel verilere örnek olarak , burada rastgele seçilmiş öğrencilerin ağırlık ve yükseklikleridir . Bir örnek rastgele olduğunda, genellikle bir öğrencinin ağırlığını bilerek bu okuldaki bir öğrencinin boyunu tahmin etmek için genellikle doğrusal bir regresyon yapabilir ve güvenilir sonuçlar elde edebiliriz .(x1,y1),(x2,y3),,(xn,yn)xi,yiyxy^x

görüntü tanımını buraya girin

Örnek rastgele değilse, regresyon hiç çalışmayabilir. Örneğin, modeli tahmin etmek için yalnızca birinci sınıftaki kızları seçtiniz, ancak 12. sınıf öğrencisi bir erkeğin boyunu tahmin etmeniz gerekiyor. Dolayısıyla, regresyon, kesitsel kurulumda bile kendi sorunlarına sahiptir.

Şimdi, zaman serisi verilerine bakmak, olabilir gibi , bir yıl ayı ve olan Hala bu ağırlıktaki ve boydaki ama bu okuldaki belirli bir öğrencininxt,yt(x1,y1),(x2,y3),,(xn,yn)tx,y

görüntü tanımını buraya girin

Genel olarak, regresyonun hiç çalışması gerekmez. Bunun bir nedeni endeksleri olmasıdır sıralanır. Bu yüzden numuneniz rastgele değil ve daha önce bahsetmiştim ki regresyon düzgün çalışmak için rastgele bir örneği tercih ediyor. bu ciddi bir mesele. Zaman serisi verileri kalıcı olma eğilimindedir; örneğin, bu ayki boyunuz, gelecek ayki boyunuzla yüksek oranda ilişkilidir. Bu sorunların üstesinden gelmek için zaman serisi analizi geliştirilmiş, regresyon tekniğini de içermiş, ancak belirli şekillerde kullanılması gerekiyor.t

Üçüncü ortak veri seti tipi, özellikle uzunlamasına verilere sahip olan bir paneldir. Burada, birkaç öğrenci için çeşitli ağırlık ve boy değişkenleri anlık görüntüleri elde edebilirsiniz. Bu veri kümesi , enine kesit dalgaları veya bir zaman serisi gibi görünebilir .

görüntü tanımını buraya girin

Doğal olarak, bu önceki iki tipten daha karmaşık olabilir. Burada panel regresyonu ve paneller için geliştirilen diğer özel teknikleri kullanıyoruz.

Özetle, zaman serileri regresyonunun kesitsel regresyon ile karşılaştırıldığında ayrı bir araç olarak kabul edilmesinin nedeni, zaman serilerinin, regresyon tekniğinin bağımsızlık varsayımları söz konusu olduğunda benzersiz zorluklar ortaya koymasıdır. Özellikle, kesit analizinden farklı olarak, gözlemlerin sırası önemli olduğundan, bazen regresyon tekniklerinin uygulanmasını geçersiz kılabilecek her türlü korelasyon ve bağımlılık yapısına yol açar. Bağımlılık ile uğraşmak zorundasınız ve bu tam olarak zaman serisi analizinin iyi olduğu şeydir.

Varlık Fiyatlarının Tahmin Edilebilirliği

Ayrıca, borsalar ve genel olarak varlık fiyatları hakkındaki genel bir yanılgıyı, tahmin edilemeyeceklerini yineliyorsunuz. Bu ifade gerçek olamayacak kadar genel. Bir sonraki AAPL onay işaretini güvenilir bir şekilde tahmin edemediğiniz doğru. Ancak, çok dar bir problem. Ağınızı daha geniş bir alana koyarsanız, her türlü tahminde (özellikle de zaman serisi analizlerinde) para kazanma fırsatlarını keşfedeceksiniz. İstatistiksel arbitraj böyle bir alandır.

Şimdi, varlık fiyatlarının yakın vadede tahmin edilmesinin zor olmasının nedeni, fiyat değişikliklerinin büyük bir bileşeninin yeni bilgiler olmasıdır. Geçmişten gerçekçi bir biçimde tasarlanamayan gerçekten yeni bilgiler, tanım gereği tahmin edilmesi imkansızdır. Bununla birlikte, bu ideal bir modeldir ve birçok insan devletin kalıcılığını sağlayan anomalilerin var olduğunu iddia eder . Bu, fiyat değişikliğinin geçmiş tarafından açıklanabileceği anlamına gelir. Bu gibi durumlarda, zaman serileri analizi oldukça uygundur çünkü tam olarak ısrarla ilgilenir. Eskiden yeniyi ayırmak, yeniyi tahmin etmek imkansızdır, ancak eski geçmişten geleceğe sürüklenir. Hatta biraz açıklayabilir ise finans Eğer demektir maypara kazanmak mümkün. Bu tahmin üzerine inşa edilen stratejinin fiyatı, ürettiği geliri kapsadığı sürece.

Son olarak, 2013'teki ekonomi nobel ödülüne bir göz atın : "önümüzdeki üç ila beş yıl gibi, bu fiyatların geniş seyrini daha uzun sürelerde öngörmek oldukça mümkün." Shiller'ın nobel dersine bir göz attığında, varlık fiyatlarının tahmin edilebilirliğini tartışıyor.


6

Zaman serileri analizi, geçici verilerde etkili anomaliye veya aykırı saptamaya da katkıda bulunabilir.

Örnek olarak, bir ARIMA modeline uymak ve bir tahmin aralığı hesaplamak mümkündür. Kullanım durumuna bağlı olarak aralık, işlemin kontrol altında olduğu söylenebileceği bir eşik belirlemek için kullanılabilir; Yeni veri eşiğin dışına çıkarsa, daha fazla dikkat için işaretlenir.

Bu blog yazısı , dışlayıcı tespiti için zaman serisi analizine kısa ve geniş bir genel bakış sunar. Daha derinlemesine bir tedavi için, ebay'daki araştırmacılar, zaman serisi verilerinin istatistiksel analizine dayanarak ölçek anomalisi tespitini nasıl yaptıklarını açıklar.


6

Regresyon ve makine öğrenmesi gibi, belirgin kullanım durumları olan birçok başka istatistiksel yöntem vardır: regresyon iki değişken arasındaki ilişki hakkında bilgi sağlayabilirken, makine öğrenmesi tahmin için mükemmeldir.

Aşağıda kendi sorunuza cevap veriyorsunuz: otokorelasyon. Zaman serileri genellikle buna sahiptir ve temel OLS regresyonu varsayımını ihlal eder. Zaman serileri teknikleri, zaman serileri için uygun varsayımlara sahiptir.

Sıralı verilerle ilgilenen makine öğrenme yöntemleri, tekrarlayan sinir ağları (RNN'ler) veya 1-B evrişimli sinir ağları (CNN'ler) gibi uzmanlaşmıştır, bu nedenle hala zaman serileri için özel teknikleriniz var.

Ancak bu arada, zaman serileri analizinin ne için iyi olduğunu anlamıyorum. Elbette, bir ARIMA modelini takıp tahmin için kullanabilirim, ancak bu öngörü için güven aralığının çok büyük olması ne işe yarar ki? Dünya tarihindeki en veriye dayalı endüstri olmasına rağmen hiç kimsenin borsayı tahmin edememesinin bir nedeni var.

Bir zaman serisi tekniğinden kaynaklanan güven aralıkları (CI), zaman serisi regresyonu olanlardan muhtemelen daha büyük olacaktır. Bu özelliğin doğru olduğu bilinmektedir. Genel olarak, zaman serisi olmayan bir regresyon kullandığınızda, CI'nız daha küçük olacaktır, ancak bunun yanlış olduğunu çünkü varsayımlarını ihlal ettiğinizden. Tek yapmak istediğiniz küçük CI'leri içeren bir grafik sunmaksa bunları tamamlayın veya CI'leri tamamen atlayın, ancak uygun CI'leri istiyorsanız uygun teknikleri kullanın.

Borsa, doğası gereği tahmin etmek zor. Diğer zaman serileri daha tahmin edilebilirdir. Seçtiğiniz makine öğrenme tekniğinizi borsada kullanmayı deneyin ve daha fazla başarıya ulaşacağınızdan şüpheliyim.

Aynı şekilde sürecimi daha iyi anlamak için nasıl kullanabilirim? Elbette, ACF'yi çizip "aha! Bazı bağımlılıklar var!" Diyebilirim, peki ya sonra? Amaç ne? Elbette bağımlılık var, bu yüzden başlamak için zaman serisi analizi yapıyorsunuz. Bağımlılık olduğunu zaten biliyordun. Ama onu ne için kullanacaksın?

Tahmin etmek. Mevsimsellik görmek için. Verilerin farklı mevsimlerdeki değişkenliği hakkında fikir sahibi olmak. Devlet Uzay yöntemleri gibi, eski okul ARIMA'sından daha güçlü zaman serisi teknikleri olduğunu söylemeye gerek yok. ARIMA, zaman serilerinin modellenmesinde en iyi teknik değildir. (Aslında, seçili istatistiksel yazılımınızdaki ARIMA prosedürü muhtemelen başlık altında bir Durum Alanı gösterimi kullanıyordur.)


5

Redhq'lerin anomali saptama cevabına biraz renk eklemek için işte, satış ve trafik akışı gibi operasyonel ölçümler için anomali saptama modelleri kurdum. Her şey beklendiği gibi çalışıyorsa hangi satışların olması gerektiğini anlamak için zaman serileri analizini yaparız ve ardından web sitesinin kırılıp kırılmadığını görmek için bunları gözlenen değerlerle karşılaştırırız. Bu önemli çünkü her an site kapalıyken çok para kaybediyoruz.

Kullanabileceğiniz farklı yöntemler vardır ve farklı yöntemler birçok durumda farklı şeyler başarmaya çalışır. Örneğin, satış anomalisi tespiti için kullandığım ana istatistiksel yönteme "STL" denir (loess kullanarak mevsimsel eğilim ayrıştırması). Bu düzenli mevsimsellik, eğilim ve rastgele gürültüyü ayırır. Bunu hem günlük hem de haftalık mevsimsellikleri belirlemek için kullanıyoruz. Daha sonra gürültüyü atıyoruz ve beklenen satışları tahmin etmek için trend / mevsimselliklerini birleştiriyoruz. Bu nedenle, bizim durumumuzda satışların günün saatine ve haftanın saatine göre nasıl değiştiğini anlamak ve tahminlerdeki rastgele gürültüyü dışlamak için kullanıyoruz.


Herhangi bir anormallik olmadığını düşünen zaman serisi modelleri oluşturduğunuz ve bu nedenle hem SARIMA primlerinin hem de keşfedilmeyi bekleyenlerin aynı anda tanımlanmasına izin veren model tanımlama stratejilerinin aksine, sağlam olmayabilir. , mevsimsel bakliyat, yerel zaman eğilimleri)
IrishStat

STL algo sağlam bir bayrağa sahiptir (yumuşatma döngüsünün yineleme sayısını kontrol eder). Zaten zaman serimiz için çok iyi çalışıyor.
Willie Wheeler

Keşfedilmeyi bekleyen deterministik bir yapı varsa, yineleme sayısı model biçimindeki önyargıyla ilgilenmez.
IrishStat

3

Diğerleri tarafından verilen mükemmel cevaplara ek olarak, zaman serisi analizlerinin elektrik mühendisliğinde nasıl kullanıldığı hakkında yorum yapmak istiyorum.

Elektrik mühendisliğinin büyük bir kısmı, bilgi iletmek için modüle voltaj ve akımlardan ya da fiziksel bir sinyali (ses dalgası gibi) bir bilgisayarın karar vermesi beklenen elektriksel bir forma dönüştürmek için sensörler kullanmaktan oluşur. Sayısal - dijital (A / D) dönüştürücü bu sinyalleri eşit aralıklı (zaman içinde) ayrık örneklere veya bir zaman serisine dönüştürür! Zaman serisi analiz yöntemleri, neredeyse tüm modern sinyal işleme algoritmalarının temelidir.

Örneğin, konuşma işleme, bir ses dalgasını bir A / D tarafından örneklenen bir elektrik voltajına dönüştürmek için bir mikrofon kullanmaktan sonra bir sinyalin zaman serisi modelinin yaratılmasından ibarettir. Örneğin, cep telefonlarındaki doğrusal kestirici kodlayıcılar (LPC) , konuşulan kelimelerin bir ARMA modelini yaratır ve elde edilen veri örnekleri yerine, model katsayılarını (önceden tanımlanmış bir sözlükten bir uyarma sinyalini temsil eden bir endeks ile birlikte) iletir. Veri sıkıştırma.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.