Times serisi analizi mi, makine öğrenmesi mi?


Yanıtlar:


9

Tipik makine öğrenme yöntemleri, verilerinizin bağımsız ve aynı şekilde dağıtıldığını varsayar; bu, zaman serisi verileri için geçerli değildir. Bu nedenle, doğruluk açısından zaman serisi tekniklerine kıyasla dezavantajlıdır. Bunun örnekleri için, önceki sorulara bakın Makine öğrenimi ve Rastgele orman için zaman serilerinin sıralanması aşırı uydurmadır .


Cevabınız için teşekkürler. Daha da önemlisi, makine öğreniminin verilerdeki ilişkileri bulmakla daha çok ilgilendiği görülürken, zaman serisi analizi verilerin nedenlerini - yani stokastik faktörlerin onu nasıl etkilediğini doğru bir şekilde tanımlamakla daha ilgilidir. Buna katılıyor musun?
Nagy

4
Hayır, bu özeti kabul etmem.
Tom Minka

4

Francis Diebold kısa süre önce blogunda "ML and Metrics VI: ML ve TS Ekonometri Arasındaki Önemli Bir Fark" yayınladı. Kısaltılmış bir versiyonunu sunuyorum, bu yüzden tüm kredi ona gidiyor. (Kalın harflerle vurgu benimdir.)

[S] makine öğrenimi (ML) ve zaman serisi ekonometrisinin (TS) birçok ortak noktası vardır. Ancak ilginç bir fark da var: ML'nin koşullu ortalama doğrusalsızlığın esnek parametrik olmayan modellemesine verdiği vurgu TS'de büyük bir rol oynamıyor. <...>

[T] burada, çoğu ekonomik zaman serisinin kovaryans durağan (eğilimsiz, mevsimsellikten arındırılmış) dinamiklerindeki koşullu-ortalama önemsizliğin çok az kanıtı var. <...> Gerçekten de (en azından bazı) ekonomik zaman serileri için defalarca önemli olarak ortaya çıkan koşullu ortalama doğrusalsızlığın sadece bir türünü düşünebilirim: Hamilton tarzı Markov anahtarlama dinamikleri.

[Elbette odada doğrusal olmayan bir fil var: Engle tarzı GARCH tipi dinamikler. Finansal ekonometride ve bazen de makro ekonometride çok önemlidirler, ancak koşullu araçlarla değil koşullu varyanslarla ilgilidirler.]

Dolayısıyla, TS'de temel olarak sadece iki önemli doğrusal olmayan model vardır ve bunlardan sadece biri koşullu ortalama dinamiklerden bahseder. Ve en önemlisi, ikisi de çok sıkı parametrik, ekonomik ve finansal verilerin özel özelliklerine çok yakın.

Sonuç olarak:

ML, lineer olmayan koşullu ortalama fonksiyonların oldukça esnek parametrik olmayan bir şekilde yaklaşmasını vurgular. Bu TS'de iki kat gereksiz görünüyor: Endişelenecek çok fazla koşullu-ortalama doğrusallık yok ve zaman zaman, genellikle yüksek derecede uzmanlaşmış (sıkı parametrik) modaya en yakın olan oldukça uzmanlaşmış bir doğaya sahip. .

Orijinal yazının tamamını burada okumanızı tavsiye ederim .


+1. Bu yanıta çok katılıyorum. Tipik ML yöntemleri parametrik olmayan modelleme ile karakterize edilir ve ARMA modelleri "sıkı parametrik" iken çok rahat varsayımlara sahiptir.
Digio

2

@Tom Minka'nın işaret ettiği gibi, çoğu ML tekniği iid girişlerini üstlenir. Yine de birkaç çözüm var:

  1. Sistemdeki 'Bellek' içindeki geçmiş zaman serisi örneklerinin tümü tek bir özellik vektörü olarak kullanılabilir, yani: x = [x (t-1), x (t-2), ... x (tM)]. Bununla birlikte, bunun 2 sorunu vardır: 1) binning'e bağlı olarak, büyük bir özellik vektörüne sahip olabilirsiniz 2- bazı yöntemler özellik vektörü içindeki özelliklerin bağımsız olmasını gerektirir, burada durum böyle değildir.

  2. Bu tür zaman serisi verileri için özel olarak tasarlanmış birçok ML tekniği vardır, örneğin, nöbet tespiti, konuşma işleme, vb. İçin çok başarılı bir şekilde kullanılan Gizli Markov Modelleri ...

  3. Son olarak, benim yaklaşımım, bir dinamik regresyon problemini (zaman unsuruna sahip olan) statik bir probleme dönüştürmek için 'özellik çıkarma' tekniklerini kullanmaktır. Örneğin, Ana Dinamikler Modu (PDM) yaklaşımı, geçmiş geçmiş özellik vektörünü ([x (t-1), x (t-2), ... x (tM)])) statik olanla ([v ( 1), v (2), .. v (L)]) geçmişi sisteme özgü bir doğrusal filtre bankası (PDM'ler) ile birleştirerek, bkz. Marmarelis, 2004 kitabı veya Marmarelis, Vasilis Z. "Doğrusal olmayan fizyolojik sistemler için modelleme metodolojisi ." Yıllık biyomedikal mühendisliği 25.2 (1997): 239-251 ...

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.