入行时间序列预测必读的4篇论文(附代码)
時間序列預測是一個發展歷史悠久的技術領域,傳統的統計學算法(e.g. ARIMA, ETS, GARCH)以及近年來的機器學習(e.g. 廣義線性模型,xgboost)、深度學習算法(e.g. LSTM,CNN,Transformer) 都可以用于時間序列預測,不同方法各有長處和短處。
傳統的統計學習方法需要結合時序領域特有的統計學分析(e.g. 自相關系數ACF、偏相關系數PACF、平穩性檢驗等),將數據通過差分的方式轉換成平穩序列后,再通過線性回歸的方式建模。傳統統計學算法的長處在于結合了大量的專家對于時間序列的知識,因此不需要大量樣本數據即可構建模型,短處在于需要從業人員對時序相關的統計學有深入的理解,并且當存在非線性特征等復雜情況時,需要進行手工特殊處理,不利于規模化預測。
機器學習、深度學習算法將時序預測問題作為回歸問題處理,通過選擇合適的特征和模型結構,基于訓練集數據構建模型。機器學習、深度學習算法的長處是不需要結合時序領域特有的統計學分析,算法可以從訓練集中總結規律,并且使用模型不是時序領域獨有的,對于數據科學的從業人員更友好,短處是需要基于大量樣本數據才可訓練模型,并且模型通常不具備可解釋性(廣義線性模型除外)。當前商業、工業領域往往存在海量數據,對自動化、準確性的要求比可解性的要求更高。
時間序列預測在供應鏈、金融、工業等眾多領域有著廣泛的應用。與CV、NLP等標準化應用不同,時間序列預測項目與業務場景結合緊密。預測對象、顆粒度、前置期、準確性指標等對于構建模型最關鍵的因素往往并非一目了然,只有通過對不同場景的需求進行深入分析才能找到合適解決方案。因此從業者不但需要掌握各種方法的原理,還需要能夠結合業務具體使用場景分析項目的需求,找到合適的算法。這對從業者的能力提出了很高的要求,也是業內時間序列預測資深專家短缺的原因。
接下來推薦幾篇經典論文供大家學習復現。幫你快速梳理時序預測算法的種類的原理。
1、基于歷史數據對未來做出預測
Forecasting at Scale
Deep AR: Probabilistic Forecasting with Autoregressive Recurrent Networks
※推薦理由:
1) Prophet是Facebook開發的時間序列預測軟件包,在業內具有廣泛的應用。《Forecasting at Scale》介紹了Prophet的算法原理。
2)Deep AR…一文提出了一種基于LSTM的時間序列預測算法,適用于高通量時間序列預測。該方法不僅能給出預測結果,還能給出結果的置信區間。本文作者來自亞馬遜算法研究所。論文中的算法DeepAR已經集成在Amazon Sagemaker機器學習平臺,對外提供預估服務的功能。
2、兼顧長短期預測
A Multi-Horizon Quantile Recurrent Forecaster(2018)
※推薦理由:
在時間序列預測的領域中,有很多場景既要對短期的時間進行預測,又要對長期的時間進行預測。通常機器學習、深度學習算法在短期預測上具有優勢,但是在長期預測上表現不佳。本文提出了一種特殊的MLP網絡結果,能夠很好地兼顧短期和長期預測。此外,訓練時間序列預測模型時往往需要通過滑動窗口的形式產生訓練集樣本,使得數據進行了大量復制,占用了大量內存資源。為了解決這一問題,本文提出了叉式訓練(fork-training)方法,在不復制數據的情況下,達到滑動窗相似的訓練效果。本文是亞馬遜算法研究所在時間序列領域的又一力作。
3、多層級預測
Prediction of hierarchical time series using structured regularization and its application to artificial neural networks (2020)
※推薦理由:
在實踐中經常會出現需要在不同層級做預測的情況,比如說預測某個產品的銷量,既需要在較高層級的全國層面做預測,也要在較低層級的省市層面預測。一般上的方法無法保證低層級的預測累加的結果和高層級的結果是一致的,給結果的應用造成了困擾。本論文提出了一種方法,用于解決不同層級預測結果不一致的問題。
上述4篇論文在深度之眼《時間序列預測項目班》中都有系統地講解,其第1篇論文《Forecasting at Scale》的講解業已開源給本公號粉絲,掃下方二維碼即可獲取。
——?講解大綱?——
1、時間序列概述
-
什么是時間序列?
-
什么是時間序列預測?
-
時間序列預測的范式
-
時間序列預測的專有名詞
-
時間序列的評估
-
時間序列與機器學習
2、Prophet算法
-
前言
-
Prophet 整體視角
-
模型建模
-
模型訓練
-
模型預測
PS:會講解論文代碼
↑掃碼支付0.1元即可獲取↑
30天內無限次回看
總結
以上是生活随笔為你收集整理的入行时间序列预测必读的4篇论文(附代码)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 机器学习模型融合
- 下一篇: Filebeat日志收集器