1- forecasting at scale论文阅读

2024-01-07 21:29:47

1. 什么是时间序列

按时间先后顺序出现的有序序列
在这里插入图片描述

2. 什么是时间序列预测

在这里插入图片描述

  • 点预测:预测未来的某一个时间点,它的值到底是多少,例如明天的收盘股价、最高温度等。
  • 区间预测:明天的温度范围,例如-8~4°,落在这个范围的概率是多少

在这里插入图片描述
时间序列预测,不仅可预测,还要可定量预测。例如股票,你除了告诉我明天股票会涨,还要告诉我明天能涨多少。本博客介绍内容为定量预测

时间序列预测的前提:
在这里插入图片描述

  • 预测不会影响试图预测的结果:例如你预测股票明天涨幅10%,结果很多人听说该消息之后,没等涨到10%就开始抛售,导致股票跌了。
  • 过去的一些模式会在未来延续下去:过去的一些模式在未来一定会延续下去,我们一定是由于历史上出现了这样的时间序列趋势,所以我们才认为它未来有可能出现类似的趋势。例如2019年年底出现了新冠肺炎,导致2020年初每股有大通盘,这是黑天鹅事件。2020年一整年经济不好,对今天有很大影响。那如果想通过2019年以前的数据来预测2020年经济会不会出现崩盘,显然是不可能的。

3. 时间序列预测的范式

两个公式就是两个范式

  • y t y_t yt?是观察变量,例如股票价格,工场的销量等。要通过历史的销售量 y t ? 1 y_{t-1} yt?1? y t ? 2 y_{t-2} yt?2?等来预测未来的销售量。 ? \epsilon ?表示误差。
  • 第二个范式, x t x_t xt?称之为影响观察值的变量,又称为外部变量。
    在这里插入图片描述
    上式(1)和(2)为基本范式,在此基础上可以衍生出各种各样的范式,如下举例:
    在这里插入图片描述

4. 时间序列的专有名词介绍

理解专有名词,提高学习时间序列、看论文的效率。

  • 观察值: y t y_t yt?
  • 外部变量: x t x_t xt?,可能随着时间变化,也可能不随时间变换。
    在这里插入图片描述

5. 时间序列评估

无论哪种预测,都要对预测效果进行评估;通过评估,才能对模型进行优化和迭代。
不能做交叉验证;

  • back test:也叫回测,意思是我用前面一段时间的数据做训练,后面一段时间的数据来做预测,这样就可以保证两边数据是没有交集的。不能出现训练数据中用到了未来的数据。
  • data leak:用2021和2023的数据做训练,去评估2022,也就是用未来的数据做训练,去预测过去,就是data leak。
    在这里插入图片描述
    14:30

文章来源:https://blog.csdn.net/weixin_46713695/article/details/135394144
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。