【数学建模】《实战数学建模:例题与讲解》第十讲-时间序列预测(含Matlab代码)

2023-12-14 09:49:40

本系列侧重于例题实战与讲解,希望能够在例题中理解相应技巧。文章开头相关基础知识只是进行简单回顾,读者可以搭配课本或其他博客了解相应章节,然后进入本文例题实战,效果更佳。

如果这篇文章对你有帮助,欢迎点赞与收藏~
在这里插入图片描述

基本概念

时间序列预测是一种预测方法,它通过将观察对象按照时间顺序排列,构成一个所谓的“时间序列”。通过分析这些时间序列过去的变化规律,可以推断未来的可能变化、趋势和规律。这种方法实际上是一种回归模型,其基本原理有两个方面:一是承认事物发展的延续性,即通过分析过去时间序列的数据来预测事物的发展趋势;二是考虑到偶然因素的影响所带来的随机性。为了减少随机波动的影响,需要利用历史数据进行统计分析,并对数据进行适当处理以进行趋势预测。

时间序列预测法的优点在于其简单易行,易于掌握,能够充分利用原时间序列的数据,计算速度快,并且对模型参数具有动态确定的能力。此外,精度较高,特别是当采用组合时间序列或将时间序列与其他模型组合时,其效果更佳。然而,这种方法也有其局限性,主要是不能反映事物的内在联系,无法分析两个因素之间的相关关系,更适用于短期而非长期预测。

时间序列预测法在各个领域都有广泛的应用,如在金融市场分析、气象预测、工业生产和库存管理等领域。在实际应用中,时间序列预测通常涉及到多种技术和方法,如移动平均、指数平滑法、季节性调整、自回归移动平均模型(ARMA)、自回归积分滑动平均模型(ARIMA)等。这些技术各有特点,适用于不同类型的数据和不同的预测需求。

移动平均(Moving Average, MA):

特点: 简单、直观。
原理: 根据一定数量的连续过去数据点的平均值来预测未来的值。它有助于平滑时间序列中的短期波动,并突出长期趋势。
适用性: 最适合没有明显趋势和季节性的数据。

指数平滑法(Exponential Smoothing):

特点: 对最近的观测值给予更多的权重。
原理: 这种方法给过去的观测值赋予指数递减的权重,最近的数据点有更大的权重。简单指数平滑适用于没有趋势和季节性的数据,而双重和三重指数平滑法可以处理趋势和季节性。
适用性: 适用于具有或不具有趋势和季节性的数据。

季节性调整(Seasonal Adjustment):

特点: 专注于季节性因素。
原理: 通过消除季节性波动来更清晰地识别趋势。这通常是通过识别并调整那些周期性重复出现的模式来完成的。
适用性: 对于具有明显季节性模式的数据特别有效。

自回归移动平均模型(ARMA):

特点: 结合自回归(AR)和移动平均(MA)。
原理: AR部分利用过去值之间的关系,而MA部分则建模时间序列的误差项。这种模型假设时间序列是平稳的(即均值、方差和协方差不随时间变化)。
适用性: 适合处理平稳的时间序列。

自回归积分滑动平均模型(ARIMA):

特点: ARMA模型的扩展,可以处理非平稳数据。
原理: 结合差分(使非平稳数据平稳)的概念与ARMA模型。它通过一定次数的差分,将非平稳时间序列转化为平稳时间序列。
适用性: 可以处理非平稳时间序列,适合广泛类型的时间序列数据。

习题8.4

1. 题目要求

image-20230508100807848

在这里插入图片描述

2.解题过程

解:

原始数据序列: x t {x_t} xt? ,一阶差分变换后的序列为: y t y_t yt?

(1)通过下文中程序的运行,我们可以从运行结果中得到
y t = 1.253 y t ? 1 ? 0.3522 y t ? 2 + ε t + 0.5022 ε t ? 1 y_t = 1.253y_{t-1} - 0.3522y_{t-2} + \varepsilon_{t} + 0.5022 \varepsilon_{t-1} yt?=1.253yt?1??0.3522yt?2?+εt?+0.5022εt?1?
(2)根据下文的运算结果得到未来10年的预测值分别为::
6419.44740352031 6668.77039934881 6861.19145947359 7014.42501092823 7138.60914121919 7240.20495400936 7323.73568451267 7392.59199500092 7449.42827658915 7496.37548147182 6419.44740352031 \\ 6668.77039934881\\ 6861.19145947359\\ 7014.42501092823\\ 7138.60914121919\\ 7240.20495400936\\ 7323.73568451267\\ 7392.59199500092\\ 7449.42827658915\\ 7496.37548147182 6419.447403520316668.770399348816861.191459473597014.425010928237138.609141219197240.204954009367323.735684512677392.591995000927449.428276589157496.37548147182

3.程序

求解的MATLAB程序如下:

clc, clear
format long g

% 定义列向量 xt,其中包含了原始数据的时间序列。
xt = [119, 142, 144, 150, 165, 168, 200, ...
    216, 218, 185, 173, 181, 208, 240, 254, ...
    235, 222, 243, 275, 288, 292, 309, 310, 327, ...
    316, 339, 379, 417, 460, 489, 525, 580, 682, ...
    853, 956, 1104, 1355, 1512, 1634, 1879, ...
    2287, 2939, 3923, 4854, 5576, 6079]';

% 进行一阶差分变换,即计算 xt 中相邻元素之间的差值,生成一个新的列向量 yt
% 一阶差分变换可以将非平稳时间序列转换为平稳时间序列。
yt = diff(xt);

% 拟合arma模型
m = armax(yt, [2, 1])
% armax函数接受两个参数:时间序列数据和模型阶数[p,q],其中p是自回归项的数量,q是滞后误差项的数量

% 计算yt的10期预测值
ythat = forecast(m, yt, 10);

% 计算原始数据的10期预测值
% 这一行代码用于计算原始数据 xt 的预测值
% xt(end)表示原始数据的最后一个观测值,cumsum(ythat)表示将ythat中每个元素累加得到的新的列向量
xthat = xt(end) + cumsum(ythat)

4.结果

image-20230508103746261

(1)我们可以从运行结果中得到
y t = 1.253 y t ? 1 ? 0.3522 y t ? 2 + ε t + 0.5022 ε t ? 1 y_t = 1.253y_{t-1} - 0.3522y_{t-2} + \varepsilon_{t} + 0.5022 \varepsilon_{t-1} yt?=1.253yt?1??0.3522yt?2?+εt?+0.5022εt?1?
(2)未来10年的预测值分别为::
6419.44740352031 6668.77039934881 6861.19145947359 7014.42501092823 7138.60914121919 7240.20495400936 7323.73568451267 7392.59199500092 7449.42827658915 7496.37548147182 6419.44740352031 \\ 6668.77039934881\\ 6861.19145947359\\ 7014.42501092823\\ 7138.60914121919\\ 7240.20495400936\\ 7323.73568451267\\ 7392.59199500092\\ 7449.42827658915\\ 7496.37548147182 6419.447403520316668.770399348816861.191459473597014.425010928237138.609141219197240.204954009367323.735684512677392.591995000927449.428276589157496.37548147182

习题8.5

1. 题目要求

image-20230508105627789

2.解题过程

解:

(1)序列时序图

记原始序列为 { x t {x_t} xt?} ,序列时序图如下图所示,时序图显示该序列大致具有12个周期变化,周期的长度为9或10年,下面使用周期 T=10行计算。

image-20230508112846705

(2)差分平稳

对原序列做10步差分,消除季节趋势,得到序列 { y t y_t yt?} ,其中, y t = x t + 10 ? x t y_t = x_{t+10}-x_t yt?=xt+10??xt?,差分后序列图如下图所示。时序图显示差分后序列基本平稳了。

image-20230508112909169

(3)模型拟合

根据差分后序列的自相关和偏自相关的性质,尝试拟合ARMA模型,拟合的ARMA (1,10) 模型较理想,并且通过了白噪声检验,说明低阶的ARMA模型不适合拟合这个序列。

image-20230508112931543 image-20230508112945533

(4)

求预测值。求得下两个年度的预测值为4310和3674。

3.程序

求解的MATLAB程序如下:

clc, clear
format long g

a = [269, 321, 585, 871, 1475, 2821, 3928, 5943, 4950, ...
    2577, 523, 98, 184, 279, 409, 2285, 2685, 3409, 1824, ...
    409, 151, 45, 68, 213, 546, 1033, 2129, 2536, 957, ...
    361, 377, 225, 360, 731, 1638, 2725, 2871, 2119, 684, ...
    299, 236, 245, 552, 1623, 3311, 6721, 4254, 687, 255, ...
    473, 358, 784, 1594, 1676, 2251, 1426, 756, 299, 201, ...
    229, 469, 736, 2042, 2811, 4431, 2511, 389, 73, 39, 49, ...
    59, 188, 377, 1292, 4031, 3495, 537, 105, 153, 387, 758, ...
    1307, 3465, 6991, 6313, 3794, 1836, 345, 382, 808, ...
    1388, 2713, 3800, 309, 2985, 3790, 674, 71, 80, 108, ...
    229, 399, 1132, 2432, 3575, 2935, 1537, 529, 485, 662, ...
    1000, 1520, 2657, 3396]';

n = length(a);
% 用MATLAB的plot函数绘制a的图像
plot(a, '.-')

% 使用for循环遍历从第11个到最后一个数据元素,并对前10个数据元素和当前数据元素进行差分计算得到一个新的列向量b
for i = 11:n
    b(i-10) = a(i) - a(i-10); % 进行季节差分变换
end
b = b';
figure, plot(b, '.-')

% 计算b的自相关性和偏自相关性
figure, subplot(121), autocorr(b)
subplot(122), parcorr(b)
% 对b序列进行模型拟合
cs = armax(b, [1, 10]); % 拟合模型
figure, myres = resid(cs, b); % 计算残差向量并画出残差的自相关函数图
% 拟合模型的残差向量myres
[h, p, st] = lbqtest(myres.outputdata, 'lags', [6, 12, 18]); % 进行LBQ检验
% 注意,上面outputdata一定要加上,不然会报错

bhat = forecast(cs, b, 2); % 计算b的2期预测值
ahat = a(end-9:end-8) + bhat % 求原始序列的2期预测值

4.结果

image-20230508191604734

后两个年度的预测值为4310和3674

习题8.6

1. 题目要求

image-20230508112211059

2.解题过程

解:

(1)对所给时间序列建模

首先对此序列进行观察分析。下图为数据曲线图:

image-20230508201929847

可以看出具有指数上升趋势,因此,对确定性部分先拟合一个指数增长模型,即
X t = μ t + Y t , μ t = R 1 e r 1 t X_t = \mu_t + Y_t, \mu_t = R_1e^{r_1t} Xt?=μt?+Yt?,μt?=R1?er1?t
这里各季节依次编号为 t = 1 , 2 , … , 100 t = 1,2,\dots,100 t=1,2,,100

然后确定性趋势的拟合。为了能用线性最小二乘法估计参数 R 1 R_1 R1? r 1 r_1 r1?, μ t = R 1 e r 1 t \mu_t = R_1 e^{r_1t} μt?=R1?er1?t两边取对数,得:
ln ? μ t = ln ? R 1 + r 1 t \ln \mu_t = \ln R_1 + r_1t lnμt?=lnR1?+r1?t
利用观测数据求得 R ^ 1 = 12.6385 , r ^ 1 \hat{R}_1 = 12.6385,\hat{r}_1 R^1?=12.6385,r^1? = 0.0162。剩余平方和为1683.5371。剩余序列 Y t Y_t Yt?如下图所示,可以认为是平稳的:

image-20230508202004867

对剩余序列拟合ARMA模型。 Y t Y_t Yt?自相关与偏自相关如下图所示:

image-20230508202110029 image-20230508202121810

可初步断定 Y t Y_t Yt?的适应模型为AR模型,逐增加AR模型阶数进行拟合,其残差方差图如下图所示:

image-20230508202156860

因此,合适的模型为AR (2),即
Y t = φ 1 Y t ? 1 + φ 2 Y t ? 2 + a t Y_t = \varphi_1Y_{t-1}+\varphi_2Y_{t-2} + a_t Yt?=φ1?Yt?1?+φ2?Yt?2?+at?
参数估计为 φ ^ 1 = 0.5451 , φ ^ 2 = 0.2478 \hat{\varphi}_1 = 0.5451,\hat{\varphi}_2 = 0.2478 φ^?1?=0.5451,φ^?2?=0.2478

建立组合模型。最后要以已估计出来的 R 1 , r 1 , φ 1 , φ 2 R_1,r_1,\varphi_1,\varphi_2 R1?,r1?,φ1?,φ2?的值为初始值用非线性最小二乘法对模型参数进行整体估计,模型整体可写为
X t = μ t + Y t = R 1 e r 1 t + φ 1 ( X t ? 1 ? R 1 e r 1 ( t ? 1 ) ) + φ 2 ( X t ? 2 ) ? R 1 e r 1 ( t ? 2 ) + a t X_t = \mu_t + Y_t = R_1e^{r_1t} + \varphi_1(X_{t-1}-R_1e^{r_1(t-1)} )+\varphi_2(X_{t-2})-R_1e^{r_1(t-2)}+a_t Xt?=μt?+Yt?=R1?er1?t+φ1?(Xt?1??R1?er1?(t?1))+φ2?(Xt?2?)?R1?er1?(t?2)+at?
最终的参数整体估计为
R ^ 1 = 12.1089 , r ^ 1 = 0.017 , φ ^ 1 = 0.517 , φ ^ 2 = 0.2397 \hat{R}_1=12.1089,\hat{r}_1=0.017,\hat{\varphi}_1 = 0.517, \hat{\varphi}_2 = 0.2397 R^1?=12.1089,r^1?=0.017,φ^?1?=0.517,φ^?2?=0.2397
残差平方和为739.4402。

(2)

对所给的时间序列进行两年(8个季度)的预报。用所建的模型以1970年第4几度即t = 100为原点进行预测,结果如下表所示。

l012345678
t+ltt+1t+2t+3t+4t+5t+6t+7t+8
X ^ t ( l ) \hat{X}_t(l) X^t?(l)62.165.829866.838468.56270.008371.487972.923874.350775.768

3.程序

(1)

求解的MATLAB程序如下:

clc, clear

% 将数据按照每年的每个季度依次写入
a = [7.5, 8.9, 11.1, 13.4, 15.5, 15.7, 15.6, 16.7, 18, 17.4, 17.9, ...
    18.8, 17.6, 17, 16.1, 15.7, 15.9, 17.9, 20.3, 20.4, 20.2, 20.5, ...
    20.9, 20.9, 21.1, 21.4, 18.2, 20.1, 21.4, 21.3, 21.9, 21.3, ...
    20.4, 20.4, 20.7, 20.7, 20.9, 23, 24.9, 26.5, 25.6, 26.1, 27, ...
    27.2, 28.1, 28, 29.1, 28.3, 25.7, 24.5, 24.4, 25.5, 27, 28.7, ...
    29.1, 29, 29.6, 31.2, 30.6, 29.8, 27.6, 27.7, 29, 30.3, 31, 32.1, ...
    33.5, 33.2, 33.2, 33.8, 35.5, 36.8, 37.9, 39, 41, 41.6, 43.7, ...
    44.4, 46.6, 48.3, 50.2, 52.1, 54, 56, 53.9, 55.6, 55.4, 56.2, ...
    57.9, 57.3, 58.8, 60.4, 63.1, 83.5, 64.8, 65.7, 64.8, 65.6, 67.2, 62.1]';

n = length(a);
t0 = [46:1 / 4:71 - 1 / 4];
t = [1:100]';
xishu = [ones(n, 1), t];
cs = xishu \ log(a)
cs(1) = exp(cs(1))
ahat = cs(1) * exp(cs(2)*t);
cha = a - ahat
res = sum(cha.^2)
subplot(121), plot(t0, a, '*-')
subplot(122), plot(t0, cha, '.-')
figure, subplot(121), autocorr(cha)
subplot(122), parcorr(cha)
for i = 1:10
    cs2 = ar(cha, i);
    cha2 = resid(cs2, cha);
    myvar(i) = sum(cha2.outputdata.^2) / (100 - i);
end
figure, plot(myvar, '*-')

(2)

求解的MATLAB程序如下:

clc, clear

% 定义一个函数句柄 xt,它的输入参数是一个向量 cs 和一个矩阵 x。 
% x 矩阵的第一列是 a 向量的第二个元素到倒数第二个元素,第二列是 a 向量的第一个元素到倒数第三个元素,
% 第三列是一个列向量,它包含数字3到100
% 这些数字将用于预测未来的季度。
% 函数的输出是一个向量,表示用于预测季度的预测值。
xt = @(cs, x)cs(1) * (exp(cs(2)*x(:, 3)) - cs(3) * exp(cs(2)*(x(:, 3) - 1)) - ...
    cs(4) * exp(cs(2)*(x(:, 3) - 2))) + cs(3) * x(:, 1) + cs(4) * x(:, 2);
cs0 = [12.6385, 0.0162, 0.5451, 0.2478]';

% 将数据按照每年的每个季度依次写入
a = [7.5, 8.9, 11.1, 13.4, 15.5, 15.7, 15.6, 16.7, 18, 17.4, 17.9, ...
    18.8, 17.6, 17, 16.1, 15.7, 15.9, 17.9, 20.3, 20.4, 20.2, 20.5, ...
    20.9, 20.9, 21.1, 21.4, 18.2, 20.1, 21.4, 21.3, 21.9, 21.3, ...
    20.4, 20.4, 20.7, 20.7, 20.9, 23, 24.9, 26.5, 25.6, 26.1, 27, ...
    27.2, 28.1, 28, 29.1, 28.3, 25.7, 24.5, 24.4, 25.5, 27, 28.7, ...
    29.1, 29, 29.6, 31.2, 30.6, 29.8, 27.6, 27.7, 29, 30.3, 31, 32.1, ...
    33.5, 33.2, 33.2, 33.8, 35.5, 36.8, 37.9, 39, 41, 41.6, 43.7, ...
    44.4, 46.6, 48.3, 50.2, 52.1, 54, 56, 53.9, 55.6, 55.4, 56.2, ...
    57.9, 57.3, 58.8, 60.4, 63.1, 83.5, 64.8, 65.7, 64.8, 65.6, 67.2, 62.1]';

% 创建一个矩阵 x,包含3列,用于作为函数 xt 的输入参数
% 第一列是 a 向量的第二个元素到倒数第二个元素,第二列是 a 向量的第一个元素到倒数第三个元素,
% 第三列是一个列向量,它包含数字3到100,这些数字将用于预测未来的季度
x = [a(2:end-1), a(1:end-2), [3:100]'];
cs = lsqcurvefit(xt, cs0, x, a(3:end))
res = a(3:end) - xt(cs, x);
Q = sum(res.^2)
autocorr(res)
xhat = a;

for j = 101:108
    xhat(j) = cs(1) * (exp(cs(2)*j) - cs(3) * exp(cs(2)*(j - 1)) - ...
        cs(4) * exp(cs(2)*(j - 2))) + cs(3) * xhat(j-1) + cs(4) * xhat(j-2);
end

xhat101_108 = xhat(101:108)

4.结果

(1)结果见上文解题过程

(2)

image-20230508203724540

l012345678
t+ltt+1t+2t+3t+4t+5t+6t+7t+8
X ^ t ( l ) \hat{X}_t(l) X^t?(l)62.165.829866.838468.56270.008371.487972.923874.350775.768

如果这篇文章对你有帮助,欢迎点赞与收藏~

文章来源:https://blog.csdn.net/zhushatong/article/details/134905452
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。