基于LSTM-ARIMA 组合模型的区域短期用电量预测

2021-10-26 06:32何家峰蔡高琰
网络安全与数据管理 2021年10期
关键词:用电量用电预测

刘 侃 ,何家峰 ,蔡高琰

(1.广东工业大学 信息工程学院,广东 广州 510006;2.广东浩迪创新科技有限公司,广东 佛山 528200)

0 引言

电力能源是与人们日常生活息息相关的,然而由于电力能源的调度存在延时性,导致电力资源没有进行合理分配,电力浪费与短缺的两极化现象依然存在。 针对这些问题,发展改革委[1]在2016 年提出电力企业应总结2016 年电力生产运行情况,分析预测2017 年电力供需形势,提出政策建议,形成分析预测报告以达到合理调配电力资源,提高电力资源的利用率的目的。 国家在《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》[2]中提出建设智慧能源系统,优化电力生产和输送通道布局,提升新能源消纳和存储能力,因此基于历史的用电量数据对未来的用电趋势进行预测是十分必要的。区域用电量预测是指通过该地区产生的历史用电数据时间序列,预测未来该地区的用电量,据相关研究表明,预测误差增加,将会提高电力预测的成本,因此提升用电量预测的精确度是十分必要的。

目前应用于电量预测的方法主要分为三类,第一类为时间序列分析方法,包括指数平滑法[3]、加权法[4]等,这类方法可以有效地处理线性数据,但是对于非线性数据的拟合效果不佳。 第二类为智能算法,智能算法可分为机器学习方法与深度学习方法,其中应用于预测的机器学习方法有支持向量机算法[5]、随机森林算法[6]、集成算法[7];深度学习方法有 BP 神经网络[8]、人工神经网络[9-11]、卷积神经网络[12-13]、循环神经网络[14-15]和递归神经网络[16-19]等。 智能算法能较好地处理非线性问题,但是在计算速度与鲁棒性方面仍需进一步改进。 第三类为组合方法,组合方法是指将第一类与第二类方法结合的新方法,组合方法结合了两类方法的优点,能较好处理非线性问题又能同时提高智能算法的计算速度与鲁棒性。

LSTM 是一种循环神经网络(RNN)的改进方法,它有效避免了神经网络在运算过程中出现的梯度消失与爆炸问题。LSTM 对于非线性、非平稳的用电数据具有良好的拟合能力。ARIMA 是传统的时间序列模型,广泛地应用于各种预测中,取得了较好的效果。 鉴于 LSTM 与ARIMA 在用电量预测领域展现出较强的预测能力,本文提出一种基于LSTM-ARIMA的区域用电量组合预测模型。 LSTM-ARIMA 组合模型较LSTM 模型的 RMSE、MAPE 分别提高了 16.17%、7.56%,比 ARIMA 模型的 RMSE、MAPE 分别提高了67.13%、44.19%。

1 模型简介

1.1 ARIMA 模型

ARIMA 模型由三个部分组成:自回归模型AR(Auto Regression)、差分模型 I(Integrated)以及移动平均模型 MA(Moving Average)。 ARIMA 模型是描述时间序列数据随机过程的一个重要模型,差分模型可以去除数据中趋势向,使得序列形成平稳状态以便于后续分析,自回归模型用于拟合平稳序列的数据,移动平均模型可以构建出系统噪声的回归方程。 输入时间序列数据集后,先进行单位根检验(Augmented Dickey-Fuller,ADF)以判别序列平稳性,如果平稳就进行下一步建模,不平稳则通过差分运算至平稳后再进行建模分析, 通过序列的自相关函数(Autocorrelation Function,ACF)与偏自相关函数(Partial Autocorrelation Function,PACF)构建 ARIMA(p,d,q)模 型 ,通过德宾瓦特逊检验(Durbin Watson,DW)检验残差是否满足正态分布, 再通过赤池信息准则 (AIC)与贝叶斯信息量(BIC)值确定最优模型,ARIMA 模型的数学表达式如下所示:

其中,▽代表差分,d 代表差分次数,Φ(B)为 p 阶自回归系数多项式,Θ(B)为q 阶移动平均系数多项式,L 为该模型下的最大似然数,n 是数据数量大小,k是模型变量的个数。

1.2 LSTM 模型

LSTM 模型又称长短期记忆网络,它具有将上一个状态的信息进行添加或者删除并传送给下一个状态的能力,其网络结构图如图1 所示,数学表达式如式(7)~式(14)所示。 LSTM 模型由遗忘门、记忆门与输出门组成。 遗忘门用于减少冗余信息,加快数据处理速度,σ 为 sigmoid 函数,遗忘门的输入信号 为 ht-1、xt, 其 中 ,ht-1为 LSTM 上 一 期 的 输 出 信号,xt为当期的输入值。 Ct-1为上一期 LSTM 的状态信号,bf是阈值矩阵,wf为权重矩阵,通过 sigmoid 函数后若输出为 0,表示删除信息。ft与 Ct-1行列值相同,ft与 Ct-1相乘是对于 Ct-1状态信息的重新整合。 记忆门的作用是确定信息是否保留,与遗忘门不同的是增加了tanh 网络层,它的作用是将数值规范到-1~1,通过 sigmoid 函数后若输出为 1,表示保存信息,记忆门将信息与遗忘门的信息结合作为下一个状态值 Ct。 输出门的作用是输出当前状态值Ct、隐藏状态 ht。

图1 LSTM 网络结构图

2 LSTM-ARIMA 组合预测方法

2.1 LSTM-ARIMA 组合预测模型

LSTM-ARIMA 预测模型的预测流程如图2 所示,具体如下:

图2 LSTM-ARIMA 组合模型预测流程图

(1)对用电数据进行数据预处理,将用电数据集的前82 个数据作为训练集,后 20 个数据作为测试集数据。 (2)用电量数据通过LSTM 模型进行预测分析得到预测模型f1,残差部分用ARIMA 模型进行预测分析得到预测模型f2,将两部分相加得到预测模型f。(3)将得到的组合预测模型 f 对测试集预测,得到预测结果并进行模型精度判别分析。

2.2 模型精度判别

用电量预测值为y^i,用电量真实值为 yi,将分析结果进行对比。 模型预测的评判标准分为平均绝对百分比误差(MAPE)、均方根误差(RMSE)。 平均绝对百分比误差是数据集的真实值与预测值之间绝对值之和的平均值,反映的是模型的偏差水平,百分比值越小,模型预测越准确。 均方根误差反映的是数据点的离散程度,均方根值越小,证明数据点越密集,预测结果越稳定。 本文基于这两个标准对模型的准确度进行评判。

3 实验验证

3.1 实验数据与平台

数据集是广东省佛山市某工业园区自2018 年1 月 4 日至 2019 年 12 月 31 日的周度用电量数据集,数据样本一共102 条数据,每个数据样本是一周7 天的用电量之和,用电量数据曲线如图3 所示。实验平台为装有NVIDIA Tesla P100 GPU 的服务器,本文的编程由 Python 实现,LSTM 模型采用的是Keras 框架,ARIMA 模型采用的是 Py-ARIMA 框架。

图3 用电量曲线图

3.2 数据描述及分析

某工业园区的入驻企业共122 家,其中以从事信息技术服务以及产品深加工企业为主,大部分企业的员工上班时间为8 小时。 智能电表在电量数据采集中存在无法避免的系统误差,但误差影响控制在极小范围以内,所以认为数据集中的用电量数据是真实可靠的,是可以反映出真实用电规律的。 从图3 两年的周用电数据曲线中可以观察到,2018 年的周用电数据与2019 年的周用电数据的用电规律基本相似,夏季的用电量比其他月份用电量多。

3.3 模型比对及精度分析

将用电数据集中前82 个数据作为训练数据,预测后 20 个数据。 LSTM 模型设置为双隐层结构,确定输入层为 1,第一个隐含层为 10 层,第二个隐含层为 10 层,输出层为 1 层。 经过试验分析,确定最佳迭代次数为2 000 次。 用残差数据拟合 ARIMA模型,ADF 检测结果为0.032 67,此值小于显著值5%,根据检测标准认为该序列平稳。根据序列的ACF 与PACF 模型确定模型参数 p、q,当 p=2、q=1 时,AIC=-8.236 5,BIC=14.225,根据 AIC 与 BIC 最小原则,认为拟合模型为 ARIMA(2,0,1)。 ARIMA 模型预测曲线如图 4 所示。

图4 ARIMA 模型残差预测曲线

ARIMA、LSTM 和 LSTM-ARIMA 组 合 模 型 对 于用电量序列预测曲线如图5 所示。 可以观察到LSTM 对于用电量序列的用电趋势有很好的预测效果;ARIMA 无法准确地预测到用电量序列的用电规律,预测精度与预测稳定性低,这是由于用电量序列中包含大量的非线性数据影响了ARIMA 模型的预测效果;LSTM-ARIMA 模型在 LSTM 模型的基础上增强了预测精度与预测稳定性。

图5 模型预测曲线

由表1 可以得到,LSTM-ARIMA 组合模型较LSTM模型的RMSE、MAPE 提高了 16.17%、7.56%,比 ARIMA模型的 RMSE、MAPE 提高了 67.13%、44.19%。

表1 模型预测精度与稳定度

4 结论

LSTM 与ARIMA 等机器学习与时间序列模型已经广泛地应用于电力、水利、航天等多个领域的学术研究中。 本文采用LSTM-ARIMA 组合预测模型,选择佛山市某工业园区近两年的周用电数据,通过实验对用电量数据进行分析预测得到以下结论:

(1)本文基于“序列预测+残差修正”思想提出的LSTM 与ARIMA 组合模型,经实验表明组合模型的预测稳定性与预测精度均优于单一模型,因此组合模型相较于单一模型提高了短期用电量预测能力;

(2)本文中ARIMA 模型拟合非线性数据效果不佳;

(3)本文所提出的组合模型将对于区域短期用电量预测有一定的参考意义,也对于电力部门进行优化电力资源配置、减少电力资源浪费具有一定价值。

如何改进组合模型拟合效果提升其预测能力是后续研究内容之一;本模型未将气候因素纳入到考察范围,只考虑了历史用电量因素,后续研究中将气候变化纳入到影响用电量变化的因素之一进行预测分析,也是未来优化模型的一个研究方向。

猜你喜欢
用电量用电预测
02 国家能源局:1~7月全社会用电量同比增长3.4%
01 国家能源局:3月份全社会用电量同比增长3.5%
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
安全用电知识多
国家能源局:3月份全社会用电量同比下降4.2%
对输配电及用电工程的自动化运行的几点思考
为生活用电加“保险”
用电安全要注意