张 扬
(国网江西省电力有限公司南昌供电公司,南昌 330069)
电力负荷的供应稳定是维持社会正常运转的基本条件,而电力负荷预测是电力系统规划的重要组成部分[1]。在电力企业中,保持与用电客户的供需平衡十分重要,所以有必要做好供电决策和规划。在大电量生产情况下,电量存储比较难,电力供应过多,会造成不必要的能源浪费;而电力供应不足则会给客户和供应商造成经济损失。提高短期负荷预测技术水平,有利于提高电力系统的经济效益和社会效益,因此精准的短期电力负荷预测变得越来越重要[2]。
目前,国内外有很多关于短期电力预测的方法,传统电力负荷预测方法有时间序列法、趋势外推法与回归分析法等[3-4]。时间序列法是建立描述电力负荷随时间变化的数学模型,在该模型的基础上确立负荷预测的表达式,并对未来负荷进行预测[5]。趋势外推法是根据负荷的变化趋势对未来负荷情况作出预测[6]。回归分析预测法是根据历史数据的变化规律和影响负荷变化的因素,寻找自变量与因变量之间的关系及其回归方程式,确定模型参数,据此推断将来时刻的负荷值[7]。传统电力预测方法对负荷序列的平稳要求比较高,在某些情况下,预测精度会受影响。
近年来随着负荷数据的增加以及人工智能和智能电网的迅速发展,利用大数据进行负荷预测成为主流。通常机器学习法更适合大数据负荷预测,其中人工神经网络技术(Artificial Neural Network,ANN)是机器学习的重要分支[8]。神经网络技术是目前最先进的负荷预测方法,具有对样本数据容错率高、非线性映射能力强、自适应和自组织等优点[9]。神经网络技术可以从实例数据中学习,学习完成后,得到非线性依赖关系。循环神经网络(Recurrent Neural Network,RNN)是一种可以对序列数据进行处理的神经网络,但存在长期依赖的问题[10]。对此,长短时记忆网络(Long Short-term Memory,LSTM)引入自循环的思想来克服长时间的依赖关系,从而解决RNN 中出现的梯度消失/爆炸问题[11-12]。深度神经网络(Deep Neural Network,DNN)是具有多个隐层的神经网络[13]。在DNN 中至少有3 个以上的层次,这意味着有“更深”的学习过程。而数据集的输入输出与复杂模式之间存在着复杂的联系,可以通过多层结构来学习[14]。
本文提出一种基于LSTM 与前馈神经网络(Forward Feedback Neural Network,FFNN)相结合的短期电力预测模型。在该模型中,通过LSTM 对时间序列进行预测,而FFNN 则利用附加信息进行预测,从而最大限度地减少预测误差。实验结果表明,相比于原LSTM模型,LSTM-FFNN 模型可获得更精确的预测结果。
本文目的是预测制造企业的用电量。根据历史用电量时间序列数据,利用本文提出的方法对未来某一时段的用电量进行预测。在这种情况下,需要预测第二天每30 min 的用电量(1 d 48 个时间步长)。对于训练数据,根据案例对数据进行了划分,即1 d 的时间范围和30 min 的时间分辨率。数据集被划分为每天包含每30 min 的用电量数据。N 表示样本数据的数量。而X 和Y 代表一组输入和输出。
本文结合两种神经网络进行电力负荷预测。利用这些分离的数据进行实验。该模型主要输入是用电量的历史时间序列数据。
整个架构模型如图1 所示。在进行电力负荷预测时,首先将LSTM 设置为利用历史数据进行时间序列预测。然后将来自LSTM 的输出与附加输入一起作为FFNN 的输入。额外的输入是使用一个热编码表示的日期、时间尺度和季节信息。
图1 电力负荷预测的LSTM-FFNN 结构
在本文中,我们提出了3 种额外的时间信息。该信息由一个热编码表示,具体如下。
(1)日信息。此信息表示从周一到周五每个电力消耗数据中的日信息。
(2)时间刻度信息。该信息表示从00:00-23:30 开始的每种电力消耗数据中的时间尺度信息。
(3)季度信息。在这一季的信息中,将其分为淡季(11 月和12 月)、中季(1—6 月、9 月和10 月)、旺季(7月和8 月)。
在进行用电量预测之前,需要确定一些超参数的设置。超参数包括LSTM 层数、FFNN 层数、各层神经元数等。
在LSTM 的训练过程中,使用BPTT 和FFNN 中的标准反向传播。在执行优化时,使用自适应矩估计优化器和均方根传播。在训练过程中,对权重和偏差进行更新,使损失函数最小化。
数据来源于国家电网实际负荷数据,其中包含了一家制造企业的用电历史数据。在该数据集上实现本文提出的预测方法。该数据集包括1 年零4 个月的用电量数据,分辨率为30 min。此外每一天包含48 个用电量数据。数据集的详细信息记录见表1。
由表1 可知,本次实验将使用“全天”数据(23 376个)和“工作日”数据(15 360 个)。目标是通过每30 min用电量预测一天的用电量,并对不同数据量下的实验结果进行比较。
本文提出的模型是LSTM-FFNN。LSTM 进行时间序列预测,LSTM 的输出将与附加的日、时、季信息一起输入FFNN 模型。该模型的超参数是根据表1 的一些测试用例进行调整的。该测试用例决定执行预测过程以检查预测模型的性能。
通过与原LSTM 比较,对该模型的性能进行了训练和测试。其原理是基于原LSTM 的神经网络模型与神经网络模型FFNN 相结合,形成了LSTM-FFNN。为了评估性能,实验使用了均方根误差(RMSE)作为评估指标。RMSE 的定义如式(1)所示,即
式中:yj为地面真值;y′j为时间步长j 的预测值;n 为参与测试验证的图片的数量。
由图2 可知,该方法在实际数据中达到最大值。基于RMSE 评分与标准LSTM 在训练和测试过程中的比较,LSTM-FFNN 表现更好,具体见表1。模型和标准LSTM 每30 min 1 d 的预测性能如图2 所示。
图2 工作日用电量预测结果图
该实验使用的是“工作日”数据。这一结果也表明,附加信息的使用提高了预测的性能。使用“全天”数据的预测模型和标准LSTM 在每30 min 内1 d 的预测性能如图3 所示。
图3 全天用电量预测结果
由表1 可知,LSTM 和LSTM-FFNN 在使用不同数据量的情况下,基于测试过程的测试用例进行RMSE评分的比较。实验结果表明,LSTM-FFNN 算法比原LSTM 算法具有更好的性能。从LSTM-FFNN 的RMSE分数可以看出,其比原LSTM 的RMSE 分数要小。这说明额外的信息对实验的结果产生了作用,这使得LSTM-FFNN 比原LSTM 有更好的效果。
此外,根据表1 给出的RMSE 评分,使用“工作日”数据进行工作日预测的结果优于使用“全天”数据进行工作日预测的结果。
表1 测试过程RMSE 评分表
本文在与原始LSTM 基线进行了多次实验比较后,还将实验结果与移动平均线(MA)基线进行了比较。为满足制造企业的用电需求,将该模型作为该供电公司的预测方法。在这个实验中,尝试用5 d 移动平均线来预测第2 d 的电力需求,并尝试用每30 min 使用1 周的测试数据。
基于表2 的RMSE 评分,提出方法仍然达到了较好的预测效果。MA 根据前5 d 的用电量预测下一个值,与本文所提出的方法不同,本文不仅要学习用电量的规律,还要学习额外信息(天、时间尺度、季节)。如图4 所示,对LSTM、LSTM-FFNN 和MA 的预测结果进行了比较。
图4 LSTM、LSTM-FFNN 和MA 预测结比较果图
表2 1 周测试数据RMSE 评分比较
因此,对工作日的预测要将工作日和特殊时间(假期和周末)分开。原因是特殊日子用电量和工作日用电量数据存在一定的差异。将这2 种差异性的数据进行分离将有助于网络了解工作日的用电量模式。
为了提高短期电力负荷预测识别精度。本文提出了一种改进深度神经网络的短期电力负荷预测模型。相对于基线(原始LSTM 和MA),LSTM-FFNN 方法的预测结果更准确。根据实验结果的RMSE 评分,与“全天”数据相比,使用“工作日”数据可获得更好的效果。本文主要预测工作日的用电量。实验结果(基于RMSE评分)表明,将不同类型日(工作日和节假日)的用电量分开预测可获得更精确的结果。此外,在未来的工作,将尝试使用不同类型的数据集来执行模型。不同类型的客户(如家庭、公共设施等)需要不同的数据分析。对于同样的情况,将重点改进模型的性能,在未来可获得更好的实验结果。