基于LSTM 的钢铁工业地区母线短期负荷预测研究

2020-09-02 04:23孙昀昀王连成
山东电力技术 2020年8期
关键词:准确率神经网络负荷

孙昀昀,王连成

(山东大学,山东 济南 250061)

0 引言

准确的母线负荷预测是制定电网合理运行方式和电力调度的数据基础。母线负荷相对于系统负荷,量大面广且易受多重因素影响,通常是供给有限范围区域负荷的总和。母线负荷变化特点是速度快、趋势不明显,使母线负荷稳定性通常较弱。当光伏电源并网和钢铁冲击性负荷容量达到一定规模时,其功率波动会破坏接入电网原有负荷特性曲线的固有形态,给统调负荷预测工作带来困难,增加电力电量平衡的难度。

迄今为止已提出了多种各具特点的母线负荷预测方法,文献[1]分析了母线负荷与气象因素的关联性,找出了影响其负荷特性的气象因素,构建出基于关联性分析的母线负荷分类预测模型。文献[2]小波分解算法,将母线负荷序列分解,分别分析各序列规律特征的不同,构造出不同的支持向量机模型负荷预测,重构后获得预测值。母线负荷属于短期负荷预测,传统方法如时间序列法、回归分析法已经被广泛应用,但预测精度逐渐不再满足现代需求。随着人工智能和智能电网的发展,以深度学习为代表的人工智能方法在电力系统负荷预测领域取得了不错的效果。深度学习模型通过多层非线性映射逐层学习海量负荷序列中蕴含的抽象特征。文献[3]采用模糊C-聚类算法将不同行业划分为不同的预测类型;分别建立基于深度信念网络的负荷预测模型,负荷预测精度有所提升,但没有充分利用负荷数据的时序特性。文献[4]采用MATLAB中的BP神经网络建立以时间序列为模型的方法应对钢铁厂用电复杂多变的特性,但作者指出由于BP网络基于自身特点,采用非线性函数的梯度优化算法,存在收敛速度慢、容易陷入局部最优的缺点,有一定的局限性。

为了解决传统方法中存在的问题,以含有大型钢厂冲击性负荷的地区母线负荷数据为基础,利用深度学习长短期记忆 (Long Short-term Memory,LSTM)算法的优势充分挖掘与整合多维影响因素,根据母线负荷中所包含的光伏发电、钢铁负荷所占比例的大小,将母线分为三类进行预测,提出钢铁工业地区的短期母线负荷预测模型。

1 基于深度学习的负荷预测方法

1.1 深度学习网络模型

循环神经网络(Recurrent Neural Network,RNN)是一类具有短期记忆能力的神经网络,适合用于处理视频、语音、文本等与时序相关的问题[5-6]。循环神经网络中神经单元不仅可以接受其他神经单元传输的信息,还可以处理本神经单元的信息形成环路。根据时间展开后,循环神经网络神经元如图1所示。

图1 展开的循环神经网络神经元

时间为t时,网络的输入量为xt,不仅当前时刻的隐状态 (即隐藏层神经元活性值)ht与输入xt有关,上一个时刻的隐状态ht-1也与其相关,进而与全部输入序列 x={x1,x2,…,xt}相关。 由图 1 可知 RNN展开后由多个相同的单元连续连接,是一个自我不断循环的结构。表示为:

式中:zt为隐藏层的净输入;f(·)为非线性激活函数,一般是tanh函数或Sigmoid函数;U为状态-状态权重矩阵;W为状态-输入权重矩阵;b为偏置矩阵。

但RNN神经网络也有其局限性,随着时间跨度增加,容易产生长期依赖激活函数和网络参数的问题,失去从过去获取更多信息的能力,产生梯度消失或梯度爆炸现象[7]。在这个基础上,RNN的变体LSTM神经网络崭露头角。

1.2 LSTM神经网络

为了改善RNN的缺陷,LSTM神经网络由S.Hochreiter和 J.Schmidhuber于 1997年提出[8]。 与标准 RNN结构重复的神经网络模块的链式形式相比,LSTM在每个RNN的cell内部加入了三个控制门单元(Gate),构成一组称之为记忆块(Memory Blocks)的循环子网络。用于选择对关键节点信息的记忆或者遗忘,实现了长时间和短时间记忆的结合,有效改进了RNN难以处理的人为延长时间任务的问题,更适用于处理和预测时间序列中间隔和延迟相对较长的重要事件,在语言模型、机器翻译、语音识别[9]等领域应用广泛。图2为LSTM神经网络典型结构。

图2 LSTM神经网络典型结构

LSTM神经网络单元处理数据的流程是:把t时刻输入数据与t-1时刻的输出数据结合,经过遗忘门选择性保留长期记忆状态变量。再通过输入门将上一时刻长期状态与当前时刻状态叠加,得到新记忆状态变量。最终长期记忆状态变量通过输出门作用得到t时刻输出。与RNN相比,LSTM得到新记忆状态值是叠加的形式,可以大大改善状态值逐渐接近0 的情况,即梯度消失现象[10]。

根据图2所示,可以用式(3)—式(8)解释 LSTM循环模型单个循环体的具体运算过程,其中xt为输入,yt为输出,it为输入门的输出,ft为遗忘门的输出,ot为输出门的输出,W和b为参数矩阵。σ采用Sigmoid激活函数。

2 短期负荷预测流程

LSTM神经网络由于具有记忆结构,可以很好地反映负荷数据在时间顺序上的联系。将深度学习LSTM神经网络应用于短期负荷预测,重点在于对海量的历史负荷数据进行预处理以及解决由于网络深、参数多带来的训练困难问题。将数据库按7∶3的比例分为训练数据集和测试数据集,分别用于深度学习网络模型的学习过程和对训练完成的深度学习网络模型的性能测试。图3为深度学习网络模型构建过程。

图3 深度学习网络模型构建过程

模型构建的详细流程:

1)数据预处理,历史负荷数据采集系统会存在数据缺失或者数据异常的情况[11]。若不加处理输入模型将会导致很大的误差。因此,数据预处理需要对缺失的数据进行填补,并对异常数据进行识别和修正[12]。

2)确定模型的输入输出变量,将预处理后的数据集划分成为训练集、测试集2个部分。按是否有标签将训练集数据分为无标签数据和有标签数据,训练集数据用于模型训练,测试集用于测试模型对新数据预测性能的优劣。

3)由于神经网络具有激活函数特性,对[-1,1]内的数据更加敏感[13]。针对数据库进行归一化处理,采用归一化公式(9)将数据处理至[0,1]区间内。

式中:X′为完成归一化的输入变量;X为预处理后的待归一化数据;max(X)为待归一化数据每行的最大值;min(X)为待归一化数据每行的最小值。

4)训练集数据输入LSTM网络模型中获得预测值,模型超参数采取梯度下降调整方式,代价函数为平方重构误差,LSTM实现监督学习。

5)LSTM网络训练完成后,输入测试集数据,反归一化后输出预测结果。

6)将5)中得到的负荷预测值与实际负荷进行对比评价,采用误差的均方根值(Root Mean Square Error,RMSE)作为预测结果的评级指标,衡量LSTM 网络模型的预测准确性。

式中: δr为误差的均方根;fp(i)和 fi(i)分别为测试集中第i个采样点的预测负荷值和实际负荷值;n为测试集中样本数。电力负荷预测中RMSE越小,则负荷预测效果越好。

3 深度LSTM负荷预测模型

该地区多数母线带有钢铁工业负荷,母线负荷曲线波动幅度大,母线负荷预测的基准值远小于系统预测的基准值,提升母线负荷准确率成为一个棘手的问题。通过分析母线历史准确率,将母线分为三类。第一类母线接入光伏发电站,负荷变动与天气关联性强,日周期性明显,历史预测准确率高;第二类母线接入部分钢铁工业负荷,有一定的日周期性,历史准确率较高;第三类母线几乎完全接入钢铁工业负荷,日周期规律性很差,同时受钢铁企业生产计划、检修计划影响大,历史准确率低。

由于历史负荷之间大体趋势相同,但每日负荷受该日日期类型、气象因素(温度与光照)、电价波动、钢铁期货水平变化而产生相应的变化。电价与工业负荷波动之间有密切的联系,钢铁工业在电价高的白天负荷低于夜晚,在08:00电价变化分界处,负荷会明显减少。钢铁市场价格的浮动也与钢铁负荷变化相关,钢铁价格上涨时,钢铁工业负荷随之升高;相反地,钢铁市场低迷时,钢铁工业负荷也会降低。同时,光照因素对没有光伏电厂接入的母线负荷预测影响较小。综合考虑各母线负荷的实际情况,把负荷历史数据和多种影响因素量化值的集合作为深度学习LSTM网络预测模型的输入量[14],建立了两种负荷预测的输入特征集。特征集分别如表1、表2所示。

表1 不接光伏的负荷预测输入特征

表2 接入光伏的负荷预测输入特征

规定光伏未接入的母线预测模型为模型Ⅰ,光伏接入的为模型Ⅱ。模型Ⅰ中,1—7号特征量是待预测日前7日的每日96负荷点负荷数据;8号特征量为待预测日的日期类型,包括节假日信息;9号特征量是温度因素,显示为待预测日温度的96点变化量化值;10号特征量展示各个时间段电价波动;11—12号特征量是选取螺纹钢、H型钢价格的波动体现钢铁市场形势。模型Ⅱ中,1—3号特征量选取待预测前3日的96点负荷数据;4号特征量是待预测日的日期类型;5号特征量是96点温度量化值;6号特征量为待预测日天气类型,用于体现光照因素影响;7号特征量是待预测日各个时间段电价波动。以上特征量作为LSTM网络模型的输入量,充分反映了负荷随影响因素变化的情况。

4 仿真与结果分析

基于MATLAB R2018b平台实现本文所使用的深度学习网络模型编程与仿真,在MATLAB中的Deep Learn Toolbox工具箱完成网络调用。

4.1 仿真设置

测试仿真数据来自某地区2018年10个220 kV变电站共21条母线的实际负荷数据,采样间隔选取为15 min,每天96点负荷值。考虑到负荷数据变化的季节性、母线运行方式和检修计划调整,以30~90天作为训练间隔。原始数据集为1—3月、6—7月、10—12月历史负荷数据。

根据前期大量仿真可知,带光伏电站的母线,对外界光照因素更敏感,适用模型Ⅰ;带钢铁生产的工序的母线适用模型Ⅱ。

4.2 仿真结果分析

首先用深度学习的两种模型以6个变电站6条母线为例进行仿真,对母线历史负荷数据进行负荷预测,将三大数据集分别进行训练测试工作;三大数据集的负荷预测仿真结果与现有负荷预测系统的预测结果进行对比,其对比结果如表3—表5所示。

表3 1—3月负荷预测准确率对比

表4 6—7月负荷预测准确率对比

表5 10—12月负荷预测准确率对比

调研地区现有预测方法,发现传统方法仅考虑了时间因素与负荷之间的关系,钢铁工业自身特点以及影响负荷变化的多种因素没有纳入。故本文将多种影响因素量化输入深度学习LSTM预测模型,可以有效地提升母线负荷预测准确性。已知GC 2号母线是带有大型钢铁企业冲击负荷的母线,存在负荷瞬时波动超过100 MW的极端情况,在仅依靠预测方法难以进一步提升准确率的情况下,常常还需要人工干预。

对于冲击负荷叠加导致的负荷急剧变化,需要专工参考钢厂生产工序和生产计划,对波动点数据修正或用边界值代替。

大型用电设备故障检修、跳闸使得负荷急剧波动时,预测结果需要现场运行人员根据实际情况修正。

以6—7月数据集为例,将深度学习负荷预测方法的预测结果与人工神经网络算法、支持向量机算法的结果进行对比如表6所示。

表6 6—7月各算法负荷预测准确率对比

将现下广泛使用的人工神经网络算法、支持向量机算法与本文使用的深度学习预测方法相比,可以证明深度学习预测方法的先进性及其在电力负荷预测方面的适用性。

5 结语

电力负荷时序数据有着时序性、非线性及观测时限性的特点。特别是钢铁工业负荷包含更多的随机因素,同时用电设备的启停、检修会导致总负荷产生很大的波动,其负荷变动周期性及规律性不佳。考虑到光伏发电的间歇性和不确定性以及钢铁负荷的冲击性,提出了基于深度学习的钢铁工业地区母线负荷预测方法。在充分考虑多重影响因素的基础上,分析改善前馈神经网络、支持向量机等机器学习方法在提取负荷序列深层特点的缺陷,构造深度学习LSTM网络模型。仿真结果表明建立的模型可以有效提升负荷预测准确率。

猜你喜欢
准确率神经网络负荷
人造革合成革拉伸负荷测量不确定度评定
基于递归模糊神经网络的风电平滑控制策略
3项标准中维持热负荷要求对比分析
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
Opening flexible resources by integrating energy systems: A review of flexibility for the modern power system
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析