张 玮 秦晨晖 王 浩 张 鑫 邵梓翔 杨文韬
(国网甘肃省电力公司甘南供电公司)
电力行业作为保障经济发展和人民生活最重要的二次能源的基础产业,在我国经济运行调节方面起着重要作用。电能无法存贮具有即发即用的特殊性,这对电能的生产、传输、配送以及销售的过程提出了更高的要求,因此,根据以用定发的原则,需要通过剖析历史负荷相关数据,获取后期负荷的实际状况,提前安排发电、输电及供电方案[1]。
负荷预测可理解为合理计及各项条件,应用数学措施对负荷变动规则进行探究,确定某特定时刻或时段的负荷数值的过程。电力需求量的预测结果影响发电设备的装机类型、输电网的运行及配电系统新增容量的大小。BP神经网络是目前应用较多的一种负荷预测方法,具有非线性映射能力、自学习和自适应能力及容错能力等优点,然而BP神经网络也存在收敛速度缓慢、预测能力矛盾等问题[2]。本文首先采用ElasticNet弹性网回归对大数据进行筛选,剔除冗余数据,获得有效样本集;其次,考虑可用于解决非线性最小二乘问题的LM算法,利用LM算法对BP神经网络的负荷预测模型进行优化,实现模型预测精度和收敛速度的提升。
负荷预测结果是系统调度的重要参考依据,负荷预测值的准确性与电能质量息息相关,同时负荷预测也是电力系统优化的环节之一。电力负荷预测是供电企业的重要任务,预测精度达标时,发电侧可以更加经济合理地计划发电机组的运行与检修,保证供电系统科学合理地安排机组出力[3]。
随着新一轮电力体制变革的持续进行,电网企业将不再负责售电业务,仅依照政府规定的输配电价收取过网费,涌现出各种不同背景的售电公司。对售电公司来说,核心竞争力就是负荷预测水平,准确的负荷预测系统不仅可以帮助企业更好地进行规划投资,同时可以有效降低成本、增加利润收益[4]。
负荷预测具体流程如图1所示。
图1 的负荷预测整体流程可以概括为:
(1)确定目的,制定预测计划
根据现有数据材料,科学准确地预测电力电量需求,实现以精确的负荷、电量测算依据,合理指导规划、建设、运行等各个环节的目的。
(2)背景调查,收集资料
目标明确后,需要根据要求收集预测过程中需要使用的相关资料数据。确定想要预测负荷的所在的地点及时间长短;确定预测负荷的期限,根据目标收集相关历史数据,包含所要用到数据的分布及气象因素等信息,收集数据可靠性决定了准确预测能否顺利实现,防止因收集数据存在过大偏差导致预测结果失准情况的出现;
(3)整理资料,数据预处理
数据获取完毕后,需对数据进行整理,观察数据中是否存在缺失或者异常点,若存在则需要对这些数据进行相关处理。
(4)数据挖掘,分析数据
采用数据挖掘对数据进行分析处理,可以在没有明确假设的前提下去挖掘信息、发现知识,进而得到有价值的数据资料[5];同时,数据挖掘一般要通过编程实现,注重数学和计算机等方法的综合应用,所以在数据处理过程中引入数据挖掘技术,以解决资料收集分析困难,数据繁杂的问题。
(5)搭建负荷预测模型
搭建系统负荷预测模型的过程就是明确负荷预测输入值与预测量之间关系的过程。可以对电力负荷进行预测的措施有很多,然而每种方法存在各自的优点和不足,在实际运行时间中,一般选用多种方法进行负荷预测,并对预测结果进行比对[6]。
(6)确定预测结果,分析对比
对模型求解获得预测结果,通过误差分析对模型存在的优势和不足进行评估。不同负荷预测模型获得的预测结果间存在差异,分析对比后对模型进行修正,得到最佳算法。
由负荷特性分析可知,电力负荷的变动以历史负荷数据为基础受多方面因素影响,如天气、环境等多重外部因素。电网企业的智能化进程不断推进,信息和能量的交互产生了大量结构复杂、关系紧密的电力负荷相关数据,电力负荷大数据化现象突出,要想顺利完成负荷预测任务,需对电力负荷相关数据进行挑选及特征提取,排除不相干及多余数据的干扰,建立有效样本集。回归分析是一种预测性质的建模措施,普遍应用于分析预测、时间序列模型和探究变量间因果关系的问题中[7]。
回归分析可以对两个或者多个变量之间的关系进行估计,揭示因变量和自变量之间的关系,允许使用者对不同尺度上测量变量的影响进行比对,帮助使用者评价得出最佳的变量集,用于预测模型的构建。
大多数回归技术均可用于预测分析,常见的回归模型包括:
(1)线性回归:因变量是连续的,自变量的连续性不做过多要求,回归线的实质是线性的。
(2)逻辑回归:逻辑回归用来计算成功或者失败的概率。当因变量是二进制时,可以选择采用逻辑回归。
(3)多项式回归:一个自变量的指数大于1的回归方程,可确定为多项式回归方程。多项式回归的最佳拟合线时数据点的曲线。
(4)逐步回归:处理问题中含有多个孤立变量时,可以采用逐步回归。独立变量通过自动过程进行选取,排除人为因素影响。
(5)岭回归:岭回归是当数据遭受多重共线性时使用的一种技术。通过引入偏差度进而有效减少方差。
(6)套索回归:套索回归对回归系数的绝对值进行处理,可以降低变异性并提升回归模型的准确度。
(7)弹性回归:弹性回归属于岭回归和套索回归的混合技术,同时使用L2和L1正则化。当有多个相关的特征时,采用弹性网络可以对问题进行有效处理。套索回归大概率随机选择其中一个,而弹性回归一般会选择多个。
不同的回归技术有其自身的优缺点和适用范围,本文采用结合套索回归和岭回归技术的ElasticNet弹性网回归,对电力负荷有关数据进行变量筛选处理及特征提取。弹性回归在高度相关变量的情况下支持群体效应,具有两个收缩因子λ1和λ2,对所选变量的数目不存在限制,适用于解决变量数目过多的问题。
人工神经网络是在现代神经学、生物学、心理学等学科探究的基础上产生的,是一种模拟人脑神经组织的计算系统,它具有生物神经系统的基本特征,在一定程度上借鉴了人脑功能。
BP神经网络作为目前应用最多的一种神经网络形式,具备非线性映射能力、泛化能力、容错能力、自学习和自适应能力等优点,但是由于使用场景的不断更新扩张,BP神经网络也显现出了较多的缺点和问题,比如局部极小化问题、收敛速度慢、预测能力和训练能力的矛盾等问题。本文利用LM算法对BP神经网络的负荷预测模型进行优化,改进输入信号的正向传递和误差信号的反向传输过程,提高BP神经网络模型的负荷预测精度以及收敛速度。
3.1.1 传统预测模型
BP神经网络是经过误差逆向传播算法进行训练的多层前馈神经网络,这种神经网络可以通过学习以及存储的方式来表示任意的输入层和输出层的m维到n的映射关系[8]。这种m维到n的映射关系不需要提前给出某种数学方程式。BP神经网络的模型结构如图2所示。
图中:Xm为输入层的输入值;bij为隐含层的阈值;Wij为输入层和隐含层之间的权值;Yp为隐含层的值;bjk为输出层的阈值;Wjk为输出层和隐含层之间的权值;Zl为第l个节点的输出;m为输入层的维度;p为隐含层的节点总数;l为输出层的维度。
3.1.2 模型的局限性
实际使用中,人工神经网络更多采用BP神经网络及其优化形式进行替代。BP神经网络具有分布式存储信息、信息处理和存储合二为一及自组织、自学习等特点,具有解决所有复杂性非线性问题的能力,但是BP神经网络也具有一些难以克服的局限性[9]:
(1)易陷入局部最优。BP算法理论上可以实现任意非线性映射,但在实际应用中,会面临陷入到局部最小值的问题。
(2)初始权重敏感。BP神经网络需要对初始权值进行随机确定,这就导致BP神经网络一般具有难以复现的特点。
(3)样本依赖性。BP算法的结果与样本的选择相关联,如果学习样本不具有代表性,或者额外数据和矛盾数据较多,则模型难以达到预期效果。
针对上述问题中提及的BP算法具有随机性、易陷入局部最小值等问题,引入BP神经网络的优化算法。
3.2.1 LM算法的基本原理
LM算法是使用较为广泛的非线性最小二乘算法,它是利用梯度求最大(小)值的算法,同时具有梯度法和牛顿法的优点。当λ很小时,步长等于牛顿法步长;当λ很大时,步长约等于梯度下降法的步长。LM算法能够相对有效的防止神经网络陷入局部最优,而且LM算法的收敛速度快,有很强的稳定性。算法在进行过程中对参数进行修改,结合高斯-牛顿算法以及梯度下降法的优点,并在不足处进行挖完善。LM算法可以表示为:
当μk增加时,算法接近于最速下降法;当μk减小时,算法接近于牛顿法。
3.2.2 LM算法改进的BP神经网络模型
训练目标误差不同会对BP神经网络模型的预测结果产生影响。误差越大,训练所需要的时间就越少,但是预测结果的误差会越大,可能无法得到结果预期值;相反误差越小,训练所需要的时间就越多,预测结果的误差就越小,精度就越高,但是算法会出现不收敛的情况[10]。LM算法可以促进BP神经网络收敛速度,能够快速并精确地拟合函数曲线,但却没有使网络的泛化能力得到増强。设误差函数为Ee,则有:
其中,n为训练样本数量,Oi为网络实际输出,ti为期望输出。
如果仅从有限个样本中恢复一个函数的解无法获取全面的信息,得到的结果很可能会产生较大的误差。采用正则化方法,在原有算法的基础上增加权重衰减项,用于限制逼近函数,防止过度拟合的发生。此时网络的性能函数改进为:
其中:ωi为神经网络的互联权值,M为神经网络中全部连权值的个数。参数λ和β决定了神经网络的训练目标。采取贝叶斯正则化方法,可得出:
其中:γ表示网络中有在减少耗费函数取值方面有效果的参数个数。算法流程如图2
BP神经网络具备很强的自适应能力,同时,还具有可以自主学习、信息记忆以及优化计算的优点。通过LM算法对BP神经网络进行优化,能够解决BP神经网络局部极小化和收敛速度慢的问题,改进后的预测模型适用于短期及中长期负荷预测等多种场景,更具可靠性。