基于知识-数据混合驱动的综合能源系统多元负荷预测方法①

2023-09-24 13:15王力成王子非邓宝华张有兵
高技术通讯 2023年8期
关键词:神经元驱动负荷

王力成 王子非 邓宝华 凌 锋 张有兵

(*浙江工业大学信息工程学院 杭州 310023)

(**之江实验室人工智能研究院 杭州 311121)

0 引言

负荷预测作为保障能源系统安全稳定运行的前提,可以为系统的优化调度提供数据参考[1]。目前对于负荷预测的研究主要针对单一能源系统,仅侧重于某一类能量的有效利用,不能充分发挥出多种能源互补的优势,同时也无法保证综合能源系统(integrated energy system,IES)整体的安全经济运行。而IES 的多元负荷预测一方面可为系统运行规划提供先验知识,极大提高系统的灵活调度能力,另一方面IES 能够充分利用多种能源,因此IES 的多元负荷预测成为当前研究的一大热点。当前,由于综合能源系统所采集到的数据信息包含了大量的历史负荷数据、环境因素数据和气象因素数据等,且这些数据的随机性和复杂程度较高,因此,传统应用于综合能源系统的负荷预测方法难以达到令人满意的效果[2]。

近年来,深度学习由于具有“特征提取能力强、计算效率高”等特点[3-4],因此受到国内外学者的广泛研究。文献[5,6]分别基于循环神经网络和径向基函数神经网络较好地实现了负荷的短期预测,但算法程序的实现较为复杂,且模型简单,无法对复杂冗余数据进行有效处理。文献[7-9]分别利用灰色关联分析法和改进的粒子群算法对深度学习算法做出了相应的改进,改进后算法的预测效果得到了一定程度上的提升。然而,由于深度学习方法与综合能源系统的内在物理结构是相互独立的,难以解释具有强因果关系的IES 系统中各能源子网络之间存在的能量耦合特性。因此,单纯利用深度学习模型得到的负荷预测结果受到了一些专家和学者的质疑。

本文综合考虑到IES 物理结构模型中包含的能量耦合特性知识以及深度学习模型具有高效处理海量复杂数据信息的能力,提出一种基于知识-数据混合驱动的IES 多元负荷预测方法。首先基于原始样本数据库中的历史负荷数据、气象因素数据、可再生能源出力数据等信息建立解析模型,并通过建立好的知识模型计算得到各能源的供应值。然后将知识模型计算所得到的数据和原始样本数据进行重构,并将重构后新的样本数据作为数据驱动模型的训练数据进行训练。最后,在IES 负荷预测模型的训练过程中,利用基于随机森林算法的特征选择方法和Dropout 技术分别对冗余特征和神经网络进行处理,从而进一步提升该预测模型的泛化能力。算例结果表明,通过本文所提方法训练完备的IES 多元负荷预测模型相较于传统单一数据驱动模型不仅具有较好的可解释性,还有助于改善IES 多元负荷预测模型的预测效果。

1 综合能源系统的用能机理分析

在对综合能源系统中不同类型负荷进行预测之前,还需要充分分析IES 内部各能源子系统之间的能源交互与存储,深入探索各种负荷的构成机理,进而获得历史负荷数据和其他影响因素下未来负荷的变化趋势。本节将从综合能源系统的物理结构和IES 中的能量耦合特性2 个方面对IES 的多元负荷特性进行介绍。

1.1 综合能源系统的物理结构

截至目前,关于能源系统预测的研究工作主要还是集中于单一能源系统,而针对单一能源系统的预测工作忽略了当前综合能源系统中不同能源子系统之间日益耦合的特点。典型综合能源系统的物理结构模型框架如图1 所示。

图1 典型综合能源系统的物理结构模型

从能源类型的角度来看,综合能源系统主要包含了电力、天然气和热力等能源子网络。在电力网络中,除了一些常规的电气设备(如电力传输线、不同级别的用电负荷),还包含分布式可再生能源的发电设备(如风电、光伏)和电储能装置等;在天然气网络中,天然气管道、气储能装置和气动阀门成为了该网络的核心;热力网络则主要由热力管道、热力阀门、热负荷组成。从系统功能的角度来看,综合能源系统包括了能源供给、能源交互与存储以及负荷需求响应三大功能。例如,电力网络在消纳风电、光伏等可再生能源、提升电力资源优化配置的同时,还能通过电制热、电制氢等耦合设备将电能转换热能和气能,从而满足热负荷和气负荷的能源需求;天然气网络中的气源除了供给气负荷外,还可以通过热电联供机组产生电能和热能,用于供给电负荷和热负荷;热力网络中的热源不仅满足了热负荷需求,还能与热储能装置进行能量的交互,从而提高系统的灵活性。

综上所述,综合能源系统中各种负荷需求和其他多种异质能源紧密相关。因此,在对综合能源系统进行多元负荷预测时,还需考虑IES 中存在的能量耦合特性、可再生能源出力的波动性以及不同能源供应等影响因素对IES 多元负荷预测结果造成的影响。

1.2 IES 中的能量耦合特性

本文以1.1 节中的典型综合能源系统为研究对象,对IES 内部各能源子系统的能量耦合特性进行详细分析。在能源供给侧,IES 中各能源子系统通过从上级能源网络获得电力、天然气和热力的能源供应,并通过不同的能源转化设备实现电能、气能和热能的能源交互与存储,进而满足用户需求侧中不同类型的负荷需求。其中,能源供给侧的能量耦合关系可建模如下:

在用户需求侧,从上级能源网络获得的电力、天然气、热力资源经由各种能源转化设备可满足不同规模级别的用户需求。为保障用户需求侧的正常供能,综合能源系统中的能量耦合关系式还需考虑各能源子网络的供需平衡,即:Pe=Le;Pg=Lg;Ph=Lh。其中,Le、Lg和Lh分别代表IES 的电负荷、气负荷和热负荷。

2 考虑IES 能量耦合特性的知识-数据混合驱动模型

相较于传统单一数据驱动模型的IES 负荷预测方法,本文所提方法综合考虑到综合能源系统物理结构模型中蕴藏的能量耦合特性以及深度学习具有高效处理海量高维复杂数据的能力,提出一种基于知识-数据混合驱动的综合能源系统多元负荷预测模型。其中,解析模型保留了综合能源系统中的能量耦合特性知识,在提高数据驱动模型可解释性的同时,还能充分挖掘数据驱动模型提取样本数据中重要信息的能力[10-11],进而保证了本文所提方法的有效性。

2.1 基于能量耦合特性知识的解析模型

为进一步体现IES 中的能量耦合特性,获得用于本文所提方法中数据驱动模型训练的新数据样本,本节利用解析模型对从上级能源网络获得的各能源供应进行求解,求解过程如下。

先将式(1)转化为式(2)形式。

再对式(2)进行化简可分别计算得到当前历史数据下电能、气能和热能的供应值,结果如式(3)~(5)所示。

最后对解析模型计算所得到的电能、气能、热能和原始样本数据进行重构,重构后的新数据样本作为下一节数据驱动模型的训练样本。

2.2 基于数据驱动的深度学习模型

2.2.1 深度置信网络的算法原理

典型的深度置信网络(deep belief network,DBN)模型[12-13]如图2 所示,该模型由多个受限玻尔兹曼机(restricted Boltzmann machine,RBM)[14]和一个反向传播(back-propagation,BP)网络[15]堆叠而成。其中,X=(x1,x2,…,xn) 和Y=(y1,y2,…,yj) 分别为深度置信网络的输入样本和输出样本;Wm为第m-1 个和第m个隐含层上所有神经元连接的权重向量,Wm=(wm,1,wm,2,…,wm,k);Bm为第m个隐含层上神经元的阈值向量,Bm=(bm,1,bm,2,…,bm,f)。

图2 典型的深度置信网络模型

RBM 是构成DBN 的基本单元,每一个RBM 中上一层神经元的输出可作为下一层神经元的输入,即图2 中隐含层也可作为某个RBM 的输入层(输入层亦可以被称为可视层)。以图2 中的第1 个受限玻尔兹曼机RBM1为例,输入层X和隐含层H1分别为RBM1的可视层和隐含层,可视层神经元的输出作为隐含层H1的输入。其中,H1=(h1,1,h1,2,…,h1,e) 表示第1 个隐含层的状态向量;A1=(a1,1,a1,2,…,a1,g) 为可视层神经元的阈值向量,并定义λ1=(W1,B1,A1) 为RBM1的参数集合。

由于受限玻尔兹曼机是一种基于能量的概率生成模型,因此RBM1的能量函数可被定义为[16-17]

其中,a1,c、xc分别为RBM1中可视层上第c个神经元的阈值和输入,b1,l、h1,l分别为RBM1中隐含层上第l个神经元的阈值和状态信息,w1,c,l则为RBM1中可视层上第c个神经元与隐含层上第l个神经元之间的权重。

当隐含层H1=(h1,1,h1,2,…,h1,e) 的状态向量确定后,依据式(7)可计算得到可视层上第c个神经元被激活的概率。

其中,sf代表激活函数;0 和1 分别表示神经元未激活和激活的2 种状态。

同理,一旦可视层X=(x1,x2,…,xn) 的状态向量被确定,依据式(8)可计算得到隐含层上第l个神经元的激活概率。

其中,RBM1的参数集合λ1可以通过最大对数似然函数的方法确定,计算公式如下:

其中,Xt表示第t个输入样本;N为输入样本的总数。

在DBN 的训练过程中,其他RBM 的参数可依据上述RBM1的参数计算公式求得,同时利用顶层的误差反向传播算法(back propagation,BP)回归层实现输出信息的拟合预测,并对DBN 的网络参数进行微调。

2.2.2 改进后的深度置信网络

在综合能源系统中,由于IES 的多元负荷与众多影响因素相关,因此相较于单一能源系统,其负荷预测模型的复杂程度势必更高,可能会导致模型在训练过程中出现“过拟合”的问题。为了避免上述问题的出现,本文采用Dropout 技术[18-19]对DBN 神经网络进行了改进,改进后的DBN 神经网络如图3所示。

图3 改进后的DBN 神经网络

其中,基于Dropout 技术改进后的DBN 网络参数训练流程如下。

(1)随机删除DBN 中隐含层上的部分神经元。即,隐含层上部分神经元的输入输出变为0,其他神经元保持不变。

(2)小批量训练样本通过Dropout 后的神经网络进行前向传播,获得Dropout 处理前后的输出损失值。

(3)将步骤(2)中的损失值通过Dropout 后的神经网络进行反向传播,并在剩余神经元的基础上按照随机梯度下降算法实现DBN 的网络参数更新。

(4)恢复步骤(1)中被删除的神经元(此时,之前被删除神经元的参数保持不变,未被删除的神经元在步骤(1)和步骤(2)中已经更新),并换下一小批量训练样本执行步骤(1)至步骤(4)。

重复执行上述步骤,直至DBN 模型训练结束。

3 IES 的多元负荷预测流程

本文所提的基于知识-数据混合驱动的综合能源系统多元负荷预测流程如图4 所示。该预测流程主要包含离线训练和在线评估两部分内容。在离线训练过程中,为了避免IES 负荷预测模型出现过拟合、提高模型的泛化能力,本文先是利用随机森林算法[20]对输入数据进行预处理,提取与预测结果相关性程度强的特征变量作为IES 负荷预测模型的输入,以此来降低输入数据的复杂性;然后利用Dropout 技术将深度置信网络中的部分神经元进行稀疏化处理,从而有效地提高了IES 负荷预测模型的泛化能力,降低模型的过拟合风险;最后基于纵向对比方法对不同隐含层层数、同一隐含层上不同神经元个数下IES 负荷预测模型的预测精度进行分析对比,从而获得IES 负荷预测模型的最优网络架构,并以此进行模型的训练。

图4 基于知识-数据混合驱动的综合能源系统多元负荷预测流程

3.1 输入变量和输出变量的选取

由于本文所提方法是一种知识-数据混合驱动的IES 负荷预测模型,因此在该模型的训练过程中,输入样本数据不仅包含历史负荷、温度、风速、光伏和风电等传统数据集,还包括2.1 节计算得到的电能、气能、热能以及储能的充放电功率等数据信息;输出数据为当前时刻的负荷数据。为了避免某些特征对IES 负荷预测模型的预测结果产生不好的影响,本文在对IES 负荷预测模型进行训练之前采用了随机森林算法对各种特征的相关性程度做了定量分析,以此筛选出与预测结果相关性程度强的输入特征。文章选取相关性程度大于0.3 的特征作为输入变量,并选取当前的电、气、热负荷作为输出变量。其中,基于随机森林算法实现某种特征相关性程度的定量分析过程如下。

步骤1将袋外数据(out-of-bag,OOB)样本编号为r=1、2、3…、R,每个样本包含p个特征。

步骤2设置r=1,基于训练样本建立决策树,并将袋外数据记为

步骤3利用决策树实现的预测,并计算袋外数据的预测误差,记作

步骤5对于r=2、3、…、R,循环执行步骤2~4。

步骤6定量计算特征Xs的相关性程度

基于上述特征相关性程度的定量分析方法可以实现重要特征的筛选,降低了输入变量的维度,进一步提升了模型的泛化能力。

3.2 离线训练

步骤1将采集到的历史负荷、温度、风速、风电和光伏等原始样本数据、储能充放电功率数据以及2.1 节计算所得的电能、热能、气能数据信息进行重构,获得新的样本数据库。

步骤2将新的样本数据分为训练集和测试集,同时为避免不同变量之间的单位差异给IES 负荷预测结果带来的影响,本文对新的样本数据进行归一化处理,数据归一化的计算公式如下:

其中,vbase、vreal分别为样本数据归一化后的基值和样本数据的实际值,vmax、vmin分别为样本数据的最大、最小值。

步骤3逐层进行无监督训练。在对改进后的DBN 神经网络进行训练时,首先将新的样本数据集划分为若干组的小批量样本数据,然后随机选择一组小批量样本数据用于Dropout 技术改进后的DBN神经网络训练,从而获得DBN 神经网络的权重和阈值参数。

步骤4通过DBN 模型顶层的BP 网络实现输出信息的预测拟合,并对模型的网络参数进行反向微调。

本文定义平均绝对百分比误差(mean absolute percentage error,MAPE)为IES 负荷预测模型的预测精度指标,MAPE 的计算公式为

式中,yreal(h)、ypre(h) 分别为h时刻下各类负荷的实际值和预测值,N为样本数据的总数。

3.3 在线预测

步骤1对于综合能源系统的规划调度人员,可根据量测采集到的典型日内负荷数据、能源数据和天气数据等信息,形成综合能源系统负荷预测模型的输入数据。

步骤2依据式(11)对输入数据进行相应的归一化处理。

步骤3将归一化处理后的数据输入到已经离线训练完备的深度置信网络模型中,获得对应的输出数据。

步骤4将输出数据进行反归一化处理,得到IES 多元负荷的预测值,并基于式(12)计算得到各负荷的预测精度指标。

4 算例分析

为了验证本文所提方法的有效性,本文利用Matlab 平台实现了基于知识-数据混合驱动的综合能源系统多元负荷预测。其中,实验仿真所用数据均采集于南昌某工业园区内的综合能源系统,该综合能源系统不仅包含了用于满足不同能源需求的热电联产机组、燃气锅炉、电制热设备等能源转换设备,还配置了相应的电、热、气储能装置来提高系统运行灵活性和经济性。其中,该系统中能源的分配系数以及设备的能源转化效率可见表1 和2。

表1 综合能源系统中不同能源的分配系数

表2 综合能源系统中不同设备的能源转化效率

4.1 预测实例

本文算例选取上述综合能源系统2018 年一整年的小时级数据作为原始样本数据,将2018 年1 月1 日至2018 年3 月30 日的春季数据作为传统单一数据驱动模型的原始训练样本数据和知识-数据混合驱动模型的新训练样本数据的基础;并选取2018年3 月31 日这一典型日的对应信息作为测试样本数据,分别对2 种模型进行预测分析。

为了进一步分析传统单一数据驱动模型和本文所提方法在输入变量选择上的差异,本文基于随机森林算法的特征选择方法分别对2 种模型的输入特征进行了相关性程度的定量分析。上述2 种模型的特征相关性重要程度分析结果分别如附录A 和附录B 所示。

4.2 数据驱动模型的最佳网络架构选取

由于本文所提方法中的数据驱动模型是一种深度置信网络算法,而该算法的预测效果很大程度上依靠于网络架构的选取。因此,本文在实验仿真过程中采用了一种纵向对比方法对深度置信网络模型中隐含层的层数以及各隐含层上的神经元个数进行分析对比,以此来选取数据驱动模型的最佳网络架构。其中,传统单一数据驱动模型和本文所提方法中的数据驱动模型在不同网络架构下的MAPE 值分别如图5(a)和(b)所示。

图5 在不同网络架构下2 种模型的预测效果

由图5(a)和(b)可知,在本算例中,传统单一数据驱动模型和本文所提方法中的数据驱动模型的最优隐含层层数分别为5层和4层、各隐含层上神经元的最佳个数分别为400、300、600、600、500 和300、500、700、500、300。此外,由图5 可知,本文所提方法中的数据驱动模型在相同的网络架构下的MAPE 值都要小于传统单一数据驱动模型。

4.3 结果分析与对比

本文依据4.2 节中实验仿真所获得的最佳网络架构分别对传统单一数据驱动模型和本文所提方法中数据驱动模型进行离线学习,从而得到训练完备的IES 负荷预测模型。为了进一步分析网络架构对综合能源系统中不同负荷预测效果产生的影响,表3和表4 给出了不同隐含层层数和神经元个数下传统单一数据驱动模型和本文所提方法的MAPE1、MAPE2和MAPE3值,同时将MAPE1、MAPE2和MAPE3分别记为电负荷、热负荷和气负荷的预测精度指标。其中,表3、表4 中2 种模型的隐含层总数都设置为5 层,对应隐含层上的神经元个数分别为400、300、600、600、500 和300、500、700、500、300。

表3 传统单一数据驱动模型的各负荷预测结果

表4 本文所提方法的各负荷预测结果

从表3 和表4 中可以看出,无论是传统单一数据驱动模型还是本文所提方法,多隐含层的网络架构下的IES 负荷预测结果都要明显优于单隐含层,且在相同数量隐含层的情况下,表4 中IES 的各负荷预测精度都要高于表3。然而,神经网络中的隐含层数越多也不意味着IES 的各负荷预测效果越好。如表4 所示,本文所提方法中数据驱动模型的隐含层层数为4 层时的IES 多元负荷预测精度要高于其隐含层层数为5 层的情况,且此时的电、热、气3 种负荷的MAPE1、MAPE2和MAPE3值最低,仅为3.99%、3.27%和3.66%,此时的IES 多元负荷预测模型已经达到非常令人满意的精度了。除此之外,相较于表3 中的传统单一数据驱动模型,表4 中本文所提方法的离线训练和在线预测时间几乎保持不变,且能满足IES 负荷的在线预测要求。由此可见,相较于传统单一数据驱动模型,本文所提方法确实有助于提高综合能源系统中多元负荷的预测精度,且由于本文所提方法充分考虑了综合能源系统中的能量耦合特性知识,极大地保留了综合能源系统中非线性的强因果关系,因此文中所提方法具有更好的可解释性。

为进一步验证本文所提方法相较于传统单一数据驱动模型所体现出来的优越性,本算例将两者的网络架构都设置为最优,并利用测试样本对本文所提方法和传统单一数据驱动模型的泛化能力进行对比分析。其中,传统单一数据驱动模型和本文所提方法的多元负荷预测结果如图6、7 所示。

图6 传统单一数据驱动模型的多元负荷预测结果

由图6 和图7 可知,传统单一数据驱动模型的电、热、气负荷预测结果曲线虽然总体上能够跟踪实际值的变化趋势,但部分时段仍然存在较大的预测误差。而考虑了综合能源系统中能量耦合特性知识的本文所提方法下的电、热、气负荷预测结果曲线与实际值的变化趋势非常接近,且具有较高的预测精度。

图7 本文所提方法的多元负荷预测结果

综上所述,相比于传统单一数据驱动模型,本文所提方法不仅能有效地提高IES 多元负荷的预测精度,还保留了综合能源系统中的能量耦合特性知识,保证了IES 负荷预测结果的可靠性。

5 结论

本文以综合能源系统为研究对象,提出一种基于知识-数据混合驱动的综合能源系统多元负荷预测方法,其主要贡献可总结如下。

(1)本文将综合能源系统中的能量耦合特性知识模型与数据驱动模型进行了有效的结合,通过对基于能量耦合特性知识模型计算得到的能源供应量和原始样本数据进行重构,可获得用于训练数据驱动模型的新样本数据。算例结果表明,通过本文所提方法训练完备的IES 负荷预测模型相较于传统单一数据驱动模型不仅具有较好的可解释性,还有助于改善该负荷预测模型的预测效果。

(2)本文考虑到综合能源系统中多元负荷与其他影响因素之间的相关性,利用随机森林算法对不同特征的相关性程度做了定量分析,从而提高了模型的计算效率。此外,为避免模型出现过拟合,文章利用Dropout 技术对DBN 神经网络进行了处理,进一步提高了模型的泛化能力。

(3)在数据驱动模型的训练过程中,本文利用纵向对比方法可以较快地选择出具有最佳网络架构的数据驱动模型,避免了因网络架构随机性给模型预测结果带来的影响。

(4)在之前的IES 负荷预测研究中,通常是利用历史负荷、气象信息等数据作为训练样本。而本文在此基础上还考虑了风电、光伏等可再生能源出力、储能以及不同能源供应对未来负荷预测产生的影响,进而更接近综合能源系统的实际运行工况。

附录A

表A1 电负荷与其他特征间的相关性程度

附录B

表B1 电负荷与其他特征间的相关性程度

猜你喜欢
神经元驱动负荷
基于模糊PI控制的驱动防滑仿真系统分析
《从光子到神经元》书评
屈宏斌:未来五年,双轮驱动,砥砺前行
轨旁ATC系统门控柜接收/驱动板改造
跃动的神经元——波兰Brain Embassy联合办公
防止过负荷时距离保护误动新判据
主动降负荷才是正经事
基于S3C6410的Wi-Fi驱动移植实现
负荷跟踪运行下反应堆一回路控制系统仿真与验证
基于二次型单神经元PID的MPPT控制