岳伟民, 刘青荣
(上海电力大学 能源与机械工程学院, 上海 200090)
随着社会经济的快速发展,能源利用与环境保护的协调发展面临重大挑战[1]。在此基础上,构建清洁高效的综合能源系统(Integrated Energy System,IES)以提高能源利用效率、减少碳排放成为当务之急。IES作为一种新型能源供应模式,通过冷、热、电等多种能源形式的耦合,实现多种能源类型的灵活转换、高效分配和有机协调[2]。准确的多元负荷短期预测是IES可靠、经济运行的前提[3]。
目前,针对单一负荷预测已取得较多成果。在电力负荷预测方面,人工神经网络[4]、支持向量回归[5]、长短期记忆(Long and Short-Term Memory,LSTM)神经网络[6]等常被用于电力负荷预测。李文武等人[7]提出了一种基于多阶段优化的变分模态分解和粒子群算法优化支持向量回归的短期电力负荷预测模型。李婧等人[8]提出了一种基于遗传算法和传统径向基函数的短期电力系统负荷预测方法。在冷/热负荷预测方面,LI A等人[9]利用LSTM神经网络和注意力机制来预测建筑的冷负荷消耗。LING J H等人[10]采用反向传播神经网络模型和支持向量回归模型来预测建筑热负荷需求。
在IES多元负荷预测方面,吴伟杰等人[11]首先利用变分模态分解方法对冷热电负荷进行分解,然后采用样本熵对分解后模态分量进行重构,最后采用纵横交叉算法优化深度信念网络对重构后的分量进行预测。李守茂等人[12]提出了一种基于改进粒子群算法和小波神经网络的IES短期负荷预测方法。然而,由于不同负荷之间的耦合特性被忽略,这些方法不能直接应用于IES多元负荷预测,因此在现有研究基础上,本文提出一种新的IES多元负荷预测模型。首先,运用Pearson相关系数(Pearson Correlation Coefficient,PCC),选取与冷热电负荷相关性较大的影响因素作为模型的输入,然后将其输入到由LSTM神经网络构成的多任务学习(Multi-Task Learning,MTL)共享层中,充分挖掘多元负荷数据的复杂耦合信息,用以提高预测精度。
为了提高模型的预测精度并降低预测的复杂度,采用PCC来评估两个正态连续变量之间的线性相关性。该变量在-1和1之间变化[13],两变量的相关系数rxy可表示为
(1)
变量的相关程度由相关系数的绝对值决定,绝对值越大,相关性越强。本文使用的相关系数分类如表1所示。
表1 相关系数范围
LSTM神经网络结构如图1所示。LSTM神经网络基于循环神经网络(Recurrent Neural Network,RNN)的结构,通过添加输入门、遗忘门和输出门来学习时间序列中的长期和短期依赖信息[14]。输入门用于确定在当前时刻应该向记忆元胞添加多少最新信息;遗忘门用于决定可以丢弃多少先前的信息;输出门旨在更新记忆元胞的状态并输出更新后的结果。
图1 LSTM神经网络结构
it=σ(Wi[ht-1,xt]+bi)
(2)
(3)
式中:Wi——输入门在t时刻的权重矩阵;
wc——t时刻候选状态的权重矩阵;
bi,bc——偏置向量;
σ,tanh——Sigmoid激活函数和tanh激活函数。
遗忘门信息ft由输入值xt和t-1时刻的隐藏层输出值ht-1组成。其计算公式如下
ft=σ(Wf[ht-1,xt]+bf)
(4)
式中:Wf,bf——遗忘门在t时刻的权重矩阵和偏置向量。
基于输入门和遗忘门的作用,记忆单元Ct完成其状态的更新。其计算公式如下
(5)
式中:Ct-1——记忆单元Ct在上一时刻的状态值。
输出门信息ot由输入值xt和t-1时刻的隐藏层输出值ht-1组成。其计算公式如下
ot=σ(Wo[ht-1,xt]+bo)
(6)
式中:Wo,bo——输出门在t时刻的权重矩阵和偏置向量。
隐藏层输出值ht由输出门信息ot和记忆单元的状态值Ct计算得出。其计算公式如下
ht=ottanh(Ct)
(7)
IES中不同的能源系统通过能量转换元件的能量流形式进行耦合,数据中存在大量关于能量转换的共享特征。这些特征难以用传统的人工特征方法提取。MTL通过共享信息来学习和获取多个相关问题的知识,能够有效利用IES复杂的能量转换共享信息[15]。MTL在处理一个问题的过程中可以通过使用共享层来学习,并获得其他相关子任务所提供的辅助耦合信息,进而达到提高模型输出精度与增强泛化能力的目的。MTL的共享机制结构如图2所示。其中,X1,X2,X3,…,XN为输入。
图2 MTL共享机制结构
(8)
式中:wt——权重系数;
本文提出的基于PCC-LSTM-MTL的综合能源系统多元负荷预测模型如图3所示。首先利用PCC选出合适的因素作为模型的输入变量,然后将其输入到由LSTM神经网络构成的MTL共享层中,充分挖掘多元负荷数据的复杂耦合信息,提高预测精度。
图3 PCCLSTMMTL网络预测模型
本文选择亚利桑那州立大学的Campus Metabolism系统所提供的Tempe校区电、冷、热负荷历史数据作为实验数据[16],所有数据采样时间为2019年1月1日0时至2019年12月31日24时,其中以2019年12月负荷数据为测试集,剩余数据的80%为训练集,20%为验证集。
除了考虑负荷间的耦合关系外,多元负荷预测还应考虑天气因素和日类型[17]。然而,过多的输入特征不仅不利于网络训练,而且增加了计算负担。因此,应合理量化各个特征对负荷的影响程度,筛选出影响不大的特征。本文采用PCC分析计算冷、热、电负荷与各个特征之间的相关性,结果如表2所示。
表2 各影响因素的相关系数
因为本文采用MTL,只要其中一个相关系数大于0.5,就将该因子设置为输入特征。由于日类型仅用于分类,不参与相关系数的计算,因此本文将电负荷、冷负荷、热负荷、干球温度、大气压力和日类型设置为模型的输入特征,其中日类型包括小时数和节假日信息。
为了反映本文提出的模型的预测性能,选取平均绝对百分比误差(MAPE)和均方根误差(RMSE)作为评价指标。这两个评价指标定义如下
(9)
(10)
式中:yI——实际负荷值;
y′i——预测负荷值;
M——样本总数。
目前,LSTM的超参数选择尚无完善的理论指导。关于LSTM在负荷预测方面的应用,现有大部分研究设置LSTM层数为2~5,每层神经元个数基本不超过200[18]。对于神经网络,当输入数据不是很大时,3层结构能够拟合任意函数[19]。因此,本文LSTM神经网络选择了3层结构,设置各层神经元个数分别为16,32,64。另外,设置LSTM的时间步长参数为24,批大小为128。
为了验证PCC-LSTM-MTL模型在IES多元负荷预测场景中的优越性,将LSTM-MTL和LSTM模型设置为对比模型。计算各种方法在测试集上的MAPE和RMSE指标,结果如表3所示。其中,PCC-LSTM-MTL取得了最好的预测效果,LSTM-MTL次之,未采用PCC和MTL的LSTM模型效果最差。以电负荷预测为例,相比于MTL-LSTM和LSTM,PCC-LSTM-MTL的RMSE分别降低了7.93%和9.52%,MAPE分别降低了5.71%和13.46%。
表3 模型精度对比
截取2019年12月8号0时至2019年12月15号24时预测结果如图4~图6所示。从结果来看,PCC-LSTM-MTL和LSTM-MTL模型对电、热、冷负荷的预测整体都比较准确,但在峰谷时刻负荷波动较大时,PCC-LSTM-MTL模型能更加准确。
图4 电负荷预测结果
图5 冷负荷预测结果
图6 热负荷预测结果
PCC-LSTM-MTL模型首先通过PCC提取与电、冷、负荷相关性较大的输入特征,然后利用共享层学习多元负荷之间的复杂耦合信息,在单一负荷波动较大时能够有效利用学习到的耦合特征来减少预测误差,更好地拟合出负荷变化趋势。
本文针对IES 提出了一种基于PCC-LSTM-MTL的多元负荷预测方法,并以亚利桑那州立大学Tempe校区电、冷、热负荷历史数据作为实际算例,得出以下结论。
(1)与LSTM模型相比,LSTM-MTL和PCC-LSTM-MTL模型通过共享层模拟冷、热、电负荷间的耦合特性,有效提高了预测精度。
(2)相比于LSTM-MTL模型,PCC-LSTM-MTL模型采用了PCC选取合适的影响因素作为输入变量,提升了输入变量与目标变量的相关性,使得模型的整体预测性能更好。