基于大数据分析的城市热网负荷综合预测研究

2023-01-14 05:33果泽泉蒋雅玲
能源工程 2022年6期
关键词:热网供热气象

果泽泉,蒋雅玲

(京能东风〈十堰〉能源发展有限公司,湖北 十堰 442002)

0 引 言

随着集中供热体系更新,分户计量采暖系统推广,如今对热网系统能源的高效利用提出更高要求[1],其中热网负荷预测对热网系统调度生产具有重要指导意义。为实现节能减排目标,建立智慧热网平台是大势所趋。热网负荷预测不仅有利于提高运行的安全性、稳定性与经济性,也是电厂调度的重要依据之一[2]。但运行中热网负荷变化复杂,利用传统方式来确定负荷比较困难。目前短期负荷预测方法大致两类:数理统计法和智能预测法[3]。数理统计法如时间序列法、回归分析法等简单易实现,但难以描述负荷的变化特点。智能预测法是利用机器学习的方法,其主要包括随机森林、人工神经网络等算法,记忆和学习以往数据,预测未来数据。

近年来,深度学习在搜索技术、数据挖掘、自然语言处理等领域都取得了很多成果[4]。在负荷预测方面,例如:宗玲等[5]用人工神经网络对热网负荷进行短时预测。陈卓等[6]基于LSTM(长短期记忆人工神经网络)预测短期电力负荷。但对于热网负荷的研究来说,以往很少采用LSTM深度学习算法来进行研究,而本文则尝试采用LSTM建立短期热网负荷预测模型,基于此创建智慧供热平台,以预测换热站及热源锅炉负荷,重点结合气象数据预测未来几小时内供热负荷,进而实现换热站与锅炉协同,形成闭环控制流程,实现对热网系统的综合调度。

1 LSTM长短期记忆神经网络

1.1 RNN循环神经网络

LSTM的原理要从RNN循环神经网络[7]说起。深度学习是模仿人类大脑的算法[8],RNN是深度学习的一种,其允许信息持久化。RNN循环展开图如图1所示。A为神经网络内部隐藏层,Xt为输入数据,ht为每个隐藏层的输出结果。每个隐藏层有两个输入来源,分别为Xt和上一隐藏层的输出量。RNN如同普通神经网络的复制,通过循环过程,信息从上一步传至下一步。因此,RNN很适合用于处理时间序列数据。

图1 RNN循环展开示意图

1.2 长期依赖问题

RNN能连接先前信息和当前需要处理的问题。但在很多情况下,RNN并不尽如人意,诸多因素影响算法发挥。例如,信息和预测位置的间隔过大,RNN会丧失学习相关信息的能力,这就是长期依赖问题[9]。理论上,优化相关参数,RNN可以处理间隔长的问题。但在实际中,会增加工作量,且发挥并不尽人意。Bengio等于1994年对此问题进行研究,发现一些使训练RNN很困难的根本原因[10]。

1.3 LSTM长短期记忆人工神经网络

Long short term memory,简称为LSTM,是RNN的一种。LSTM由Hochreiter和Schmidhuber于1997年提出[11],2013年被改进[12]。相较RNN隐藏层,LSTM隐藏层更复杂[13],LSTM有“门”的结构,用于增加、减少信息,其包含一个σ神经网络层和一个按位的乘法操作。σ层输出[0,1]的数值,描述每个门有多少量通过。0代表“不许任何量通过”,1代表“允许任意量通过”。如图2所示,LSTM拥有三个门[14],分别是Input gate(输入门),Forget gate(遗忘门),Output gate(输出门)。用公式表达为:

图2 遗忘门,输入门,输出门示意图

式(1)为遗忘门的计算,其中σ为激活函数,将输出量控制在[0,1]。xt为输入量,ht-1为上一步的输出量,这一层作为输入量输入。Wf,Wi及bf,bi,bc,b0为参数矩阵,隐藏层通过这些参数进行运算。式(2)、式(3)、式(4)为输入门的计算。其中,it为输入门的输出,Ct表征细胞状态。tanh层会创建新的向量˜Ct,用于更新细胞状态。式(4)对状态进行更新,将Ct-1更新为Ct,把旧状态与ft相乘,丢弃掉不需要的信息,接着加上it·˜Ct,从而创建新的候选值,由此决定状态的更新度。式(5)、式(6)为输出门的计算,0t为输出门的输出结果。细胞状态通过tanh层计算,得到一个[-1,1]的值,并将其与输出门结果0t相乘,最终输出结果ht。经过多次隐藏层计算,实现对运算结果的保留和遗忘,以处理和学习连续性数据,这就是LSTM深度学习的主要原理。

2 数据处理和模型建立

2.1 数据来源

热网数据取自湖北省某地级市,共五条管线供热数据。选取热网负荷及气象数据较为完整的2022年2月12日至2022年3月3日二十日的负荷数据及气象数据,时间间隔为1小时,共480条热网数据。

2.2 数据预处理

实际数据中一般存在缺失值、离群值和噪声,在建模前需要对数据进行预处理。确保数据计算和分析是准确有意义的[15]。对数据进行逐条检测,有缺失数据6条,缺少气象数据中温度、湿度、风速、风力四项。由于气象数据具有连续性,则可采用前后数据的平均值来填补。其中,风力一项为整数值,使用平均值替代会产生小数,故采用上一小时风力数据来填补。填补后,筛查数据范围,去除异常值,保证数据有效性,提高模型学习的准确度。对数据进行如表1内的筛查。

表1 数据范围

2.3 构造数据集

本模型目标是用预测时间点过去时间内供热负荷相关数据,对未来6小时内供热负荷进行预测。选定与供热负荷有关的气象数据和小时数作为输入量,初次记忆时间为24小时。要实现预测时间为6小时的目标,需要对应输入量和输出量的时序。数据重组划分后,按照8∶2划分深度学习的训练集和测试集,并对数据归一化处理,使数据符合标准正态分布[16]。数据归一化可以加快模型训练速度,同时提高预测准确度。数据归一化公式为:

其中Xnorm、Xmean、Xstd、X分别为归一化后的数据平均值、训练集数据标准差、原始数据。利用式(7)对测试集数据标准化需要使用训练集的均值和标准差,以避免模型在学习之前提前接触到测试集的信息。

2.4 模型建立

针对本文的神经网络模型,本文使用深度学习平台Tensorflow[17]与python计算机语言进行模型训练与测试。首次建模,设定一层LSTM隐藏层,一层输出层的Dense层,输出量维度为6,loss设为mse(均方误差),Dropout设为0.1,防止过拟合,迭代次数为100。求解器采用Adam,Adam由Kingma和Lei Ba于2014年提出,其结合Adagrad和Rmspop的优点[18],有着实现简单、计算高效、能自动调整学习率等优点[19]。

对测试集、训练集loss值绘图,如图3所示。模型训练集、测试集loss随迭代减小,直至收敛趋于零。向模型输入测试集验证,得到预测值。对预测值反归一化处理,得到实际预测值。与实际值对比,拟合优度如表2所示,绘制对比图如图3所示。

图3 训练集,测试集损失

表2 R2(拟合优度)表

图4 预测值与实际值对比(1时,6时)

对于初次建模结果,R2低,拟合程度差,需要对模型进行调参,使模型具有更好的泛用性。

2.5 模型调参

为进一步优化模型,需要调整模型参数。首先对模型迭代计算,查看运算结果,并对不同模型设立一个共同误差评价指标,确立最佳模型。将模型定义为函数进行迭代,修改学习记忆小时数、LSTM内部隐藏层数目、输出层维度Dense、神经元个数等参数,设定迭代值,得到多个的预测模型(见表3)。

表3 不同模型迭代值

如表3所示,修改参数寻找最佳模型,迭代次数3×3×3×2=54次,生成54个模型。选定测试集平均绝对百分比误差mape为评价指标确定最佳模型,mape为能够衡量预测准确性的统计指标,是百分比值。不同模型结果如表4所示。

表4 不同模型预测误差

其中绿色标记为原模型,黄色标记为优秀模型(mape<25),计算优秀模型R2,结果如表5所示。

表5 不同模型R2

模型(32)对比其他模型,明显拟合程度好。新旧模型拟合程度对比如表6所示。

表6 R2对比

新模型拟合效果明显优于原模型,将新模型预测结果与负荷实际值进行可视化对比,如图5所示。

图5 预测值与实际值对比

2.6 特征重要性分析

为了解特征对供热负荷的影响,需要对特征进行重要性分析。LSTM隐藏层内部算法复杂,无法像有些机器学习算法一样直接查看特征重要性[20],所以要定义特征重要性[21]。对于已训练的模型,可在不改变参数和模型的情况下去除测试集内某一项特征或在某一项特征中添加噪声的方式来重新预测,然后用相同的模型误差评价指标来衡量两次预测的差距。若去掉的是重要特征,模型精度会明显下降,若是不重要特征,模型精度则不会明显下降。由此可对特征重要性进行排名,模型评判指标选择平均绝对百分比误差mape。为不改变原模型结构,将要测试的特征设为平均值来去除这一项的影响,即将归一化处理的测试集特征数据置为0。利用原模型重新预测结果如表7所示。并进行可视化处理,以此得到直观的特征重要性排名如图6所示。

表7 不同特征去除后平均绝对百分比误差对比

图6 特征重要性排名

由此得出,风速、温度、风力对供热负荷的影响大;小时数、湿度对供热负荷的影响小,太阳辐射对供热负荷基本无影响。天气预报中数值最准确的是温度一项,观察温度与供热负荷关系图,如图7所示,虽然一天内供热负荷有波动,但随着温度升高,供热负荷整体有明显下降趋势。因此,有针对性地结合温度数据能有效提高模型预测精度。

图7 供热负荷随温度变化曲线

基于LSTM预测模型,参考供热管网运行和气象的实际情况,结合智慧热网平台实时生成的负荷和气象数据,建立如图8所示的自学习的全网热负荷预测系统,可以看到,预测值能在一定程度上贴合实际值,随着实际运行数据的增加,预测精度能够进一步提升。该系统还可显示过往供热负荷、气象数据并结合天气预报数据来预测未来供热负荷,并生成曲线直观显示。其能为供热系统运行、故障处理以及过往数据查询提供依据。并为节能减排、提高热网经济性等提供优化方向。

图8 全网热负荷预测系统界面

3 结 论

本研究基于LSTM长短期记忆神经网络,结合供热负荷及气象数据,编写了热网时序供热负荷预测程序,通过进一步调节参数优化模型,减小预测误差,完善预测程序,并佐以对数据各特征按重要性排名的方式来分析模型。主要结论如下:

(1)收集整合智慧热网平台数据,建立初步预测模型,迭代优化预测模型。通过调参进一步提高模型精度。

(2)对比预测值与实际值,预测数据反映供热负荷趋势,虽有一定误差,但在可接受范围内。随着平台数据增加,预测结果会更准确。

(3)按重要性对数据各项特征进行分析并排名。其中温度、风力、风速为最重要特征,其他特征与供热负荷关联不大。了解特征重要性后,智慧供热平台可结合未来气象温度更具针对性地优化供热策略。

猜你喜欢
热网供热气象
气象树
热网异常工况的辨识
近期实施的供热国家标准
供热一级管网水力计算及分析
新建热网与现状热网并网升温方案
基于动态三维交互的二级热网仿真系统
浅谈直埋供热管道施工工艺
关于热网换热站节能监管与应用探究
《内蒙古气象》征稿简则
大国气象