基于改进神经网络算法预测康定市某小区供热负荷

2024-02-08 00:00:00张利俊安文含周晓璇刘吉营
四川建筑 2024年6期
关键词:主成分分析法预测模型遗传算法

【摘要】

为了提高供热负荷预测的准确性,研究提出了一种基于主成分分析法和遗传算法优化的反向传播神经网络(Principal Component Analysis-Genetic Algorithm-Back Propagation,PCA-GA-BP)预测模型。该模型首先采用PCA从原始集中供热监测数据中提取了4个主成分,作为BP神经网络输入参数,去除了输入变量之间的冗杂与相关性,随后,利用GA对BP神经网络的权值和阈值进行优化,以此构建PCA-GA-BP热负荷预测模型。选取康定市居住建筑供热系统实际运行的热力数据作为模拟实验样本,对优化前后模型的性能进行比较验证。研究发现,PCA-GA-BP神经网络预测模型的平均绝对百分比误差低至10.287%,比传统的BP神经网络预测模型的MAPE减少了6.636%,显著提高了供热负荷预测的准确性。

【关键词】供热负荷,主成分分析法,遗传算法,预测模型

【中图分类号】TU832.02【文献标志码】A

[定稿日期]2024-10-11

[基金项目]山东省自然科学基金(项目编号:ZR2021ME199),山东省高等学校青创人才引育计划创新团队项目(项目编号:鲁教科函〔2021〕51号)。

[作者简介]张利俊(1973—),男,本科,工程师,研究方向为暖通空调与节能优化控制。

[通信作者]刘吉营(1983—),男,博士,教授,研究方向为暖通空调与节能优化控制。

0 引言

截止2020年,全国集中供热覆盖面积达到122.66亿m2,因大量燃料燃烧加剧了能源短缺和环境污染问题。2024年,我国政府提出要加快推动建筑领域节能降碳,使得清洁、低碳、高效已成为中国能源发展的必然趋势。传统粗放的供热系统调节方式往往导致供热过程中出现显著的热量损耗和不均匀的冷热分布。在实际供热中,即便能源消耗量大,也难以充分满足热用户的需求[1]。因此,将热负荷预测加入供热系统中指导供热势在必行。

热负荷预测是预测未来一段时间内为保持室内舒适温度所需热量的方法,随着大量建筑能耗数据积累以及人工智能技术在供热领域的应用,机器学习算法已被广泛的应用于热负荷预测[2]。徐欣等[3]采用多元非线性回归方法分析了系统日平均供水温度和节假日效应项为输入变量的回归残差修正模型,实现了对供热负荷的准确预测;Sakkas等[4]利用人工神经网络,建立了集中供热网络负荷预测模型,采用分段多相分析方法,通过改变输入变量的特征和神经网络的结构,逐步优化预测器,研究中开发的优化的全自动预测器产生了更可靠的负荷预测;薛普宁等[5]提出了一种以机器学习为基础的多步递归预测模型,取得了较好的预测效果;于晓娟等[6]在综合室内温度变化的基础上,利用多元线性回归、反向传播神经网络以及网格搜索优化的支持向量机方法,对未来7天的耗热量进行了预测,结果表明,采用网格搜索优化的支持向量机模型在预测精度上表现最佳。

为了提高热负荷预测的准确性,在自变量选择过程中,考虑了气象因素、供热管网性能以及历史负荷等因素[7]。在建模过程中,首先使用主成分分析法(Principal Component Analysis,PCA)对热负荷有影响的特征指标进行融合,去除了输入层参数之间的冗杂和相关性,同时,在对网络进行学习训练的过程中,采用遗传算法(Genetic Algorithm,GA)对网络进行优化,避免网络陷入局部最小值,并加速其收敛。

1 供热数据来源及处理

选取康定某小区供热负荷进行模拟研究,研究区的集中供热系统由热源、管网、热力站、热用户4个主要部分组成,以热水作为热媒,通过管网给热用户供应热能。研究数据来自供热公司热力数据可视化监控平台。供热系统运行数据的导出是以整个供暖季为研究对象的,站点查询的时间范围为2022.10.15—2023.4.15,为增加数据的准确性,查询间隔时间为3 min。模型的输出变量为逐时供热负荷,利用编程对间隔3 min的供热历史运行数据进行逐时筛查,将所有数据采集的时间步长统一处理为1 h。

在历史数据收集过程中,常常由于设备故障、通信中断等因素导致数据出现缺失值和异常值。若这些异常数据未被妥善处理,将会降低数据和预测负荷的正确性。因此,在将数据用于模型训练之前,需进行合理的数据预处理,包括对异常数据和缺失值进行处理,以确保数据集的完整性和可靠性。对于缺失的数据,采用内插法进行填补;对于异常的数据,先使用3σ准则进行查找,再使用内插的方法确定插值并进行数据的代替;对于长时间出现的重复或者缺失,判定为数据采集过程中的异常并将其剔除。

2 输入层参数优化

2.1 初始特征变量的选择

供热负荷受气象因素、系统因素、社会因素以及建筑自身因素等多种因素的影响。随着温度的升高,供热负荷的数值逐渐降低。当温度不变时,随着相对湿度的降低,汗液蒸发作用增强,人体就会感到寒冷,供热负荷也会随之增大。随着风速的增加,供热负荷也会增大。当太阳辐射较小时,供热负荷较大,但其对热负荷影响较小,仅占1%~5%。供热管网自身的一些特性,主要体现在管网流量、供水温度、回水温度等方面。社会因素例如用热习惯、政府政策也会影响热负荷的变动。建筑物自身的结构、使用功能、地理位置等建筑自身因素也会对供热负荷造成影响。然而,热负荷受社会因素的影响,其变化趋势较为缓慢,因而在短期热负荷预测中,这一因素通常可以不予考虑。同时,一旦建筑物建成,其自身特性对热负荷的影响微乎其微。

综上对供热负荷影响因素的初步分析及相关文献综述[8-9],确定了包括室外温度、风速、相对湿度、一网供水温度、回水温度、管网流量、前1天同时刻的逐时热量、前2天同时刻的逐时热量8个初始特征指标。

2.2 主成分分析法

供热负荷受多种因素的影响,但在实际计算中,如果要综合考虑各种因素,则会增加问题的复杂性和求解的难度。利用PCA,可以把对问题有影响的多个初始指标降维为几个主要的有效成分[10],降低了问题分析的难度,该方法主要步骤包括:

(1)数据标准化计算,收集供热负荷m个影响因素的n个样本,则有式(1)~式(3)。

xj-=1n∑ni=1xij,(j=1,2,…,m)(1)

sj=1n-1∑ni=1xij-xj-2,(j=1,2,…,m)(2)

xij=xij-xj-sj,(i=1,2,…,n;j=1,2,…,m)(3)

式中:m为影响因子个数;n为影响因子样本数;xij为第j个影响因子的第i个指标,xj-为第j个影响因子的样本均值;sj为第j个影响因子的样本标准差;xij为标准化指标。

(2)计算相关系数矩阵R=(rij)m×m的特征值和对应的特征向量,rij代表第i个和第j个影响因子的相关系数,如式(4),将特征值从大到小进行排序,由特征向量构成了m个新的综合变量,如式(5)。

rij=∑nk=1xki×xkjn-1,(i,j=1,2,…,m)(4)

F1=u11x1+u21x2+…+um1xm

F2=u12x1+u22x2+…+um2xm

……

Fm=u1mx1+u2mx2+…+ummxm(5)

式中:xki为第i个影响因子的第k个标准化指标,Fm为第m主成分;x1、x2、…、xm为标准化处理后的影响因子向量;uj为λj对的特征向量,uj=(u1j,u2j,…,umj),j=1,2,…,m。

(3)计算贡献率和累积贡献率并提取主成分见式(6)、式(7)。

bj=λi∑mk=1λk,(j=1,2,…,m)(6)

αp=∑pk=1λk∑mk=1λk(7)

式中:bj为主成分Fj的信息贡献率;αp为主成分的累积贡献率,取αpgt;90%。

2.3 主成分提取

为了高效减少热负荷预测中初始特征变量数据的空间维度,使用SPSS软件对其进行了降维处理,得到的结果见表1。前4个主成分累积贡献率达到了90.337%,这足以概括原始的8个特征变量所蕴含的信息,因此选择主成分Y1~Y4作为模型的输入数据。

主成分系数表2展示了每一个主成分与每一个变量之间的线性关系。主成分Y1主要与前两天同时刻的瞬时热量、前一天同时刻的瞬时热量、管网流量、回水温度、室外温度有关;主成分Y2、Y3、Y4分别主要与相对湿度、风速、供水温度有关。最终主成分表达式为式(8)~式(11)。

f1=-0.36x1-0.08x2-0.02x3+0.37x4+

0.44x5+0.41x6+0.44x7+0.41x8(8)

f2=0.27x1+0.60x2-0.73x3+0.02x4+0.12x5+0.08x6+0.05x7+0.04x8(9)

f3=-0.42x1+0.70x2+0.43x3-0.25x4+0.01x5+0.23x6-0.06x7-0.16x8(10)

f4=0.18x1+0.33x2+0.31x3+0.73x4+0.03x5-0.47x6-0.03x7+0.05x8(11)

3 供热负荷预测模型

3.1 预测流程

BP神经网络结构包括输入层、隐藏层和输出层,其工作

原理是基于梯度下降算法。在训练过程中,网络通过不断迭代来调整各层神经元之间的连接权重和阈值,目的是减小网络的实际输出与期望输出之间的误差,直至达到最小误差。然而,该过程容易导致网络陷入局部最优解的问题。

GA是一种模拟自然生物进化的方法,能有效的解决非线性、全局寻优等复杂问题[11],利用GA对BP神经网络的权、阈值进行优化,优化后的权阈值再通过BP神经网络训练得到最优结果。PCA-GA-BP流程如图1所示,在进行GA的计算时,首先对所要优化的参数进行编码,并随机地产生一个初始化的群体集,之后以种群择优目标方向为依据,来确定种群的适应度函数。最后,在群体选择、杂交和变异的基础上,采用GA求解。

3.2 参数确定

神经网络输入层为基于PCA提取到的4个主成分,输出层参数为逐时供热负荷,隐含层根据经验式首先试凑出选取范围,再通过分析训练时不同神经网络结构对模型的影响得出最佳个数,确定为10时训练效果最佳见式(12)。

H=I+O+α(12)

式中:α为调节常数,取值一般为1~10;H为隐含层节点数;I为输入层节点数;O为输出层节点数。

训练集和测试集利用PCA处理后的新数据集进行划分,以MATLAB为平台,前80%的数据作为训练集,后20%的数据作为测试集。神经网络的学习速率为0.01,训练目标最小误差为10-4,训练次数为1 000次,动量因子为0.01,将PCA-BP的网络拓扑结构设置为4-10-1。GA-BP神经网络模型参数设置:最大进化代数为30,初始种群规模为10,变异概率为0.2,交叉概率为0.8。

3.3 评价指标

选取了4种精度评价指标分别为均方误差(Mean Square Error,MSE)、均方根误差(Root Mean Square Error,RMSE)、平均绝对误差(Mean Absolute Error,MAE)以及平均绝对误差百分比(Mean Absolute Percentage Error,MAPE)来评估预测模型的精确度,具体定义见式(13)~式(16)。

MSE=1n∑ni=1(xi-yi)2(13)

RMSE=1n∑ni=1(xi-yi)2(14)

MAE=1n∑ni=1xi-yi(15)

MAPE=100%n∑ni=1xi-yiyi(16)

式中:n为样本的个数;xi为第i个仿真模拟值(GJ/h);yi为第i个实际测量值(GJ/h);x-为模拟值平均值(GJ/h);y-为实测值的平均值,(GJ/h)。

MSE、RMSE、MAE、和MAPE越小,表示预测值与实际值误差越小,模型精度越高。

4 结果分析

4.1 仿真实验预测结果对比

通过BP、PCA-BP、PCA-GA-BP算法对样本数据进行训练,并对训练结果进行了验证。实际负荷与预测负荷值对比及误差结果分别如图2、图3所示。

由图2、图3可以得出,通过标准的BP神经网络模型得到的预测值与实测值之间偏差较大,PCA-BP模型得到的预测值与实测值比较接近,当将GA考虑纳入PCA-BP模型,偏差得到了进一步的降低。采用PCA之前,原始输入层参数中存在的变量多重相关性对模型预测精度造成了不利影响,即便经过PCA处理,神经网络的权值和阈值的选取方式仍对模型有影响,预测模型仍有进一步优化的潜力。

4.2 仿真实验预测评价指标对比

为了能直观地看出和比较各预测模型的优化效果,现使用柱状图对包括BP神经网络预测模型在内的多种模型的MAE、RMSE、MSE、MAPE作具体分析。图4为不同模型之间的误差评价指标。由图4可知,PCA-BP神经网络模型的MAE、RMSE、MSE、MAPE均有显著下降,这表示经过PCA降维处理有助于提高神经网络的非线性映射能力,进一步地,采用GA优化后的模型表现更为优异,MAE从0.595 GJ/h降至0.448 GJ/h、MSE从1.086 GJ2/h2降至0.349 GJ2/h2、RMSE从1.0421 GJ/h降至0.591 GJ/h,MAPE则从16.92%降至10.29%,指标降低的更为明显,由此得出,使用PCA-GA-BP模型相较于传统BP模型在供热负荷预测方面表现更佳。

5 结论

研究采用PCA简化BP神经网络的输入层参数、采用GA对神经网络中的权值和阈值进行优化调整,通过对结果分析,验证上述可提高神经网络预测性能,主要结论:

(1)在热负荷预测中,利用PCA对神经网络输入层的数

据进行维度降低,筛选关键特征以减少输入参数的复杂性,实现了从8维至4维的简化。利用GA有效地改进了传统BP神经网络陷入局部最优的不足,进而构建了一个预测精度更优的PCA-GA-BP供热负荷预测模型。

(2)PCA-GA-BP预测模型相比于标准BP预测模型而言,MAE降低了0.147 GJ/h、MSE降低了0.737 GJ2/h2、RMSE降低了0.451 GJ/h,MAPE降低了6.63%。

参考文献

[1] 吴晋涛. 城市集中供热的现状及发展挑战[J]. 当代化工研究. 2018(1): 10-11.

[2] Sajjadi S, Shamshirband S, Alizamir M, et al. Extreme learning machine for prediction of heat load in district heating systems[J]. Energy amp; Buildings, 2016(122):222-227.

[3] 徐欣,田喆. 天津市办公建筑供暖负荷中短期预测, 暖通空调 [J]. 2016, 46(4): 50-54+11.

[4] Sakkas N P,Abang R Thermal load prediction of communal district heating systems by applying data-driven machine learning methods[J]. Energy Reports . 2022(8): 1883-1895.

[5] 薛普宁, 周志刚, 蒋毅,等. 基于机器学习的供热系统热负荷多步递归预测[J]. 煤气与热力, 2019, 39(7): 20-27+42.

[6] 于晓娟, 顾吉浩, 齐承英,等. 几种集中供热负荷预测模型对比[J]. 暖通空调,2019,49(2):96-99.

[7] 王少驰, 刘玉侠, 马东亮,等. 供热系统热负荷预测分析及应用, 区域供热 [J]. 2023(2): 128-139+148.

[8] 赵秉文, 李婉,金宇 基于PSO-LSSVM的供热负荷预测研究[J]. 建筑节能, (中英文), 2021, 49(6): 46-49+78.

[9] 尚海军, 白新奎, 乔, 等. 基于深度学习的区域供热逐时负荷预测研究[J]. 建筑热能通风空调, 2022, 41(9): 6-8+21.

[10] 杜会军. 基于PCA-BP神经网络的智慧建筑暖通空调能耗预测[J]. 制冷与空调(四川). 2023, 37(2): 225-230.。

[11] Gu J, Wang J, Qi C, et al. Medium-term heat load prediction for an existing residential building based on a wireless on-off control system[J]. Energy, 2018(152): 709-718.

猜你喜欢
主成分分析法预测模型遗传算法
基于自适应遗传算法的CSAMT一维反演
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于遗传算法和LS-SVM的财务危机预测
统计与决策(2017年2期)2017-03-20 15:25:24
基于神经网络的北京市房价预测研究
商情(2016年43期)2016-12-23 14:23:13
中国装备制造业阶段竞争力研究
陕西省各地区人力资本水平综合评价与分析
中国石化J分公司油气开发投资分析与预测模型研究
经济师(2016年10期)2016-12-03 22:27:54
基于企业核心竞争能力的家电行业上市公司绩效评价指标体系研究
基于主成分分析法的高校财务风险评价指标体系构建
商(2016年27期)2016-10-17 04:41:37
基于IOWHA法的物流需求组合改善与预测模型构建