基于代理模型模式匹配的锅炉实时操作优化

2023-08-25 08:05钟崴林雪茹林小杰周懿
浙江大学学报(工学版) 2023年7期
关键词:模式匹配锅炉聚类

钟崴,林雪茹,林小杰,周懿

(1.浙江大学 浙江省清洁能源与碳中和重点实验室,浙江 杭州 310027;2.浙江大学 能源工程学院,浙江 杭州 310027;3.浙江大学 嘉兴研究院,浙江 嘉兴 314024)

发展风力、光伏可再生能源发电是推动我国能源改革的必要手段[1-4].我国火电机组占主导地位[5],因此研究如何优化火电机组的运行操作具有必要性与迫切性.燃煤锅炉是主要的耗能设备,如何优化其运行达到高效、低碳是核心问题.于晨龙等[6-9]对锅炉汽机的最佳运行组合及负荷优化问题展开了研究.在实际的执行环节,电厂锅炉的调控模式较粗犷,依赖人的经验展开优化方案的执行,执行效果不佳或难以实施.系统复杂、工况多变,动态调整耗时大,易造成生产波动,降低经济效益.有必要将操作经验数字化,并基于模型进行决策,以辅助人员开展调控工作.

目前,学术界展开以聚类法、回归模型法、在线监测法为代表的锅炉操作数据模型化研究.Song等[10-12]通过聚类的方法实现燃烧效率的最大化,但聚类方法的计算效率较低.吴家标等[13-16]提出回归模型法,解决了聚类法的计算效率难题,但难以适应工况变化和实际的操作模式.Nikula等[17-18]将在线监测法应用于锅炉性能优化,可以监测工况是否属于正常状态或优化状态,但未考虑参数的耦合性能,给出改进方法.随着深度学习的发展,Zou等[19-21]将深度强化学习应用于锅炉的燃烧过程,可以考虑工况的时变和参数的耦合,但深度强化学习模型的可解释性和在连续过程的应用方面研究尚未成熟.

现有的锅炉操作优化研究存在可执行性、工况适应性和计算效率不足的问题,需要进一步探索实时优化[22]场景下的方法.本文提出适用于多工况在线应用的代理模型模式匹配(pattern matching of agent model, PMAM)建模框架,以提升燃煤锅炉的效率,优化锅炉运行.主要贡献如下.1) 提出新的模式匹配方法,解决锅炉操作优化的可执行性问题.2) 提出基于模式匹配方法的优化操作库构建方法,解决锅炉操作优化的工况适应性问题.3) 提出基于神经网络算法的在线应用代理模型,解决锅炉操作优化的计算效率问题.

1 锅炉实时操作优化建模方法

燃煤锅炉转化煤为蒸汽驱动发电,需要控制煤量、风量参数,保证安全并实现需要的蒸汽量.为了提高锅炉效率,需要根据输入的工况数据进行优化操作建议.采用反平衡方法[23]计算锅炉效率,输出给煤机、引风机、送风机的变频数据,以达到效率最高的目标.如图1所示为PMAM锅炉实时操作优化建模方法.该方法基于改进的模式匹配算法及神经网络算法,分为预建模、在线应用2个部分.预建模部分基于考虑滞后及时间窗的模式匹配优化模型,引入注意力机制参数、状态参数区间频率法、调控最小3层方案优化机制,得到各个工况的优化操作,构建工况参数与优化操作的最优代理模型.在线应用部分基于工况参数与优化操作参数的最优代理模型,实现在线优化计算.

图1 基于代理模型模式匹配的锅炉实时操作优化计算框架Fig.1 Boiler real-time operation optimization calculation framework based on pattern matching of agent model

1.1 数据预处理

1.1.1 滞后性计算 锅炉操作中的滞后性主要体现在给煤机的频率与锅炉主蒸汽流量的关系.基于相关性分析,开展滞后性计算.

算法1:滞后性计算

输入:样本个数为n,样本维度为1的样本Y1、Y2,最大滞后时长为tdelayMax

输出:滞后时长tdelay

1) 将样本Y1、Y2归一化,得到Y1n 、Y2n.

2) 构造数据集合dcorr ,第1列、第2列分别为Y1n、

Y2n.

3)foriinrange(-tdelayMax,tdelayMax):

4) 删掉带有空值的行,得到修改后的数据集合dcorr.

5) 计算dcorr的相关性系数,得到维度的相关性系数矩阵.

6) 取dcorr 第1列第3行开始的数据,表征Y1与经过时间平移处理的Y2之间的相关性.相关性系数绝对值最大的时间移动值为tdelay ,即Y1滞后于Y2的时间为tdelay.

设Y1、Y2均为时间长度为n的一维时间序列数据,研究Y1滞后于Y2的时间tdelay,则计算不同时间平移后Y2′与Y1之间的相关性,相关性越大,则认为平移的时间长度越优.

数据归一化方法采用最大最小化方法,具体公式如下:

数据集合dcorr的构造方法如图2所示.将Y2数据集进行时间轴平)移,得到图2的框选部分,时间长度为(n-tdelayMax的数据集即为dcorr.

图2 滞后性计算中的数据重构示意图Fig.2 Schematic diagram of data reconstruction in hysteresis calculation

1.1.2 基于主成分分析及k-均值改进的模糊C均值聚类模型 设置数据集X={XM,XO,XR,XC}⊂R.其中XM为工况表征参数,包括主蒸汽温度、压力与煤质数据等;XO为目标表征参数;XR为关键的状态表征参数;XC为可调控参数;X的总时间维度为n0.根据滞后时间,对数据集X进行时间轴对齐重构,得到新的数据集合为X′={X′M,X′O,X′R,X′C}⊂R,X′的总时间维度为n.

由于不同的参数数据范围不同,对数据集进行最大最小化的归一化处理.为了提高后续模式匹配优化的计算效率,处理后的数据使用主成分分析模型(principal component analysis, PCA)[24]降低维度.PCA降低数据维度的算法如下.

算法2:PCA降低数据维度

输入:样本个数为n,样本特征数为q的样本X,降维后数据特征占比为RlowV

输出:低维样本DlowX

1) 样本的每一列去均值化,得到DmeanMoved.

2) 求协方差矩阵DcovMat.

3) 求协方差矩阵的特征值与特征向量.

4) 将特征值从大到小排序,并依次取出,直到取出的特征值加和大于RlowV,取得对应的特征向量DredE.

5) 计算降维后的数据DlowX=DmeanMoved×DredE.

6) 返回低维样本DlowX、协方差矩阵DcovMat.

针对PCA降维后的数据,采用k-均值(kmeans)改进的模糊C均值聚类模型(fuzzy C-means, FCM)[25]进行工况聚类.记u=[uij]c×n为隶属度矩阵,c为聚类数,聚类中心为v=[v1,v2,···,,其中1≤i≤c,2≤c≤n,q为数据特征数.FCM目标函数如下.

式中:m为模糊指数,控制每个距离平方误差的占比,m≥1.

采用k-means方法改进FCM方法中的初始模糊矩阵生成步骤,可以降低聚类结果的随机性,加快算法的收敛.改进FCM方法的计算步骤如下.

1)初始化聚类参数:c、m、更新迭代阈值ε、迭代次数l、最大迭代次数lmax.其中,更新迭代阈值为2次迭代的模糊矩阵偏差绝对值容忍度.

2)利用k-means聚类法生成初始的模糊矩阵U.

算法3:k-means聚类生成初始的模糊矩阵

输入:样本X、类别数目c

输出:模糊矩阵U

1) 初始化,令l= 0,随机选择c个样本点作为初始的聚类中心ml=[m1l,···,mcl].

2) 对样本进行聚类,计算每个样本到类中心的距离.将每个样本分配到与其最近的中心的所属类,生成聚类结果cl.

3) 计算聚类结果cl中每个类的样本均值,作为新的聚类中心

4) 若符合停止条件(划分结果不再改变或得到迭代次数上限),则终止,输出c*=cl;否则,l=l+1,返回步骤2).

5) 根据c*,计算U.

6) 返回U.

3)计算聚类中心:

4)更新模糊矩阵:

5)若‖Ul+1-Ul‖<ε或l>lmax,则终止计算;否则l=l+1,跳转至步骤3).

1.2 考虑时间窗口的模式匹配优化模型

经过模型聚类后,得到分类后的数据集:

为了避免测量误差和异常操作的影响,考虑时间维度的因素,将锅炉操作参数模式匹配优化视为带时间序列属性的问题,选取一段时间窗口的数据进行模式匹配优化计算.

对于类别i第z个时间点,设时间窗长度为tdeta.步骤1)~5)为工况注意力机制参数层,考虑工况参数相对于目标参数的重要性,筛选相似工况.步骤6)、7)为状态参数频率区间层,利用状态参数与锅炉效率的高效区域进行优化.步骤8)为调控最小层,考虑实际的调控习惯,使得建议的操作参数与当前操作参数之间的偏离较小.

1)获取匹配分数下限值cthresholdLow、匹配分数上限值cthresholdUp、关键参数的优先级顺序corderR.

2)根据工况表征参数X′Mi,对目标表征参数X′Oi计 算相关性系数,取绝对值得到注意力参数cak,i.

3)筛选工况表征参数中变动偏差符合匹配分数上、下限的数据,得到更新后的X′Minew.

式中:Q为X′Mi的总时间维度,G为X′Mi的总变量维度.

4)计算[z-tdeta+1,z]时间段的工况表征参数与X′Minew相似度得分,Q′为X′Minew的总时间维度,q为其中的一个时间点,1≤q≤Q′:

5)按相似度得分排序更新X′Minew,得到对应时间的关键状态表征参数X′Rinew、目标表征参数X′Oinew 、操作参数X′Cinew.

6)对于r∈len(corderR),令r= 1: 取出第r个关键状态参数的数据条X′Rinew,:,r,计算最大值cmax与最小值cmin.根据区间单元长度cfreq,将X′Rinew,:,r划分为多个区间,统计每个区间的频率.将连续的区间合并为长度为clend的长区间,ceil为向上取整函数,round 为四舍五入取整函数.

统计连续长区间的频率,按高到低排序,即为筛选后的关键状态参数的区间.

根据目标参数的优化方向,取在该长区间的50%数据,得到筛选后的数据,令X′Rinew等于筛选后的数据;r=r+1.

7)根据输出的关键状态表征参数X′Rinew,更新得到对应时间的工况表征参数X′Minew、目标表征参数X′Oinew 、操作参数X′Cinew.

8)计算z时间点的操作参数X′Ci,z与X′Cinew相似度得分,并按从高到低排序,输出得分最高的X′Ci,z为工况i第z个时间点的优化操作X*Ci,z.

1.3 最优代理模型

利用3层方案模式匹配机制,分别对历史生产数据进行优化,生成优化操作库.为了解决直接搜索优化操作库数据量过大、搜索效率过低的问题,构建基于神经网络算法的最优代理模型.该代理模型以工况参数为输入,以优化后的操作、效率和关键参数为输出.

式中:f为最优代理函数,为类别i第z个时间点的工况数据,X*Ci,z、X*Oi,z、X*Ri,z分别为类别i第z个时间点的优化可操作参数、目标参数、关键状态参数.

在线应用时,采用孤立森林[26](isolation forest)法进行偏离检测.若当前工况非偏离点,则调用式(13)计算优化的操作参数;否则更新预建模的聚类中心与最优代理模型,输出当前的操作参数为优化方案.

2 案例选取

以浙江省某热电公司为案例进行研究.该公司的机组规模为4台蒸汽质量流量为220 t/h的高温超高压循环流化床锅炉.选取1#锅炉数据展开计算实验,并以2#锅炉数据开展验证.选择的工况参数、目标参数、关键状态参数、操作参数如表1所示.

表1 锅炉操作优化计算的相关参数表Tab.1 Table of parameters related to boiler operation optimization calculation

选择历史数据时间段为2022-02-16 22:41—2022-04-29 21:29,时间间隔为1 min,共103 586条数据构成原始数据集.如图3所示,该锅炉正常运行时的锅炉效率为[86.70%, 93.15%].

图3 某热电公司1#锅炉效率的正常运行数据Fig.3 Normal operation data of 1 # boiler efficiency of thermal power plant

3 案例结果与讨论

3.1 滞后性结果

如图4所示为主蒸汽质量流量与给煤机频率之间的关系图.如图4(b)所示为图4(a)的局部放大图.从图4可知,主蒸汽质量流量的变化较给煤机频率的变化存在滞后.设置最大滞后时长为30 min,计算主蒸汽质量流量与给煤机频率之间的滞后性.如图5所示,当主蒸汽质量流量相对给煤机频率滞后5 min时,它们之间的相关性系数ccorr最大.

图4 主蒸汽质量流量与给煤机频率的曲线Fig.4 Curve between main steam mass flow rate and frequency of coal feeder

图5 主蒸汽质量流量相对给煤机频率的滞后性Fig.5 Hysteresis of main steam mass flow rate relative to coal feeder frequency

3.2 工况聚类结果

根据滞后性的计算结果,对原始数据集合进行时间轴对齐,得到的数据长度为102 063条.

如表2所示为不同的模糊指数对迭代次数与偏差的影响.当c= 3且ε= 10时,随着m的增加,实际迭代次数lr和最终误差L都呈上升趋势.由此,设置m= 2.

表2 模糊指数对聚类目标误差及迭代次数的影响Tab.2 Influence of fuzzy index on error value and iteration number of clustering objective

如表3、图6所示为不同的聚类数对聚类效果的影响.当模糊指数和更新迭代阈值固定时,聚类数越大,最终误差越大.当聚类数为5和6时,聚类的边界不能被清晰地表示.设置聚类数为3.

表3 聚类数对最终误差及迭代次数的影响Tab.3 Influence of clustering numbers on final error value and iteration times

图6 不同聚类数的聚类效果Fig.6 Clustering effect of different cluster number

测试不同的更新迭代阈值对迭代次数与偏差的影响,结果如表4所示.

表4 更新迭代阈值对最终误差及迭代次数的影响Tab.4 Influence of update iteration thresholds on final error and iteration times

由表4可知,当固定聚类数为3,模糊指数为2时,更新迭代阈值越小,最终误差越小,而迭代次数在可接受范围内,因此设置更新迭代阈值为0.01.

综上所述,设置聚类数为3,模糊指数为2,更新迭代阈值为0.01,得到3类工况的数据集.

3.3 预建模结果

设置工况的匹配分数下限值为95,关键参数的优先级按炉膛温度、烟气含氧体积分数、一二次风比例、一次风量、二次风量依次下降.

如表5所示为1#炉多工况模式匹配优化的结果.表中,Sxm为工况相似度,Sxo为操作相似度,EdeBoiler为 效率提升值,ftotalGM为总给煤变频,ftotalSF为总送风变频,ftotalYF为总引风变频.

表5 多工况模式匹配的优化结果-1#炉Tab.5 Optimization results of pattern matching under multiple working conditions-1# boiler

与传统方法相比,本文方法考虑了关键状态参数的优化调整区域,通过频率区间择优,本文方法的优化结果较原始锅炉效率提升了1.92%.与仅考虑工况与操作相似的方法相比,锅炉效率提高了1.86%.此外,各个优化方案的工况相似度均大于设置的95%.通过对比工况1与工况6~9可知,负荷较高时的锅炉效率通常更高,更具有提升的空间.

选取1万条历史数据进行模式匹配批量计算,得到的锅炉效率计算结果如图7所示.利用本文方法,锅炉效率平均提高了0.68%,最多提高了4.54%.

图7 模式匹配方法的批量优化结果Fig.7 Batch optimization results of pattern-matching method

如图8所示为构建代理模型采用的神经网络结构.该结构包含3层隐藏层,分别含有20、20、10个神经元.激活函数设置为“relu”,学习率为0.01,迭代次数为100,设置训练集数据占比为0.7,分别训练表1列出的目标参数、关键状态参数、操作参数与工况参数之间的最优代理模型.

图8 PMAM代理模型采用的神经网络结构图Fig.8 Neural network structure diagram adopted by PMAM agent model

如图9所示为模型的训练结果.各参数的均方误差(MSE)均不大于0.35%,满足工业预测精度的要求.

图9 最优代理模型的误差结果Fig.9 Error results of optimal agent model

如表6所示为交叉试验结果.图中,e为误差百分比.在10次重复试验中,测试集上的误差较稳定,每次预测的最大误差为0.34%~0.38%,说明本文的代理模型具有泛化能力.

表6 交叉试验-测试集误差百分比Tab.6 Cross validation-error percentage of test set

3.4 在线应用结果及对比

采用构建的最优代理模型进行在线计算验证,详见表7.表中,tc为计算耗时.代理模型的应用显著降低了计算耗时,在负荷为190 t/h的基础工况下,锅炉效率可以提高1.49%.

表7 在线应用结果示例Tab.7 Examples of online application results

如图10所示,提出的PMAM法的计算耗时稳定在1 s,计算效率优势随着数据量的增大而显著增大.图中,ND为数据量.

图10 不同方法的计算耗时Fig.10 Calculation time of different methods

如图11所示为不同负荷的优化结果,效率提升了0~1.49%,平均效率改进了0.57%.图中,f为频率.

图11 不同负荷下PMAM的在线应用结果Fig.11 Online application results of PMAM method under different loads

如图12所示为PMAM与回归模型法的优化对比结果.结果表明,在不同操作参数可调节范围(20%、10%、5%)下,利用传统方法得到的锅炉效率均偏高,且存在失去置信度的风险.其中,操作参数可调节范围是指操作参数相对于其当前实际值的可接受变化范围.

图12 PMAM与回归模型法的结果对比Fig.12 Comparison between PMAM and regression model

以该公司2#锅炉为验证对象,结果如表8所示.本文的PMAM法能够应用于其余锅炉的操作优化,以提升锅炉效率.

表8 多工况模式匹配优化结果-2#炉Tab.8 Optimization results of pattern matching under multiple working conditions-2#boiler

4 结 语

本文提出基于代理模型模式匹配的电厂燃煤锅炉实时操作优化框架.该框架具有以下3个显著特点.1) 高可执行性的模式匹配方法.基于相关性分析展开滞后性计算,引入工况注意力机制、状态参数的频率区间优化和调控最小3层优化机制.2) 优化操作库构建方法.基于模式匹配方法对历史的生产数据进行寻优处理,将操作经验数字化.3) 高效在线应用方法.构建工况和优化操作参数的代理模型,提高在线应用效率.工程案例表明,该方法避免了优化求解中的泛化误差,较传统方法具有更高的可靠性和实时性.未来的研究将关注于优化模型的在线更新策略,提高模型的适应性.

猜你喜欢
模式匹配锅炉聚类
对干熄焦余热锅炉运行爆管的几点探讨
基于模式匹配的计算机网络入侵防御系统
具有间隙约束的模式匹配的研究进展
12CrlMoV锅炉吊杆用钢的开发生产实践
OIP-IOS运作与定价模式匹配的因素、机理、机制问题
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
关于锅炉检验的探讨
基于散列函数的模式匹配算法
一种层次初始的聚类个数自适应的聚类方法研究