姚顺春,李龙千,卢志民,李峥辉
(1.华南理工大学 电力学院,广东 广州 510640; 2. 广东省能源高效清洁利用重点实验室,广东 广州 510640)
为应对气候变化,实现双碳目标,中国火电装机容量增速放缓,新能源装机容量不断攀升。据统计,截至2023年5月底,全国太阳能、风电总装机已达8.3亿kW,约占全国发电机容量的31.13%[1]。但火电总装机量仍高达50.63%,2022年我国煤电发电量50 792亿kWh,占全口径发电量的58.4%。煤炭仍是中国经济社会发展的主体能源,发挥电力供应基础保障和灵活性调峰的重要作用[2]。为落实绿色低碳发展政策,火电行业为实现燃煤电站锅炉高效率、低污染且安全经济的运行,开展了包括对燃烧设备的设计和改造、基于参数调整的现场试验、基于燃烧理论的数值模拟技术、燃烧参数的检测技术优化、基于机器学习算法的锅炉参数预测等一系列燃烧优化技术[3]。
随着人工智能与机器学习算法的快速发展,机器学习技术层出不穷,燃烧优化技术中的参数预测得到了强有力的技术支持[4]。在污染物排放浓度预测的相关研究中,建模对象包括垃圾焚烧锅炉[5]、燃煤锅炉[6]等,建模算法包括随机森林[7]等集成建模方法、结合卷积层的长短期记忆神经网络[8]等深度学习模型,所建立的锅炉参数预测模型准确性较高且在相关应用场景中得到验证。但在深度调峰的过程中锅炉负荷快速变化,机组低负荷运行会导致锅炉炉膛流动均匀性下降,燃烧稳定性变差,炉膛温度降低,导致污染物生成增加造成排放量超标。现有研究多关于稳态工况参数模型建立的理论方法研究,快速变负荷工况下模型的精度较差且缺乏工程应用及验证;同时模型的多目标优化效果较差,未能做到低排放与经济运行的协调统一。笔者通过对比分析锅炉参数模型的相关研究,总结现有关于污染物排放浓度的机器学习算法,从特征筛选、机器学习算法和应用场景3部分展开介绍,为变负荷工况下的建模方法提供参考,并展望未来锅炉多目标优化及结合预测模型的污染物复合控制结构的研究方向。
NOx是燃煤机组排放的主要污染物之一,具有一定毒性,在阳光直射下易与臭氧发生反应,从而破坏地球的臭氧层,同时也是形成酸雨、光化学烟雾和PM2.5等环境灾害的主要物质之一,对生态系统、生活环境以及社会经济方面均有较大影响。主要NOx排放控制方法包括炉内低氮燃烧技术、选择性催化还原技术(Selective Catalytic Reduction,SCR)、选择性非催化还原技术(Selective Non-Catalytic Reduction,SNCR)和臭氧脱硝技术。其中,SCR技术在大型高污染排放工业领域中应用较成熟,且操作设备专业,具有运行稳定﹑脱硝效率高等优点,广泛应用于火力发电厂。
SCR脱硝过程通常以尿素或氨水作为还原剂,V2O5/TiO2为催化剂,反应温度在300~400 ℃,发生的主要反应有
(1)
(2)
(3)
(4)
随机组负荷快速变化,NOx排放浓度剧烈波动,易造成氨逃逸,引发催化剂中毒、引风机腐蚀等问题。因此,SCR脱硝系统NOx排放浓度和氨逃逸率的有效控制将得到极大考验,火电机组深度调峰和灵活性能力将得到进一步重视。
由于SCR烟气脱硝系统较为复杂,在研究其出口NOx浓度模型前需总结其特有的大数据特征,具体如下:
1)惯性与迟延:SCR烟气脱硝反应过程涉及较多化学反应变化,烟气中各组分的反应过程需要一定时间;同时由于烟气自动监控系统(Continuous Emission Monitoring System,CEMS)抽取的烟气需经较长的伴热管线才能到达分析仪分析,多种传感器、控制器等设备也存在一定的响应时间,NOx排放浓度及相关参数的测量滞后较严重。
2)强耦合性:SCR烟气脱硝系统相关参数与机组运行参数间存在强相关性,如烟气温度、飞灰含碳量等均随机组负荷的变化而改变,不同量级与维度的数据互相影响,在深度调峰背景下对NOx排放浓度的影响更明显。
3)非线性:NOx排放浓度不仅受机组运行参数的影响,煤质改变或催化剂活性变化也会导致NOx排放浓度出现不规则波动。
为更好解决上述典型数据特征对模型建立的影响,有必要对机组运行数据进行预处理并提取关键特征,同时改进现有机器学习算法拟合非线性数据来建立更准确的模型。
在建立模型前需从系统复杂特征中提取有用信息,具体分为数据预处理、特征提取和特征选择3部分,具体流程如图1所示。
锅炉参数模型的建模数据多来自在线监控平台和机组的历史运行数据,随深度调峰的进行,机组负荷的快速波动会为集散控制系统(Distributed Control System,DCS)平台的数据收集与存储带来一系列不稳定因素,易造成数据缺失、数据异常、数据噪声等问题。
2.1.1 数据缺失
收集到的运行数据有时会出现空白值,通过设置合理的变量取值范围,审查数据是否符合实际工况要求,提升数据质量。钱枫等[7]删除长时缺失时间段内的所有数据,对数据中短时缺失部分使用均值填充。但该处理方法相对粗糙,不能很好地保持数据的原始特征。蔡庙辉等[8]采用参数预测方法,即设定时间窗口大小,利用缺失值前n个时刻的数值进行该时刻数值的预测,使用预测值替代缺失值,填补数值的科学解释性更强。
2.1.2 数据异常
由于现场环境复杂,电厂运行数据可能因DCS通讯故障、测量设备损坏及环境干扰等原因与实际值不符或与临近样本偏差较大,即异常值。金秀章等[9]利用滑动窗口检测数据离群点并进行3次样条插值填充修正离群点。唐振浩等[10]使用异常值前20个点的平均值替代四分位法筛选出的异常值。戴宁锴等[11]使用中位数绝对偏差方法对异常数据进行诊断。金秀章等[12]采用拉依达准则,使用中位数替代不在(μ-3σ,μ+3σ)区域范围内的数值,确保不同特征列间的时序连续性。但针对变负荷工况下复杂的机组数据,上述统计学方法适用性较差,通过计算样本向量之间距离的聚类方法在处理高维数据时效果更好[13]。李延臣等[14]根据不同稳态运行时间段的数据在全部稳态数据集中所占比例进行蒙特卡洛采样,删除重复数据。余舒等[15]通过密度聚类确定有效的聚类中心,简化时间数据的相似特征。李悦等[16]采用欧氏距离作为分类标准,使用K-Means聚类算法筛选样本集合并建立典型建模样本集合。
2.1.3 数据降噪
系统在处理现场信号时受环境和系统本身波动等随机因素影响而存在的误差,被称为运行数据的噪声。如电磁扰动和烟气浓度波动等因素均会引入较大的不稳定性,因此在建模前需对数据进行降噪,以此提高模型的准确性。部分学者[17]采用S-G滤波器对原始数据进行滤波降噪。金秀章等[12]采用卡尔曼滤波算法,通过对状态变量的线性最小方差进行递归估计达到降噪目的。陈延信等[18]通过计算模态分解后的IMF分量与原信号之间的归一化相关系数,当系数在局部达到最小时,对该分量采用中位值平均滤波进行信号处理。李宇航等[19]使用小波阈值降噪方法,对包含噪声的数据样本进行小波分解算法的变换处理,得到小波分解系数和阈值函数并对绝对值低于阈值的小波分解系数置零处理,以提高原始数据的平稳性。上述降噪方法均可有效清除系统及外界因素干扰,提升数据的准确性。
2.1.4 数据标准化
火电厂中的运行数据种类繁多且量纲不统一,数据标准化可以消除不同特征数据间的量级和量纲不统一对建模结果的影响,有效提高模型的收敛速度。蔡庙辉等[8]使用min-max归一化对数据进行标准化处理。马牧野[13]采用Z-score标准化变换历史数据的均值和标准差,生成满足标准正态分布的形式。其中需要注意的是在使用min-max归一化时,可以根据后续建模算法选择不同的最大值和最小值以避免出现过拟合的情况。
特征提取通过分析特征属性间的关系,利用数据转换或映射生成新的特征空间,得到新属性,排除信息量较小的特征,以减少计算量,实现降维的目的。目前,常用的数据特征提取方法主要包括线性方法、非线性方法以及统计学方法等。
作为一种典型的线性降维方法,主成分分析(Principal Component Analysis,PCA)方法在特征提取中的应用较为广泛,通过对数据进行正交变换,旋转原坐标系并将数据在新坐标系上表示出来[20]。李延臣等[14]采用与PCA方法等效的奇异值分解(Singular Value Decomposition,SVD)方法对燃煤锅炉的稳态数据进行筛选,但SVD方法在求解新矩阵时不需计算原矩阵的协方差矩阵及其特征值特征向量,可通过高效的迭代求解方法计算。偏最小二乘法(Partial Least Squares,PLS)也具有将变量从高维空间映射到低维空间的能力,石翠翠等[21]应用PLS方法提取燃气轮机原始数据集中潜在变量所包含的信息,最大程度地消除变量间的共线性问题同时排除系统中的噪声干扰。
伴随机器学习技术的发展,神经网络方法得到更广泛的应用。卷积神经网络(Convolutional Neural Network,CNN)具有局部区域连接和权值共享等特点,能够有效提取数据特征[22]。蔡庙辉等[8]利用CNN卷积层提取垃圾焚烧炉输入数据的特征并减小矩阵规模,通过池化层进一步提炼卷积后的数据,降低输入矩阵复杂性和模型计算量。邓明星等[20]为增强卷积层处理数据的能力,在CNN通道增加了注意力机制模块(SE-Net),通过训练得到的每个特征通道的重要程度,作为赋权的依据,使原CNN高效关注于柴油车相关数据的重要特征,从而改善性能。相似的非线性降维方法还有自动编码器 (Auto Encoder,AE),该方法能有效挖掘海量数据中的特征信息,将原始数据的深层次多维信息转化为低维数据特征,从而保留大部分原始数据信息,同时降低神经网络的复杂性。张鑫等[23]采用结合RMSprop梯度下降优化算法的自编码方法,通过小批量循环训练对输入数据进行降维重构。此外还有基于统计学的时域特征提取方法,通过计算数据的方差、偏度、峭度等统计学特征,了解数据的分布、变化和关系,在故障诊断、地震波形信号分析、目标检测等领域得到了广泛应用。唐振浩等[10]通过完全集合经验模态分解得到多个IMF分量,利用统计学计算的方法计算每个IMF分量的时域特征。
在分析NOx出口浓度数据特征时,常选择尽可能多的特征以获取更多重要信息。但当变量数据集过大时,易出现信息冗余现象,导致模型复杂度增加、计算效率降低和易过拟合,影响模型的预测精度和泛化能力。特征选择是从研究对象的一组复杂特征中挑选最具代表性的特征,从而降低特征向量空间的维度并简化运算[24]。与特征提取方法相比,特征选择方法保留原始数据的特征,最终得到的降维数据实际上是原数据集的一个子集,物理上有更强的科学解释性。常见的特征选择方法包括:相关系数、互信息、最大信息系数等方法。
余舒等[15]利用皮尔森相关系数和斯皮尔曼相关系数,分析各辅助变量对NOx排放浓度的影响,验证了所选输入输出变量之间具有较强的相关性。王永林等[22]使用灰色关联度分析(Grey Relation Analysis,GRA)方法,通过两序列间发展过程的相近性或发展趋势的相似性计算辅助变量间的相关度。类似的还有线性回归方法,即通过最小化目标函数来实现模型的特征选择和系数稀疏化。唐振浩等[25]使用Lasso回归方法构造惩罚函数,对与输出变量相关性较弱的输入变量的系数置0,实现变量选择。
但上述相关系数方法只能计算变量之间的线性相关程度,在SCR脱硝系统中变量间常存在较大的非线性关系。互信息(Mutual Information,MI)在已知其中一个特征的情况下,通过计算2个特征共同包含的信息,来衡量另一个特征需包含的信息量,在处理线性与非线性问题时均有较好的效果[26]。李延臣等[14]将最小冗余最大相关性(Max Relevance and Min Redundancy,mRMR)作为变量筛选评价标准,通过计算变量间的MI筛选出与输出变量高度相关且变量之间相关性较低的特征变量。王珑宪等[27]引入相关性判断改进mRMR算法,利用MI方法计算了输入变量与锅炉出口NOx浓度的关联度并进行时延估计,重构了输入变量的时间序列,有效增强模型的动态特性。伴随MI技术的发展,衍生出最大信息系数(Maximal Information Coefficient,MIC)方法。MIC方法能够对不同的关联类型进行评估,进而搜索更广泛的关系范围;同时MIC方法准确度更高,可以克服MI算法中不便计算连续变量的缺点。吴康洛等[28]在MIC的基础上引入基于关联性的特征选择算法(Correlation-based Feature Selection,CFS),筛选出特征间平均相关性最小输出类别时平均相关性最大的特征子集。此外也有学者采用机器学习算法分析特征间的相关性,采用特征选择组合算法选择最优训练特征[29]。
支持向量机(support vector machine,SVM)算法通过选择最优分类面使得不同特征向量到该平面的距离最大,属于浅层学习系统。王志坚等[30]针对SVM算法在面对数量较大的样本时特征输入矩阵计算复杂度较大的问题,采用序列最小优化的启发式算法建立NOx排放故障诊断模型。最小二乘支持向量机 (Least Squares Support Vector Machine,LSSVM)算法将SVM算法中复杂的二次规划问题转化为计算简单的线性问题,提高计算效率。于闻歌等[31]使用LSSVM算法建立NOx排放量预测模型,通过局部异常因子确定损失函数的加权系数,解决了归一化导致无法区分锅炉不同辅助变量对结果贡献度不同的问题。支持向量机回归(Support Vector Regression,SVR)是在SVM的基础上引入不敏感损失函数,寻找一个最优面使样本距离最优面的误差最小。金鹏[32]通过对比SVR算法与BP神经网络的预测误差,验证SVR算法在锅炉NOx排放量浓度预测上更有优势。但在确定SVM的核函数时,由于径向基核函数参数设置简单,能降低模型的复杂度,学者多采用径向基核函数来构造预测模型的代价函数,如线性核函数、多项式核函数等其他核函数在SVM中的应用有待进一步研究。
神经网络算法通过模拟人脑神经系统建立数学模型,具有自我学习能力且训练速度快,可处理复杂信息,已是多学科交叉的广泛应用领域。按信息流向可以分为:前馈神经网络和反馈神经网络。
3.2.1 前馈神经网络算法
前馈神经网络(Feedforward Neural Network,FNN)如图2所示,是应用最广泛、发展最迅速的神经网络之一,主要包括:反向传播神经网络、径向基神经网络、极限学习机和生成对抗网络等。
图2 前馈神经网络结构
反向传播神经网络(Back Propagation Neural Networks,BPNN),向前传播信号向后传递误差,属于多层前馈神经网络,拥有复杂模式的分类能力,同时可以很好地映射非线性信息。BP神经网络通常会随机生成初始权值和阈值,不确定性会对模型训练和预测效果产生较大影响。因此通过智能算法对初始权值和阈值的最优值进行搜索有利于进一步提高预测模型的预测准确性和稳定性。关于NOx排放浓度的BP神经网络预测模型多采用粒子群(PSO)算法和遗传(GA)算法对模型参数进行寻优[33]。陈晖[34]在粒子群算法的基础上引入非线性惯性递减权重,提出改进的PSO算法优化NOx排放浓度模型参数。天牛须搜索 (BAS)算法仅有1个寻优个体,相较于GA算法和PSO算法,计算量明显缩小且寻优速度更快。陈延信等[18]使用BAS算法进行参数寻优,相较于PSO算法效果更好。闻增佳等[35]采用遗传算法(GA)确定最佳信息素,利用最佳信息素更新蚁群算法(ACO)确定初始信息素,结合2种算法的优势搜索NOx排放浓度模型最佳参数。其他寻优算法的优缺点见表1,相关优化算法在模型参数寻优和目标函数计算中应用广泛,通过对比各寻优算法的优势并结合相应原理改进现有算法将成为未来算法研究的主要方向。
表1 部分优化算法在SCR脱硝系统预测模型中应用的优缺点对比
尽管BP神经网络的理论和性能方面均已较为完善,但仍具有不少缺陷:学习速度慢、迭代耗时过长、针对小样本建立的关联函数误差较大且输出结果很难收敛等,上述缺点都影响BP神经网络预测结果的准确性。径向基(Radial Basis Function,RBF)神经网络模型中网络连接权值与输出呈线性关系,在保证计算结果准确度的同时拥有更快的计算速度,且具有唯一最佳逼近的特性,可有效避免局部最小的问题。杨文玉等[40]通过对比分析RBF、BP、AE三种神经网络模型关于NOx质量浓度的预测效果,证明RBF神经网络具有较好的预测能力。孙继昊等[41]采用RBF神经网络预测NOx与CO的排放浓度,预测结果与数值模拟数据吻合程度较好,证明该方法能较准确地预测污染物排放浓度。
但由于结构限制,RBF神经网络模型在处理时序预测问题时并没有明显优势,泛化能力较差,易陷入局部极小点。极限学习机(Extreme Learning Machine,ELM)是具有单隐藏层的前馈神经网络,一般通过随机生成或人为给定确定隐藏层权重,只需计算输出权重而无需使用梯度反向传播。这种特性在减少模型参数选择计算量的同时保留了模型的泛化能力[42]。葛宪福[43]采用核映射代替随机映射节省优化隐层神经元个数的时间,建立关于混合核极限学习机算法的锅炉NOx排放量预测模型,改善隐层神经元随机赋值带来预测稳定性下降的问题。谭增强等[38]使用深度极限学习机算法预测脱硝出口NOx浓度,通过堆栈多个自编码极限学习机实现对数据特征的映射。牛培峰等[39]使用并行极限学习机算法,通过并联2个ELM加快NOx排放浓度模型的训练速度大幅提高了神经网络的性能。
此外,SCR脱硝系统中存在较多类别和数目的特征,具有较强特征抓取能力的生成对抗网络(Generative Adversarial Network,GAN)有良好的表现。GAN是一种常用于学习数据类别特征的前馈神经网络,通过判别生成器生成的样本和真实样本之间的真伪进行学习。张鑫等[23]通过对比GAN神经网络和BP神经网络,证明了具有较深层次的GAN神经网络模型可以充分挖掘火电机组高维、复杂的非线性序列数据。但GAN对于生成器没有任何约束,使得数据生成的随机性大,导致训练样本量增加时模型难以控制;同时GAN以随机噪声为输入,真实数据的分布与输入数据的关联不足。张志宇等[44]在GAN的基础上输入可控数据,增加了约束条件,人为规定了样本的生成方向,所建立的NOx排放浓度模型具有较高的预测精度。
3.2.2 反馈神经网络算法
反馈神经网络包括循环神经网络、长短期记忆网络和玻尔兹曼机等,相比前馈神经网络,数据可通过层间神经元的连接自由传递。同时反馈神经网络采用Hebb学习规则使得收敛速度更快,更适合应用于联想记忆和优化计算等领域。
与循环神经网络(Recurrent Netural Network,RNN)相比,长短期记忆(Long Short-Term Memory,LSTM)神经网络在分析处理时序数据时有明显的优势。RNN虽然考虑了不同时刻隐藏层之间的关系,但由于其结构单一,在处理长时间序列问题时效果不佳。相较之下LSTM神经网络如图3所示(图中t为时刻;x为输入;C为输出;h为隐藏层参数),引入了门控循环单元机制,具备对短期记忆敏感的特性,同时还有专门保存长期信息的单元状态,有效解决了RNN在处理时序数据时可能出现的梯度爆炸或消失问题。王永林等[22]利用LSTM算法预测NOx生成质量浓度,同时加入了正则化(Dropout)方法减少过拟合现象。刘文慧等[45]在LSTM神经网络层中加入了时序注意力机制(TPA),通过构建向量间的相似度对变量进行选择,突出关键信息,提高了锅炉床温模型的计算效率和预测精度。武松等[46]引入全局注意力机制(GAM)建立关于LSTM神经网络的NOx排放量预测模型,通过与CNN等典型神经网络的预测结果进行对比,证明本模型具有更高的预测精度,泛化能力更好。
图3 LSTM神经网络结构
门控循环单元(Gated Recurrent Unit, GRU)是LSTM的一种简化结构,在处理时间序列时有更大的优势。GRU将控制单元状态的忘记门和输入门合并,并引入新的门控结构,在保持LSTM神经网络时序数据处理效果的同时又具有参数简化和收敛性更好的优势,更适用于工程应用[47]。但是GRU神经网络只能单向对数据进行学习,容易丢失反向重要信息,马永光等[36]采用双向GRU网络(BiGRU)建立SCR脱硝系统出口NOx排放预测模型,如图4所示,通过独立计算叠加前向和后向隐藏层状态获得最终输出结果。BiGRU对特征学习能力更强,更适合处理时序性明显的锅炉参数数据。杨国田等[48]通过叠加多层GRU结构提高了模型挖掘数据特征的能力和鲁棒性,有效提升关于火电厂NOx排放量的预测效果。李宇航等[19]通过对比LSTM、GRU、BiGRU等算法关于柴油机NOx排放浓度的预测结果,证明BiGRU模型的预测精度最高,误差最小。
图4 BiGRU神经网络结构
将不同学习器组合起来被称为集成方法(Ensemble Method)或元算法(Meta Algorithm),集成模型同时具有不同学习器的优势,准确性和泛化能力都有较大程度的提升。集成方法通过对数据进行深入分析,一定程度上克服了火电机组工况多变、负荷快速变化等因素使得建模效果较差的问题。按照各学习器之间的组合方式大致可分为Boosting 与Bagging两种。
使用Boosting集成学习方法时各学习器间存在强依赖关系,可将弱学习器提升为强学习器。钱虹等[17]基于注意力机制对向量自回归(Vector Auto Regression,VAR)模型与在线循环极限学习机的多维混合预测模型进行变权融合,建立NOx排放量预测模型。但在赋权时主要采用加权平均的方法,缺少一定的科学理论依据,模型泛化能力较弱。王亚欧等[49]通过神经网络方法对若干LSSVM模型的预测结果进行非线性融合,同时结合通过模糊聚类得到的样本隶属度,加权得到SCR入口温度的预测输出。谭增强等[50]利用SVR模型对LSTM神经网络预测模型的误差进行预测并修正,得到的脱硝系统入口及出口的NOx预测浓度效果较好。金秀章等[51]组合使用对线性序列预测更加准确的ARIMA模型和对非线性部分数据更加敏感的OSELM模型,对比最优权重组合预测方法和残差优化组合预测方法,结果表明残差优化组合模型能够更好地提取NOx排放浓度序列中的非线性信息进而提升预测精度。梯度提升决策树(Gradient Boosting Decision Tree,GBDT)算法也是一种典型的Boosting集成学习方法,该算法同时结合决策树与Gradient Boosting算法的优势,在多元非线性回归问题方面有较好的应用[52]。陈天锴等[53]利用GBDT算法有效解决包含多特征的柴油机非线性系统问题,所建模型对NOx、CO等气体的预测具有较高的准确度和稳定性。
使用Bagging集成方法时个体学习器间依赖关系较弱,不同学习器之间并行化,所建模型泛化性能更好。随机森林(Random Forest,RF)算法在决策树的训练过程中引入Bootstrap自助采样法随机选择属性,训练速度快,调节参数少,抗过拟合能力强[54]。孙胡彬等[55]将所建立的NOx质量浓度RF模型与BPNN和LSSVM模型相对比,证明RF模型具有更高的预测精度和更优的泛化性能。极端随机树(Extreme Tree,ET)算法是针对随机森林样本选择方式不能保证样本被充分利用,导致决策树之间相似性较高,从而提出的一种Bagging集成方法[56]。陈建均等[57]使用ET算法建立NOx排放预测模型,多个CART决策树独立训练并随机选择分叉值,提高了基学习器间的差异性和随机性,通过对比ET算法与RF算法的预测结果,证明ET算法模型具有更强的泛化能力。Stacking集成学习方法包括基学习器模型训练和元学习器模型二次集成预测两部分,通过整合多个模型的优点,提高整个集成模型的泛化能力和鲁棒性,减少过拟合风险,避免单个模型的局限性和缺陷[58]。唐振浩等[10]采用ELM、DNN、MLP、XGBoost为基学习器和ESN为元学习器构建Stacking集成学习模型,通过集合不同强预测模型充分提取数据特征,使得NOx排放浓度的预测效果最优。
综上所述,机器学习算法在NOx排放浓度预测模型中应用较多,在前馈神经网络中针对BP神经网络学习速度慢、易陷入局部最小值等问题,发展出用于学习数据类别特征的GAN和计算速度快泛化能力强的ELM。在反馈神经网络中LSTM神经网络擅长处理时序序列特征,GRU神经网络则进一步优化了LSTM神经网络的结构。集成学习方法通过组合不同学习器的优势,提高整个集成模型的泛化能力和鲁棒性,避免单一模型所带来的局限性。但是有关动态模型的研究较少,相关模型所选数据多集中在稳定负荷工况,变负荷工况下的数据特征不能得到很好的预测。通过递推、滑动窗口、即时学习和时间差分等方式更新模型样本,在线更新并不断优化模型参数,以及对模型误差进行动态修正将在NOx动态模型的建立中取得较好效果。
火电机组深度调峰已经成为常态,但深度调峰下的负荷远低于锅炉设计的最优运行工况,机组低负荷工况下长期稳定运行受到较大考验,相关锅炉参数将出现较大波动。邓明星等[20]通过建立改进的LSTM神经网络预测模型,对缺失严重的NOx浓度数据进行预测填补,通过不同连续缺失时间及不同排量类型条件下的对比试验,得到模型预测结果的决定系数保持在0.86以上,均方根误差较次优模型降低了19.13%且保持在较低水平,有效提升了采集NOx浓度数据的完整性。同时由于测量滞后的问题,在NOx质量浓度波动较大时SCR脱硝系统往往不能及时调节喷氨量。余舒等[15]使用软测量手段,在应用开环、闭环控制系统中嵌入入口NOx浓度预测模型替代前NOx传感器,其中开环系统传感器测量的比排放与预测模型输出的比排放值绝对误差为0.11 g/kWh,相对误差为1.16%,在闭环系统中绝对误差为0.06 g/kWh,相对误差为0.75%,精简系统,有效降低硬件成本。
此外为达到较优的经济效益与社会效益,往往需要对锅炉的运行参数进行调节。张媛媛等[59]通过NOx排放质量浓度的BP神经网络预测模型得到350 MW机组低负荷工况下的最优锅炉运行参数,其中尿素溶液的质量流量为0.1 t/h,满足NOx超低排放并符合运行经济性要求。闫睿等[60]通过对410 t/h循环流化床锅炉的燃烧系统进行建模,优化一组高飞灰含碳量和高NOx排放量的数据并进行工业试验,结果显示飞灰含碳量由8.79%降至7.98%,NOx排放浓度降低了15.4%,实现了燃煤锅炉高效清洁燃烧的目标。刘建军等[61]建立的CNN-LSTM混合模型在预测5 min后SCR入口的NOx浓度时误差为7.05%,低于在实际生产中制订喷氨策略所要求的15%。将该预测模型发布为Web服务并接入电厂SIS系统的数据接口后,运行人员可以根据现场生产数据实时获取未来一段时间出入口NOx浓度,方便运行人员及时调整排放烟气中NOx的质量浓度,提高生产效率。其中处理时序数据效果更好的LSTM神经网络模型预测精度高于BP神经网络、径向基神经网络等浅层神经网络,也较好地印证了火电机组数据时序性较强的特点。
在烟气排放指标监测环节中,除出口NOx质量浓度外,氨逃逸浓度也是一项重要检测指标。但是有关氨逃逸的模型相关研究较少,催化剂孔堵塞与失活、燃烧系统失稳及还原剂喷口堵塞等情况都会引起氨逃逸量的非正常增加。同时大部分电厂安装的CEMS无法准确测量脱硝系统出口氨逃逸量,氨逃逸超标无法被CEMS及时检测到,易造成空预器堵塞和降低催化剂寿命,导致锅炉效率降低,厂用电率增加。陈鸿伟等[62]采用GABP算法的间接模型预测氨逃逸浓度,相对误差为±24.29%,略高于工程要求的±20%以内,但其预测值与实际值的上下限范围基本一致。谭增强等[63]通过对比关于预测氨逃逸的LSTM模型和SVR模型,其中SVR模型的平均绝对误差为0.002 4 μL/L,均方根误差为0.007 1 μL/L,具有更高的准确度和泛化能力。
随着时间推移,机组各设备的运行状态会发生变化,如催化剂活性下降、煤种变化、传感器漂移等情况。由于机组运行工况与运行时间相关,通过预测模型对时序数据进行分析可以判断机组是否处于正常运行状态,监测锅炉设备状态。王永林等[22]在Hadoop平台中对CNN-LSTM模型运行效果进行在线评估,当现役模型控制效果偏差超过阈值时平台会发出模型失配报警,采用安全介质将新的CNN-LSTM模型从辅安全区更新到主安全区中,使用新模型继续控制脱硝系统运行。
综上所述,NOx排放浓度模型可在数值上直观表示系统的运行状态,及时准确的出口NOx浓度对现场人员监测及调控锅炉参数有重要的指导作用,准确完整的数据集一定程度上提高了远程监控平台对NOx排放的监管精度,为烟气排放大数据应用研究提供数据基础。建立氨逃逸预测模型不仅可以及时显示SCR脱硝装置的运行状态,有助于分析锅炉系统设备的潜在问题,同时可作为NOx排放浓度预测模型的辅助变量,实现NOx超低排放。此外,通过神经网络模型计算得到不易测量的氨逃逸量也可以有效解决CEMS测量不准和单点测量不具代表性的问题。同时锅炉参数各变量之间有极强的耦合关系,CEMS无法检测的系统状态如催化剂活性、喷氨格栅老化状态等都可以通过NOx浓度的异常情况进行判断。未来结合总煤量、飞灰含碳量等DCS系统无法直接获取的燃烧参数数据的预测模型准确度将进一步提高,同时模型将包含更多信息并为现场运行装置的状态分析提供参考。
国外对燃烧优化控制方面起步较早,将燃烧优化技术与自动控制技术结合,技术较成熟。燃烧优化技术包括: Ultramax公司的Ultramax燃烧优化技术和Pegasus公司的Power Pefecter燃烧优化技术、NeuSIGHT燃烧优化技术等[64]。国内火电机组应用广泛,现有燃烧优化控制系统包括:西安热工研究院开发的锅炉燃烧优化指导系统、清华大学开发的OCP3系统和东南大学开发的BCOS-2000/2.0系统等[65]。
喷氨量是调节SCR系统出口NOx质量浓度的最主要手段,基本控制方法包括固定摩尔比控制方式、固定出口NOx含量控制方式等常规PID串级结构[66]。严新宇等[67]建立参数自整定模糊PID控制,通过调节主控制器的3个参数控制喷氨量,超调小于20%,到达稳态的时间约为1 600 s,系统的稳定性和鲁棒性得到增强。张洪敏等[68]采用2阶线性自抗扰控制,即在PID的基础上引入2阶滤波器的结构,响应速度更快,上升时间由13 min降至7 min,同时标称值在±20%的范围内随机摄动时仍具有较强的鲁棒性。来长胜等[69]建立基于自校正控制的GPC结构改善SNCR烟气脱硝系统的控制性能和调节品质,但在负荷和烟气含氧量变化幅度剧烈时其控制效果一般。
SCR脱硝系统具有较大的滞后性和延时性,传统控制策略无法完全满足脱硝喷氨调节要求。SCR脱硝系统的准确建模是对喷氨量进行有效控制的前提,随着机器学习算法的发展,结合NOx预测模型的前馈控制、模型预测控制等复合控制结构得到广泛关注。王永林等[22]使用CNN-LSTM神经网络建立入口NOx质量浓度预测模型,并将其嵌入SCR脱硝优化控制系统中的前馈环节部分,氨水平均用量由153.6 kg/h降至147.9 kg/h。高明明等[70]将炉膛出口NOx浓度预测模型作为一次风量二次风量指令的修正,同时引入前馈控制提前调节喷氨量,该模型在290 MW稳定工况下平均误差为5.76%,可提前3~5 min计算出炉膛出口NOx浓度。贾晓静等[71]采用分区混合动态喷氨控制策略,显著降低脱硝系统的氨逃逸率,同等入口条件下出口氨逃逸率小于1.1%,同时提高脱硝系统出口NOx分布均匀性,平均分布偏差小于10%。改善了超低排放改造后脱硝系统的控制特性,提高了SCR脱硝控制系统运行水平。李亚宁等[72]根据不同入口烟气换向过程最低NOx浓度和出口NOx浓度设定值关系设置前馈控制策略,通过换向过程臭氧发生机功率曲线图计算得到单日臭氧消耗量节省0.930 1 kg。上述前馈环节通过预测模型提前获得入口NOx质量浓度改善还原剂投入滞后的问题,此外与预测模型结合较好的模型预测控制结构也有明显优势,通过反馈校正和滚动优化不断修正设定值与实际值之间的偏差。姚楚等[73]通过神经网络构建的NOx排放浓度模型预测值修正机理模型,该模型预测控制策略在2个典型工况下的脱硝效率比PID控制策略高约10%。李佩佩等[74]通过受控自回归滑动平均模型预测NOx浓度,所建立模型预测控制结构控制出口NOx浓度与设定值的最大动态偏差在5 mg/m3内,平均氨逃逸率低于2.3 μL/L,控制效果较好。
随着深度调峰不断深入,机组负荷快速变化,实现变负荷工况下烟气清洁排放的目标为控制策略提出更高水平的要求。孟宏君等[75]在电站现场原有单回路PID的控制策略基础引入AGA-Smith预估补偿控制策略,通过IPSO算法辨识得到SNCR脱硝控制系统170和260 MW两种典型工况下的传递函数,分别加入20 mg/m3的外来扰动,超调量分别为10.52%和11.74%,抵抗外来扰动的能力得到增强。李刚等[76]通过Smith预估控制喷氨量,控制对象在100%、80%、60%机组负荷下保持较小的超调量,有较好的稳态特性。郑必君等[77]使用Mean LSTM模型计算燃煤电厂常见的8个不同负荷段工况下的净烟气NOx浓度,预测值与原定值的偏差为3.44%,通过引入NOx浓度的模型预测值改进优化PID控制。此外,针对不同工况建立的多模型预测控制在应对快速变负荷问题时也有较好的效果。李悦等[16]通过Stacking融合模型预测多变工况下的NOx排放浓度,结合深度确定性策略梯度强化学习模型,实现SCR脱硝系统的参数优化控制,脱硝效率值稳定在86%左右。喷氨质量流量稳定在35.657 kg/h,脱硝成本总价格降低了27.56%。尹贵豪等[78]通过对瞬时总给煤量进行核密度统计确立3种典型工况,建立多模型预测控制器,升、降负荷段出口NOx质量浓度波动分别为±6和±5 mg/m3。谭畅等[79]通过炉膛出口烟温确立机组负荷,分工况构建多模型预测控制,变负荷工况时波动在±8.1 mg/m3,标准差分别为2.10和2.89 mg/m3,设定值跟踪稳定。肖运启等[80]采用多模型动态矩阵控制策略控制喷氨阀门开度,氨逃逸不超过8 mg/m3。 赵征等[81]将入口NOx质量浓度预测值作为前馈,构建模糊增益调度3个典型工况串级控制器的多模型预测控制结构,其中300 与400 MW负荷下系统的上升时间与调节时间均小于500 s。
综上所述,随着机器学习技术的发展控制器算法得到优化,控制器准确性、稳定性和快速性同时得到提升。随着对精细控制要求的提升,为保证火电机组在深度调峰的过程中实现NOx的超低排放,建立控制结构时模型将收集处理更多的历史数据,模型复杂程度将进一步升级,控制器运算量将指数上升。而有着深层网络的深度学习算法不仅可以更好地辨识模型结构参数,还能提高计算效率,将成为喷氨优化控制的主流发展方向。在火电机组中除NOx排放控制外还包含主蒸汽温度控制、磨煤机控制、CFB锅炉解耦控制等,而锅炉参数较为统一,各变量间相关性较强,未来结合前馈、反馈环节同时包含多变量控制的综合控制方案设计将更加合理,锅炉燃烧优化的自动化水平将进一步提升。
在燃烧调整过程中燃烧稳定性与污染物排放相互制约,提高燃烧稳定性势必会加大NOx排放量,这个过程需要调整锅炉参数来维持燃烧稳定性与低污染物排放的平衡,而锅炉效率在数值上直观反映了燃烧稳定性。由于燃煤锅炉具有燃烧过程复杂、运行变量强耦合等特点,加上新能源的入网使锅炉负荷波动大且变化迅速,有时需要在确保锅炉深度调节负荷能力的同时牺牲锅炉效率。在低负荷下燃烧稳定性下降可能导致NOx等污染物排放超标,对锅炉稳定性提出更高要求。因此,需要优化预测模型,确保在锅炉负荷快速变化的过程中,保持较高锅炉效率的同时尽可能减少NOx排放,实现多目标优化。
在解决多约束、多目标优化问题时需要确定模型综合优化的目标函数,该目标函数同时涵盖NOx排放量和热效率2项参数,且需要具备在目标函数寻优过程中NOx排放量和热效率2项参数能向各自最优方向上变化。闫睿等[60]在设计优化函数时使用飞灰含碳量代替锅炉效率,根据燃烧优化过程中对锅炉效率和低污染排放的重视程度,人为定义飞灰含碳量与NOx归一化值的权重,但该种赋权方法没有考虑目标间的影响关系,依靠人工经验设定权值会影响最优解的分布,难以反映优化目标的真实情况。许朵等[82]将燃油消耗率和NOx排放浓度共同作为优化目标,通过非支配排序遗传算法计算得到一组最优控制参数组合,经验证优化后的NOx排放平均下降了76.4%,燃油消耗率平均下降了3.5%。徐文韬等[83]引入快速排序法改进非支配排序遗传算法,降低锅炉NOx排放质量浓度为主提高锅炉热效率为辅的优化方案效果最优,得到NOx的排放质量浓度平均降低15.42%,锅炉热效率平均升高0.105 8%。
此外关于脱硝控制还涉及脱硝成本的问题,相关成本包括还原剂消耗成本、NOx排放费用、电价补偿以及人工、折旧、维修等费用[84]。通过先进的机器学习算法可以将NOx超低排放与经济性相关联,建立关于锅炉综合运行成本的预测模型。卞韶帅等[85]建立了锅炉低氮燃烧与SCR脱硝系统联合运行的综合成本模型,经试验验证,灰渣平均含碳量减少了32%,锅炉效率提高约0.28%,氨耗量增加约23 kg/h,综合节省费用约240元/h。李斌等[86]通过支持向量机算法建立SCR脱硝系统成本预测模型,通过混沌粒子群算法优化后,中负低氮组脱硝所需喷氨量降低了0.013 8 t/h,度电脱硝成本减少0.538 8×10-3元/(kW·h)。崔超等[87]使用最小二乘支持向量机方法建立脱硝经济性预测模型,寻优后建立离线最优专家数据库,采用模糊关联规则挖掘算法优化调整,成本降低5.75%,模型建立时间为0.562 s,优化时间为0.079 7 s,适合火电机组的在线优化控制。廖永进等[88]通过建立脱硝效率的预测模型,将SCR脱硝系统运行成本与喷氨质量流量相关联,330.9 MW负荷下成本最低,喷氨质量流量下降6.67%。李伟等[89]通过引入系统供电煤耗和单位负荷下喷氨量建立联合运行成本模型,经优化1 000 MW发电机组成本降低3%~5%。
综上,在多目标优化中NOx脱除效率通常与锅炉效率或脱硝成本共同作为优化目标,即建立多目标代价函数,但受限于函数赋权问题此类优化通常并没有最优结果。而锅炉效率与发电量相对应,通过并网电价可建立锅炉效率与经济效益的联系;同时脱硝效率与还原剂氨气、尿素、臭氧等用量有关,结合还原剂的投入与人工成本可对脱硝效率进行成本评估。未来以经济性为综合目标的优化问题将得到统一,同时在保证经济性的基础上控制NOx的排放,实现经济效益与社会效益的统一。
有关NOx排放浓度的机器学习研究主要包括特征筛选、模型构建和应用场景3个方面。
1)在特征筛选方面,相关研究多采用统计学方法筛选数据,但这种方法的科学解释性较差,不能很好地反映原数据的特征及趋势;同时由于火电机组DCS数据具有较强非线性和耦合性,传统的线性降维方法往往不能很好地辨识高维数据,具有一定的局限性。由于神经网络结构在处理非线性数据时有明显优势,如卷积神经网络可通过卷积和池化提炼重要数据,RF、XGBoost等机器学习算法可对数据特征进一步优化,注意力机制可以对与输出数据关联程度大的部分增加赋权,从而放大并提取重要特征。未来随着机组深度调峰的不断深入,结合注意力机制和神经网络算法的特征筛选方法将在火电机组的时序数据中取得更好的效果。
2)在模型构建方面,建模方法主要包括支持向量机、神经网络和集成建模等浅层学习与深度学习算法。其中支持向量机算法可通过核函数将将模型从高维空间映射到低维,有效降低模型的复杂程度;神经网络模型的应用最为广泛,LSTM神经网络可以充分挖掘数据中的长期依赖关系,在利用时序性较强的锅炉燃烧参数进行建模时有较好的效果;集成模型同时具有不同学习器的优势,准确性和泛化能力均有较大程度的提升。但多数模型所选数据种类较为单一且多集中在平稳负荷,不能很好地反映深度调峰过程中机组的多变特性。为使模型更好应对现场运行工况的变化,所选建模数据应尽可能包含更广的机组负荷分布范围,即包含低、中、高多个负荷段和升负荷、降负荷的负荷变化过程的运行数据,分工况建模,应对未来更复杂多变的情景。
3)在应用场景方面,NOx排放浓度预测模型多应用于锅炉运行参数监测与修正、燃烧优化控制、多目标优化3个方面。通过对SCR脱硝系统建立预测模型可以方便运行人员模拟并修正可调参数,同时NOx排放模型可作为软测量手段,监测燃烧系统运行状态,在参数失真时及时修正更新模型。但多数模型并未考虑煤质参数对预测效果的影响,不同火电机组使用的燃煤品质也有一定差异,如热值、飞灰含碳量等能够反映燃烧效率的煤质因素并未得到很好的分析,未来相关预测模型有必要考虑上述影响因素。在燃烧优化控制中燃煤电厂多采用PID控制且效果较差,在相关研究中提及的控制手段包括串级控制、前馈控制和模型预测控制等,但实际应用较少且研究分散,先进控制手段间的控制效果对比较少同时未能很好的结合,结合多控制方法的复合控制结构是未来的研究方向之一。在多目标优化中NOx脱除效率通常与锅炉效率或脱硝成本共同作为优化目标,但代价函数赋权问题具有较强的主观性,此类优化通常并没有最优结果。而锅炉效率与脱硝费用均与成本相关,为保证经济效益与社会效益的统一,未来以成本为导向的综合目标优化将有较大发展。