潘红光 裴嘉宝 苏涛 辛芳芳
摘要:燃煤電厂煤粉在燃烧过程中产生的有害气体会对大气环境造成污染,NOx为其中之一。针对燃煤电厂生产过程中NOx排放量测量成本高、过程复杂等问题,考虑到机组运行数据具有的时间序列特征,提出一种基于长短期记忆神经网络的软测量方法对NOx排放量进行预测。在分析NOx产生机理的基础上,利用来自陕西省榆林市某电厂2019年1月至6月的实际生产数据,初步选取与NOx排放量紧密相关的20个辅助变量;将数据进行预处理以消除粗大误差和随机误差,并利用灰色关联度分析进一步精选出15个辅助变量;将实际生产数据划分训练集和测试及对LSTM模型进行训练和测试,并将LSTM模型与BP神经网络模型和支持向量机模型的软测量结果比较。结果表明:基于LSTM的测量方法均方误差较基于BP神经网络与SVM的方法均有减小,说明该方法测量准确度较高,泛化能力更强。
关键词:NOx排放量;软测量;长短期记忆网络;辅助变量;时间序列
中图分类号:TP 29文献标志码:A
文章编号:1672-9315(2022)02-0362-09
DOI:10.13800/j.cnki.xakjdxxb.2022.0222开放科学(资源服务)标识码(OSID):
LSTM-based soft sensor of NOx emissions
from coal-fired power plantsPAN Hongguang,PEI Jiabao,SU Tao,XIN Fangfang
(College of Electrical and Control Engineering,Xian University of Science and Technology,Xian 710054,China)
Abstract:The harmful gases produced by the burning process of pulverized coal in the coal-fired power plants will pollute the atmospheric environment,one of which is the NOx.With respect to the high cost,complex process and other problems of NOxemission measurement during the production process of coal-fired power plants,considering the characteristics of time sequence of generating set operation data,a soft measurement method based on the Long Short-Term Memory neural network has been proposed to predict the NOx emissions.To be specific,first of all,by analyzing the producing mechanism of NOx,the 20 auxiliary variables closely related to NOxemissions are preliminarily selected based on the actual production data from January to June 2019 at a power plant in Yulin city,Shaanxi Province.Secondly,the data are preprocessed to eliminate the gross error and random error,and the 15 auxiliary variables are further selected by using the analysis of grey correlation degree.Finally,the actual production data are divided into the training sets and tests,and the LSTM models are trained and tested,and then the soft measurement results of the LSTM model,Back Propagation neural network model and Support Vector Machine model are compared.The results show that all the Mean Square Errors of measurement methods based on the LSTM are smaller than that of measurement methods based on the BP neural network and SVM,indicating that this method has higher measurement accuracy and stronger generalization ability.
Key words:NOx emissions;soft-sensing;long short-term memory;auxiliary variables;time series
0引言
火力发电以煤电为主,燃煤电厂煤粉在燃燒过程中产生的有害气体会对大气环境造成污染。目前,燃煤电厂主要通过SCR(selective catalytic reduction,SCR)脱硝系统降低NOx排放量[1],锅炉燃烧工艺流程如图1所示。为有效应对NOx的排放,对其进行实时测量至关重要。NOx的排放量一般通过建立湍流模型[2]、气固流动模型[3]等方式进行测量。目前,NOx排放量一般采用硬件传感器或者分析仪,利用连续排放监测系统(continuous emissions monitoring system,CEMS)进行实时测量。然而,CEMS在线测量NOx排放量时,投资成本过高、计算速度慢、测量存在滞后性等缺点,难以满足烟气出口NOx排放量迅速、稳定的监测要求。对于复杂工业环境而言,在具体生产过程中受设备和技术因素的影响,往往导致有些关键变量测量误差较大甚至难以测量。除此之外,某些设备测量的结果时间上存在滞后性无法实时指导生产活动,这就很难对生产活动进行实时控制。软测量技术的发展正是为了解决这类质量指标的实时测量和控制问题。
软测量技术主要依据工业生产过程中可测的辅助变量来实时估计待测的目标变量 [4]。软测量技术的基本过程如下:首先,通过对目标变量的分析,选择与目标变量密切相关的易测量;其次,通过数据采集和预处理,确定数据的有效性后建模;最后,对模型进行分析确定其是否满足实际生产需求。大量的文献表明,软测量技术具有实际运用价值。GONZAGA等采用基于人工神经网络(artificial neural network,ANN)的软测量方法对一个聚合过程的聚合物粘度进行估计,并将此估计结果成功应用于伺服和调节问题,并使得工业装置有效运行[5]。LI等提出一种利用灵敏度矩阵分析和核脊回归(kernel ridge regression,KRR)实现蒸馏成分在线软测量的组合软测量传感器,并在模拟精馏塔上的应用表明该方法的有效性[6]。毛清华等针对采煤机机截割载荷难以直接测量的问题,采用基于ELM神经网络的软测量方法建立采煤机机截割载荷软测量模型,结果表明软测量建模方法能够实现采煤机机截割载荷预测[7]。由以上文献研究和分析可知,软测量技术在不同领域的实际应用中,都取得相应的成果,充分体现它自身所具有的优势。
考虑到电站锅炉具有大惯性、大滞后、时变和不确定性的特点,且各参数之间相互耦合,各个过程难以使用准确的数学模型来表征;同时,机组运行过程积累了大量数据,因此研究基于数据驱动的建模方法有望获得有效的NOx排放量测量模型。近年来,研究人员提出很多方法用于分析锅炉能效问题。例如MA等利用径向基函数(radial basis function,RBF)神经网络建立1 000 MW超超临界机组模型来测量机组负荷、主蒸汽压力和中间点温度,获得很好的效果,具有很强的实际工程意义[8]。GU等提出一种自适应最小二乘支持向量机(adaptive least squares support vector machine,ALS-SVM)算法,对锅炉燃烧系统建模,结果表明该模型能够很好反映锅炉燃烧系统的时变特性[9]。李竞岌等利用小型鼓泡流化床实验台比拟循环流化床(circulating fluidized bed,CFB)锅炉密相区,在850 ℃床温和10%O2浓度下,进行单颗粒焦炭的燃烧实验,对不同床料粒度、制焦煤种、焦炭粒径和流化风速条件下焦炭氮向NOx的转化比例进行研究[10]。王科等在锅炉原始燃烧系统的基础上调整二次风配比并且引入燃尽风(separated over-fire air,SOFA),通过数值模拟的方法评估新型燃烧系统在不同SOFA风率和不同SOFA位置时的整体燃烧性能,结果表明SOFA参数对NOx排放和飞灰含碳量有影响[11]。这些文献从不同方面分析锅炉能效问题,说明研究基于数据驱动的NOx排放量测量的建模方法具有实际意义。
锅炉NOx排放量在数据上是一个非线性的时间序列,信息彼此间有着复杂的时间关联性。目前,广受关注的诸多深度学习方法,是一种能够模拟出人脑的神经结构的机器学习方法,可以有效处理此处的非线性问题[12]。BP神经网络和长短期记忆(long short term memory,LSTM)网络就是其中的一部分。BP神经网络是一种经典算法,它是一种按照误差逆向传播算法训练的多层前馈神经网络,是目前应用较为广泛的神经网络。ZHOU等提出一种基于BP神经网络的自适应卡尔曼滤波算法,分析吸烟者和非吸烟者呼出CO和N2O的浓度[13]。TAO等提出一个结合BP神经网络和地质统计学来描述污染场地的土壤污染物情况的模型[14]。但BP神经网络泛化性较差,而LSTM神经网络考虑数据的时间特性,在时间序列预测方面有更好的表现[15]。MA等研究LSTM神经网络的架构,与动态神经网络的不同拓扑以及SVM等其他算法比较,表明LSTM在准确性和稳定性方面可以实现最佳短期交通预测性能[16]。由以上文献可知,LSTM对时序性数据处理效果较好。
综上所述,基于LSTM网络能够学习到数据间的长期依赖性[17-18],同时针对锅炉NOx浓度时间序列预测这一问题,笔者提出一种基于LSTM神经网络的软测量方法对NOx排放量进行实时测量。首先,对NOx产生机理分析,并在实际生产数据集上初步选取与NOx排放量紧密相关的20个辅助变量;其次,在数据预处理后,利用灰色关联度分析精选出15个辅助变量;最后,通过训练集和测试集对LSTM模型进行训练和测试,并将LSTM模型与BP神经网络模型和SVM模型的软测量结果比较发现,LSTM模型的预测准确度更高,泛化能力更强。
1LSTM神经网络
1997年,HOCHREITER等提出LSTM神经网络,目的是解决循环神经网络(recurrent neural network,RNN)梯度消失问题[19]。
RNN结构如图2所示,图中,Di(i=0,1,…,t)为时间i的输入;ui(i=0,1,…,n)为输出;中间部分E是隐藏层的信息流。但是,随着时间序列的不断增长,RNN将出现梯度消失问题,而LSTM神经网络的提出,成功解决此类问题。
LSTM神经网络是一种特殊的RNN,可有效解决传统RNN梯度消失或梯度爆炸现象[20-21]。LSTM将每一层神经元加入了“门控”结构,使得部分误差在传播过程中可以直接通过“门”,而不用归因于当前神经元。因此,误差可以直接传播到下一层,梯度无论传播多远都不会出现梯度消失问题。在RNN隐藏层中,LSTM加入输入门(Input Gate),输出门(Output Gate),遗忘门(Forget Gate)和一个内部单元(Cell),如图3所示。
输入门控制着新的输入信息进入记忆单元的强度,即决定着多少新记忆和老记忆进行合并。
2NOx排量软测量
2.1数据采集与辅助变量初选
实验数据来自陕西省榆林某电厂实际生产数据,数据内容为实测样本,数据采集点是2019年1月1日 00∶00至6月9日2∶00,采样间隔为1 h,共3 800个采样点数据。
通常燃煤电厂锅炉燃烧产生的NOx主要分为3大类,分别为燃料型NOx、热力型NOx与快速型NOx。燃料型NOx在3种污染物中比例最大,它是煤质的直接燃烧产生的污染物;热力型NOx在3种污染物中比例较小,它是送风机送入的氮元素在锅炉中被氧化产生的污染物;快速型NOx在3种污染物中比例最小,它是煤质中的碳元素与空气中的氮元素发生瞬时反应产生的污染物。通过对NOx生成原因分析,初步选取总给煤量、锅炉总风量、炉膛出口温度等3 800×20组变量(见表1变量1~20),其中脱硝出口NOx排放量为目标变量。
其中,NOx国家的排放标准主要依据国家2014年发布的并且要求2016年7月开始执行的国家锅炉大气污染物排放标准,具体为:
1)燃气锅炉:在用锅炉 400 mg/L、新建燃气锅炉 200 mg/L、重点地区 150 mg/L;
2)燃煤锅炉:在用锅炉 400 mg/L、新建燃气锅炉 300 mg/L、重点地区 200 mg/L;
3)燃油锅炉:在用锅炉 400 mg/L、新建燃气锅炉 250 mg/L、重点地区 150 mg/L。
2.2数据预处理
考虑到工业环境复杂性,前述实测数据使用前需预处理。数据预处理包括随机误差、粗大误差的处理及数据变换。粗大误差一般由于传感器失灵、设备异常等造成,一般情况下,粗大误差出现概率较低,一旦出现会严重影响数据质量。随机误差主要由于测量信号的干扰及操作过程的随机波动成。
2.2.1粗大误差处理
2.2.2随机误差处理
2.2.3归一化与反归一化处理
2.3辅助变量精选
辅助变量精选可将数据维数控制在恰当范围内;辅助变量太多会影响模型灵活性和时效性;反之,又难以充分输入参数的特征信息,影响模型适用性和准确性。考虑到表1中变量1~20之间具有不同程度关联,因此,采用灰色关联度分析法量化变量间的关联度,以精选辅助变量。灰色关联分析法主要依据序列曲线几何形状的相似程度來判断其联系是否紧密:曲线越接近,相应序列间的关联度越大;反之,越小。
采用灰色关联度获得各辅助变量关联度,见表1。设定关联度阈值为0.90[23-24]。据此阈值,精选2号给煤机密封风调门反馈、1号机组烟囱入口烟气O2浓度、左侧炉膛出口温度、右侧炉膛出口温度等关联度大于 0.90的15个辅助变量。因此,最终有效数据规模为3 800×15。
2.4软测量建模
软测量技术的主要思想是:采用便于测量的变量来实时估计待测的目标变量。采用2号给煤机密封风调门反馈、1号机组烟囱入口烟气O2浓度等15个辅助变量,利用LSTM算法进行软测量建模估计目标变量脱硝出口NOx排放量,具体过程如下。
1)根据燃煤电厂的理论和技术收集脱硝出口NOx排放量和相关数据,并构建数据集。
2)使用(11)消除粗大误差,使用(12)消除随机误差,并使用(13)~(14)标准化数据。
3)运用灰色关联度对数据进行降维处理,以实现辅助变量的精选,并将数据集划分为训练集和测试集。
4)建立深度学习模型并初始化LSTM神经网络相关参数。
5)训练:在正向传播中,使用(1)~(9)获得预测输出;在反向传播中,使用梯度下降法来计算每个权重的梯度。之后经过迭代和修改权重,使损失函数最小化,并输出最优模型。
6)测试:公式(10)用于计算测试集的评估指数。
7)如果精度符合要求,则输出最终的LSTM神经网络模型。否则,返回步骤 4)调试LSTM神经网络参数。
3仿真实验
实验中软件环境为:Python的框架——PyTorch 0.3.1,Python编辑环境为PyCharm,操作系统为Win7(64位);硬件配置为:内存DDRIII 12G(8G+4G),CPU为 AMD A4-Series A4-5000。
3.1场景及参数设计
一般来说,数据规模会对数据驱动方法的结果产生较大影响[25]。考虑到很多场景下大规模数据获取存在困难,在仿真部分对小数据量(场景 1)和大数据量(场景2)分别进行仿真[26-27]。为便于比较,测试集数据均选为240组(2019年5月 30日 2∶00至6月9日2∶00)。场景1训练集为480组(2019年5月10日1∶00至5月30日1∶00);场景2训练集为3 560组(除去240组测试数据后的剩余数据)。
与此同时,为比较文中所提方法的有效性,此部分还对基于BP神经网络和SVM的2种方法进行仿真,并分别作了比较。根据上文选定的模型结构,基于LSTM神经网络的软测量模型参数见表2。BP神经网络具体建模方法可参考[26],具体参数见表2。对于SVM建模方法可参考[9],其主要参数为最佳惩罚系数μ和径向基函数的宽度ψ,其中,场景1下训练后的参数ψ=11.313 7,ψ=0022 1,场景2下训练后的参数μ=2.828 4,ψ=0.250 0。
3.2场景1仿真结果
图4展示LSTM训练过程的均方误差(MSE)与迭代次数的关系:随着迭代次数的增加,训练误差逐渐缩小。这一规律在场景1(红色实心圆)和场景2(蓝色实心圆)中基本一致;只是在场景2(大数据量)下,均方误差下降速度更快。说明对于LSTM神经网络模型而言,训练集规模越大,训练速度越快。
图5~7给出场景1下3种方法的预测结果。整体来看,此种场景下基于SVM模型的预测精度最优。为进一步量化各方法的预测效果,表3分别从均方误差(MSE)、均方相关系数(r2)两方面对预测效果进行展示。其中,MSE反应的是预测值与真实值的偏离程度,MSE越小,说明模型精确度越高;r2反应2个变量变化时的相似程度,该系数越高表示预测值与真实值越接近;二者相互结合,综合反应模型的优劣。
据表3,场景1下SVM的MSE比BP和LSTM分别低0.000 3和0.002 0;SVM的r2比BP和LSTM分别高0.014 0和0.026 8。也即,基于SVM的模型2项指标均优于其他2种模型。该结果说明,基于SVM的模型在小数据量的情况下其泛化能力更强,预测结果更好,适用于小数据量场景[9]。
3.3场景2仿真结果
图8~10给出3种方法在场景2下的预测结果。从整体看,场景2下基于LSTM模型的预测精度最优。由表3可知,场景2下LSTM的MSE比BP和SVM分别低0.000 2和 0.000 5;LSTM的r2比BP和SVM分别高0.020 6和0.065 9。即,基于LSTM的模型2项指标均优于其他2种模型。该结果说明,基于LSTM的模型在大数据量情况下泛化能力更强,预测结果更好,适用于大数据量场景[9]。
结合表3及图5~图10,可以得出如下结论:在大数据量的基础上,基于LSTM的模型较基于BP和SVM的模型能够学习到数据间的长期依赖性,同时对时间序列有强化记忆能力的特点[27];其具体原因在于,LSTM加入“门控”结构替换原RNN网络结构中的隐含层细胞,通过“门控”结构将长期记忆与短时记忆结合,使得部分信息在传递过程中可以直接通过“门”,而直接越过当前神经元,可以有效地处理长期依赖的动态相关问题,在一定程度上弥补RNN网络“梯度消失”的问题;LSTM特殊的“门控”结构,使其在处理时序问题上的性能优于RNN网络。同时表明,在当前数字化日益普及、大量数据存在的情况,基于LSTM模型的NOx排放量等方面的预测完全可行。所提方法在降低企业测量仪表投入、减少维护成本等方面具有很好的效果。
4结论
1)针对燃煤电厂NOx浓度排放量的测量这一复杂的非线性动态系统,提出基于LSTM的NOx排放量软测量方法,该方法主要是分析与NOx排放量紧密相关的变量,通过构建NOx排放量软测量模型实现NOx排放量的预测。
2)LSTM特殊的“门控”机制,使得LSTM在处理时序问题上更具优势;燃煤电厂在生产过程中的历史数据的关联性及时序特征;基于LSTM的NOx排放量软测量主要是结合LSTM的优势以及燃煤电厂生产过程历史数据的特性来实现NOx排放量的预测。
3)基于LSTM的NOx排放量软测量主要选择均方误差和均方相关系数作为评价模型预测性能的标准。从仿真实验结果来看,LSTM神经网络的软测量方法预测结果优于BP神经网络和SVM模型。
4)该方法在NOx排放量的预测方面效果不错,但是存在一定的不足,比如在小数据量的情況下,预测性能会有所下降,后续研究需要根据不同的应用场景、数据集的不同、领域的不同构建出符合数据标准的模型。
参考文献(References):
[1]冯前伟,张杨,王丰吉,等.现役燃煤机组SCR烟气脱硝装置运行现状分析[J].中国电力,2017,50(4):157-161.FENG Qianwei,ZHANG Yang,WANG Fengji,et al.Analysis on operating status of SCR facilities in active coal-fired units[J].Electric Power,2017,50(4):157-161.
[2]ZHOU L,QIAO L,CHEN X,et.al.A USM turbulence-chemistry model for simulating NOxformation in turbulent combustion[J].Fuel,2002,81(13):1703-1709.
[3]TENNETI S,SUBRAMANIAM S.Particle-resolved direct numerical simulation for gassolid flow model development[J].Annual Review of Fluid Mechanics,2014,46(1):199-230.
[4]KADLEC P,GABRYS B,STRANDT S.Data-driven soft sensors in the process industry[J].Computers & Chemical Engineering,2009,33(4):795-814.
[5]GONZAGA J,MELEIRO L,KIANG C,et al.ANN-based soft-sensor for real-time process monitoring and control of an industrial polymerization process[J].Computers & Chemical Engineering,2009,33(1):43-49.
[6]LI Q,SHAO C.Soft sensing modelling based on optimal selection of secondary variables and its application[J].International Journal of Automation and Computing,2009,6(4):379-384.
[7]毛清華,赵健博,李亚周,等.基于ELM神经网络的采煤机截割载荷软测量建模方法[J].西安科技大学学报,2020,40(5):769-774.MAO Qinghua,ZHAO Jianbo,Ll Yazhou,et al.Soft sensor modeling method of shearer cutting load based on ElM neural network[J].Jourmal of Xi an University of Science and Technology,2020,40(5):769-774.
[8]MA Y,YE Z.A 12-input-3-output RBF neural network model of load and main steam pressure characteristics for ultra-supercritical unit[J].Applied Mechanics and Materials,2014,529:748-752.
[9]GU Y,ZHAO W,WU Z.Online adaptive least squares support vector machine and its application in utility boiler combustion optimization systems[J].Journal of Process Control,2011,21(7):1040-1048.
[10]李竞岌,杨欣华,杨海瑞,等.鼓泡床焦炭型氮氧化物生成的试验与模型研究[J].煤炭学报,2016,41(6):1546-1553.LI Jingji,YANG Xinhua,YANG Hairui,et al.Experimental study and modeling of NOxgeneration from char nitrogen in the bubbling bed[J].Journal of China Coal Society,2016,41(6):1546-1553.
[11]王科,王贲,于洁,等.SOFA参数对W锅炉燃烧及NOx排放影响的数值模拟[J].煤炭学报,2018,43(3):839-845.WANG Ke,WANG Ben,YU Jie,et al.Influence of separated overfire-air parameters on combustion and NOxemission characteristics for a babcock & wilcox(B & W)down-fired boiler[J].Journal of China Coal Society,2018,43(3):839-845.
[12]LECUN Y,BENGIO Y,HINTON G.Deep learning[J].Nature,2015,521(7553):436-444.
[13]ZHOU S,LIU N,SHEN C,et al.An adaptive Kalman filtering algorithm based on back-propagation(BP)neural network applied for simultaneously detection of exhaled CO and N2O[J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2019,223:117332.
[14]TAO H,LIAO X,ZHAO D,et al.Delineation of soil contaminant plumes at a co-contaminated site using BP neural networks and geostatistics[J].Geoderma,2019,354:113878.
[15]VAN H G,MOSQUERA C,N?POLES G.A review on the long short-term memory model[J].Artificial Intelligence Review,2020,53(8):5929-5955.
[16]MA X,TAO Z,WANG Y,et al.Long short-term memory neural network for traffic speed prediction using remote microwave sensor data[J].Transportation Research Part C,2015,54:187-197.
[17]YU Y,SI X,HU C,et al.A review of recurrent neural networks:LSTM cells and network architectures[J].Neural Computation,2019,31(7):1235-1270.
[18]MULLER A T,HISS J A,SCHNEIDER G.Recurrent neural network model for constructive peptide design[J].Journal of Chemical Information and Modeling,2018,58(2):472-479.
[19]HOCHREITER S,SCHMIDHUBER J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.
[20]GREFF K,SRIVASTAVA R K,KOUTN?K J,et al.LSTM:a search space odyssey[J].IEEE Transactions on Neural Networks and Learning Systems,2016,28(10):2222-2232.
[21]GERS F A,SCHMIDHUBER J,CUMMINS F.Learning to forget:continual prediction with LSTM[J].Neural Computation,2000,12(10):2451-2471.
[22]SHEN C,BAO X,TAN J,et al.Two noise-robust axial scanning multiimage phase retrieval algorithms based on Pauta criterion and smoothness constraint[J].Optics Express,2017,25(14):16235-16249.
[23]賀亚维,张荣军,郭永宏.延川地区储层特征及综合评价[J].西安科技大学学报,2019,39(5):811-818.HE Yawei,ZHANG Rongjun,GUO Yonghong.Ceological characteristics and comprehensive evaluation of reservoir in Yanchuan Area[J].Joumal of Xian University of Science and Technology,2019,39(5):811-818.
[24]刘思峰,蔡华,杨英杰,等.灰色关联分析模型研究进展[J].系统工程理论与实践,2013,33(8):2041-2046.LIU Sifeng,CAI Hua,YANG Yingjie,et al.Advance in grey incidence analysis modelling[J].System Engineering Theory and Practice,2013,33(8):2041-2046.
[25]赵毅鑫,杨志良,马斌杰,等.基于深度学习的大采高工作面矿压预测分析及模型泛化[J].煤炭学报,2020,45(1):54-65.ZHAO Yixin,YANG Zhiliang,MA Binjie,et al.Deep learning prediction and model generalization of ground pressure for deep longwall face with large mining height[J].Journal of China Coal Society,2020,45(1):54-65.
[26]HU P,LIU C.Soft-sensing of NOxcontent in power Station based on BP neural network,RBF neural network and PCA-RBF neural network[C]//IOP Conference Series:Materials Science and Engineering.IOP Publishing,2018,392(6):062180.
[27]李伟山,王琳,卫晨.LSTM在煤矿瓦斯预测预警系统中的应用与设计[J].西安科技大学学报,2018,38(6):1027-1035.LI Weishan,WANG Lin,WEI Chen.Application and design of LSTM in coal mine gas prediction and warning system[J].Journal of Xian University of Science and Technology,2018,38(6):1027-1035.