基于机器学习LSTM网络的SO2排放浓度预测

2021-07-29 05:37雷彦云王鹏程
自动化与仪表 2021年7期
关键词:吸收塔烟气神经网络

王 琦,赵 静,胡 磊,雷彦云,王鹏程

(1.山西大学 自动化与软件学院,太原030013;2.山西大学 数学科学学院,太原030006;3.山西河坡发电有限责任公司,阳泉045011)

当前我国CFB 机组大多采用炉内干法固硫+炉外烟气石灰石-石膏湿法脱硫的手段来脱除SO2。但是这种方式惯性大、实时性较差,在负荷、煤质等参数变动,或运行参数调整出现误差时,炉内脱硫效果会变差,那么脱硫塔入口SO2浓度就会越限,以致SO2排放超标[1-2]。为达到超低排放水平,那么脱硫系统的控制精度将会要求更高。脱硫效率的影响因子多,同时相互具关联性,则难于实时监测,且测量结果准确度低[3-4]。脱硫设施是一个动态非线性系统,具有大迟滞、大惯性特点,所以对烟气中SO2浓度的准确预测,对于脱硫系统控制有重要意义。

目前研究人员采用的SO2浓度预测方案多为回归分析、BP 神经网络、支持向量机等算法的独立或组合应用。回归分析对历史数据的要求精度更高,同时预测的误差偏大;BP 神经网络方法在SO2浓度预测中虽有一定效果,但收敛速度慢且收敛困难,泛化能力较差,训练极易过拟合,一般引入其它优化算法来优化其参数达到提高预测精度的目的;还有用支持向量机做参数寻优的设计[5],但这些方法都没把影响脱硫系统自身的时序惯性加入到算法中。因此对于脱硫系统非线性、时滞惯性大的特点,采用循环神经网络(recurrent neural network,RNN)解决这种时序方面的问题[6-7]。本文结合山西某电厂运行数据的样本情况及特点,提出了一种基于机器学习的LSTM 神经网络SO2浓度预测方案,对大数据下的样本进行分析并建模,因为同时把脱硫系统时序上的惯性考虑加入,得到了较理想的预测效果。

1 LSTM 算法原理

1.1 LSTM 算法概述

为了解决处理长序列数据时,会有梯度消失或梯度爆炸的状况,提出了RNN 的变形算法—LSTM网络。LSTM 是一种改进型的循环神经网络,能够弥补一般循环神经网络处理长距离依赖能力不够的缺陷,那么在处理时间序列间隔大、延迟相对长的事件有更出众的表现[8-10]。LSTM 循环神经网络原理如图1 所示。

图1 LSTM 循环神经网络原理图Fig.1 Schematic diagram of LSTM recurrent neural network

LSTM 引入了3 个门来实现信息的传递: 遗忘门ft;输入门it;输出门ot。各自作用为:

(1)遗忘门ft:控制上一时刻的内部状态ct-1需要遗忘多少信息;

(2)输入门it:控制目前时刻下的候选状态ct有多少信息需保存;

(3)输出门ot:控制目前时刻内部状态ct有多少信息需输出给外部状态。

LSTM 网络的内部状态ct可以捕捉某时刻的关键信息,然后把此关键信息保存在一定的时间间隔内,保存关键信息通过遗忘门ft和输入门it来实现,因此内部状态ct保存信息的周期要长于短期记忆,但同时又短于长期记忆,所以称长短期记忆。

1.2 LSTM 算法计算过程

LSTM 单元为中间状态,其输入包含目前时刻的输入xt及前一时刻输出ht-1。首先经过预处理后的输入数据作为输入层x(t),前一时刻隐藏状态数据ht-1,与当下输入数据x(t)经过一个激活函数sigmoid,得出ft的输出f(t),这个输出此刻已更新。数据大小在[0,1]之间,表示遗忘“上一层隐藏细胞状态”的概率。表达式为

式中:Wf,bf在线性 关系里,为系数和偏 置;σ 是sigmoid。在it里,由i(t)和c~t完成更新细胞状态,其中i(t)经过sigmoid,计算出当下的被更新值,c~t经过tanh 激活函数,在LSTM 单元有新数据输入时,ft更新成新状态,ot运算式为

式中:Wi,bi,Wc,bc是线性关系的系数及偏置,细胞状态的输入信息依次过输入门和遗忘门再计算,接下来在cell 中更新最终求得隐含层单元,公式为

输出层输出由隐藏层计算出,而这些计算又由输出门控制。隐藏状态ht的输出更新,新的ht分成2 个模块:Ot是新输入序列数据x(t)的隐藏状态ht-1,此为第1 模块,经sigmoid 算出; 第2 模块由tanh、隐藏状态C(t)共同运算出结果,即:

式中:Wo,bo是线性关系的系数及偏置。

2 数据采集准备及预处理

2.1 数据采集

本文的数据源于山西某电厂CFB 机组实际运行数据,所采集数据间隔为1 min,取12月某天开始连续86 h 脱硫系统历史数据作为研究样本。样本数据包括锅炉负荷、总风量、吸收塔PH 值、吸收塔浆液浓度、原(净)烟气SO2浓度等13 项数据,涵盖SO2排放浓度及其主要影响因素。

2.2 数据的准备及预处理

2.2.1 SO2排放浓度预测输入、输出变量选取

(1)输入变量的选取

输入变量的选取很大程度上决定了在SO2排放浓度预测中能否获得较为有效的预测结果,要选取全面详细的输入变量才可以得到准确的预测结果。本文根据获取的脱硫系统历史数据结合实际问题综合地考虑了对SO2排放浓度影响的各种因素[11],考虑数据的可采集性和精确性,选取锅炉负荷、总风量、原(净)烟气温度、原(净)烟气湿度、原(净)烟气SO2浓度、吸收塔PH 值、吸收塔浆液位、吸收塔浆液浓度、原烟气SO2浓度作为输入变量。

(2)输出变量的选取

本文选择的输出变量是净烟气SO2浓度。

2.2.2 数据的预处理

预测SO2排放浓度需要电厂大量历史数据的支持,在收集数据过程中可能会受到传输的干扰、采集数据设备的精度、人为失误、系统故障等影响,往往会出现异常数据,数据异常对模型精度有严重的影响,所以需要进行数据剔除去除坏值尖点[12]。剔除异常数据利用3σ 准则:对于样本X={x1,x2,…,xn},标准差为

式中: 测量值xi余下的误差满足式表示为有粗大误差的坏值,剔除。

归一化可以让不同维度的变量特征在数值上有相对的比较能力,消除数据在量纲上的影响,进而使分类器精度更高,利于数据的划分工作。使用sklearn 的min max scal 函数进行数据归一化,将数据特征缩放至一定的最小最大值区间[13]。

3 SO2排放浓度预测建模及结果分析

3.1 SO2排放浓度预测建模

定义训练/测试集是机器学习的一个重要部分。因为预测模型由训练集生成,是监督机器学习的核心[14]。通常使用80%的数据作为训练集,另外20%组成测试集。

所应用程序的思路及作用:首先导入应用的模块,然后再定义神经网络的中间层,其中包括权重、偏差,之后应用程序读取本地文件数据,并调整数据的形状,保证输入和输出数据的类型一致,便于机器学习。构建神经网络层,1 层LSTM+3 层dense作为隐藏层,输入变量为锅炉负荷、总风量、原(净)烟气温度、原(净)烟气湿度、原(净)烟气SO2浓度、吸收塔PH 值、吸收塔浆液位、吸收塔浆液浓度、原烟气SO2浓度,输出变量为净烟气SO2浓度。如图2所示,系统神经网络属于多输入单输出状态。

图2 神经网络结构Fig.2 Neural network structure

模型预测值、真实值之间的偏差测量,可以设置一个误差函数(loss function)来实现。通过梯度下降法(Gradient Descent)来不断的降低这个偏差值[15],来使得模型预测值逼近真实输出值,然后设置训练次数和梯度下降法的调整精度,接着选用部分数据作为训练集来验证模型的可靠性,最后输出预测模型。程序学习如图3 所示。

图3 LSTM 程序学习流程Fig.3 LSTM program learning flow chart

3.2 建模仿真结果分析

依据机组脱硫系统数据训练集样本绘制的图形如图4 所示。横轴为运行时刻,纵轴为该时刻对应的SO2排放浓度数值。其中蓝色线为训练集数据曲线,橘色为经机器学习拟合出的SO2排放浓度曲线。尽管脱硫系统规律难以简单描述,并且数据波动范围大,但由图可知,经训练集拟合出的曲线能够与原始数据有较好的拟合度,证明机器学习有效。

图4 训练集建模结果Fig.4 Result of training set modeling

测试集建模结果如图5 所示,经程序学习后拟合出的图形能够有效地预测SO2排放浓度,曲线大部分与原始数据有较好地拟合,机器学习的模型具备较好地预测作用。

图5 测试集建模结果Fig.5 Test set modeling result

建模结果分析如图6 所示,其中横坐标为时间,纵坐标为提取的测试集SO2排放浓度真实值与预测值之间的误差。该图能更清晰地看出预测值与真实值相差较小,基本相差在-2.5 mg/Nm3~0.5 mg/Nm3这个范围以内,预测结果较为精确,说明该机器学习所建模型的可靠性。

图6 建模结果分析Fig.6 Analysis of modeling results

4 结语

基于机器学习LSTM 网络的SO2排放浓度预测方法,以其超强的拟合能力在反映脱硫系统时序上的惯性方面有很好的预测效果,能为脱硫系统的自动控制提供可靠参考依据。后续可以根据新数据来应用模型得到更精确的预测值,也可以通过神经网络的不断构建和完善,越来越多的数据应用也会进一步提高模型的预测能力。

猜你喜欢
吸收塔烟气神经网络
固体吸附剂脱除烟气中SOx/NOx的研究进展
神经网络抑制无线通信干扰探究
低温甲醇洗H2S吸收塔和CO2吸收塔流程模拟
基于参数自整定模糊PID的SCR烟气脱硝控制
一种炼厂富气吸收稳定方法
基于神经网络的拉矫机控制模型建立
基于非分散紫外吸收法的便携式烟气分析仪在烟气二氧化硫监测中的应用研究
复数神经网络在基于WiFi的室内LBS应用
火电厂脱硫系统二级吸收塔的扩建及运行调整
基于支持向量机回归和RBF神经网络的PID整定