基于CNN-GAN 数据增强网络的电厂锅炉管道温度压力及健康状态预测∗

2024-01-29 02:23陈鸿鑫马天霆简彦辰戴明露
电子器件 2023年6期
关键词:主汽波动工况

陈鸿鑫,马天霆,周 阳,简彦辰,高 犇,戴明露∗

(1.国家能源集团宿迁发电有限公司,江苏 宿迁 223803;2.东南大学能源与环境学院,江苏 南京 210096)

随着国民经济的快速发展,各行业的用电需求激增。而为了响应国际环保号召,我国也提出了“碳达峰”和“碳中和”目标。面对“双碳”目标,国内大力发展风、光、核等清洁能源,并要求火电这一传统能源参与深度调峰。这一要求的实质是需要火电厂锅炉能够在高低负载间来回快速切换,且低负载情况下燃料转换率更高。频繁的深度调峰易造成电厂锅炉各部件不断承受交变热应力,其中锅炉的主汽、冷再热管道由于承受温度高、压力大,而成为密切监控对象[1]。

目前,主汽、冷再热管道的主要检测手段为通过传感器检测其温度和压力。这种检测结果具有一定的局限性,即只能通过将温度压力数据与管道建设阈值进行对比,判别管道目前状态[2]。此外,由于传感器与电厂DCS 的测量与搜集传输数据的特性,中控大屏所呈现的数据具有一定的滞后性。当管道内温度以及压力出现异常时,难以及时预警。因此,需要一种科学有效的手段,对电厂锅炉的主汽、冷再热的温度、压力数据进行预测,同时评估其未来温度、压力数据的健康状态,帮助运维人员进行及时调整[3]。

对温度、压力数据预测的本质是研究温度、压力数据在时序上的变化过程,因此该研究的本质是时序预测[4]。时序预测指的是在任意一段时间范围内以特定的时间间隔对未来时刻的序列走向进行预测。国内外的诸多学者对时序预测投入了大量的研究,Yule 等[5]将时序预测问题归纳为自回归问题并且建立了自回归模型,该模型能够对自然界的相关参数进行预测。该模型存在的主要问题是其变量的相关性受历史数据影响较大,难以考虑除时间尺度外变量的影响。随后Walker 等[6]提出了移动平均模型,该模型的优点是加入了随机噪声,增加了模型中的误差权重,解决了预测中因历史数据产生的随机波动。随后,差分自回归移动平均模型[7]将预测序列拆分为线性和非线性部分进行研究,利用线性模型寻找序列中的一阶线性成分,以非线性模型拟合时间序列与线性模型的残差,大大增加了预测的准确性和平稳性。近年来,随着机器学习的发展,给时间序列预测带来了新的方法。支持向量机(Support Vector Machine,SVM)[8]最先用于二分类问题和回归预测,主要依赖于其能够通过核函数将低维非线性问题在高维空间进行映射,映射后只需进行高维线性问题求解。随后人工神经网络(Artificial Neural Network,ANN)通过多层感知机配合激活函数,能够达到更为优越的非线性求解能力。深度学习网络(Deep Learning Network)[9]的出现再次展现出比传统机器学习方式更加优异的性能,其中,循环神经网络(Recurrent Neural Network,RNN)不但能够解决自然语言处理问题[10],也在时间序列预测方面大放异彩。近年来,诸多学者也将其用在天文[11]、气象[12]以及金融市场[13]的预测。尽管RNN有着优异的非线性拟合能力,但是其基于数据或机理驱动[14],电厂管道这一复杂系统很难建立完善的机理、生成足够的数据集,因此只能通过数据驱动的方式完成数据集准备。然而现有电厂管道的运行数据多为正常运转数据,很难有异常数据供以参考。生成对抗网络(Generative Adversarial Network,GAN)是一种极小极大博弈的问题,它由生成器和判别器组成,寻找生成器和判别器的平衡点[15]。该网络多用来生成多样化数据进行数据集扩充。诸多学者应用该方法实现了风电机组齿轮箱故障检测[16]、人脸检测[17]和时间序列异常检测[18]。

本研究着重于实现电厂锅炉主汽、冷再热管道的温度与压力预测,通过GAN 网络扩充数据集并且建立未来时间段管道运行状态,结合现场真实数据构建合成数据集。以LSTM 网络搭建电厂锅炉管道温度与压力预测模型,并实现未来时间段运行状态预测。

1 数学模型

1.1 生成对抗神经网络

GAN 的核心是依据已有真实数据集,从无到有生成近似真实数据。它由生成器和判别器组成,分别负责生成新的数据和对生成数据的真假进行判别。生成器的最终目标是生成的数据集能够欺骗过判别器,而判别器则是不断提升判别能力来迫使生成的图片更加接近真实,其表达式为:

式中:α为1-Lipschitz 函数,Pg是由生成器G(z)生成的数据集。1-Lipschitz 函数的本质是一种加强Lipschitz 约束的方法,表示为:

式中:P~x为从数据分布Pr到生成的数据Pg的随机均匀采样点对。其本质是对于随机样本梯度建立带惩罚的约束,并且加入到原有GAN 模型的损失函数中。

使用GAN 的优点是能够根据现有真实数据,不断生成接近于真实数据的数据集,以此数据集进行扩充,但是电厂锅炉管道的运行数据多为正常运转数据,难以有不正常或者是故障数据产生,因此需要建立合适的评价函数,以此计算其与真实数据的贴近程度。

1.2 预测算法

现有预测模型分为直接多步预测和滚动多步预测,直接多步预测的优点是实现简单,其可以表示为:

式中:T、P为电厂锅炉管道的温度和压力,t为当前时刻,Δt为采样间隔,m、n为过去时间段和预测时间段的序列长度。滚动多步模型降低了模型求解难度,提升了单步预测的准确性,但是却存在随滚动步数提升而误差线性增长的隐患。由于本文通过GAN 网络扩充了数据集,只要选取合适的求解模型便可以弥补直接多步预测法对模型求解算法和模型数据集要求较高的缺点。如图1 所示,构建直接多步预测数据集时需要依据当前时刻t的前后m和n步进行数据筛选,采样间隔Δt可以根据实际需要确定。下一时刻t+1 的数据集确定则需要在原有数据集上进行平移即可。预测的数据为当前时刻t的后n个Δt步长。

图1 直接多步预测法流程图

从式(3)可以看出,直接多步预测的本质是解多元非线性函数。常用的多元非线性函数的求解方法有牛顿迭代和最速下降法等。目前,神经网络的非线性拟合功能使得其在处理非线性问题时有更好的精度和更少的时间。

LSTM 网络以其优良的非线性求解能力在处理时序问题上有着诸多应用。LSTM 由三个门控制单元组成,分别处理着上一时刻、当前时刻和未来时刻的信息。其中,遗忘门用来决定上一时刻和当前时刻输入数据中需要舍弃的部分,并将对序列贡献较多的数据输出至输入门。输入门是诸多信息汇总的区域,在进行决策时会引入隐藏状态C这一概念,其作用是记住权重较大的序列信息,最终由输出门进行数据输出。遗忘门,输入门和输出门的表达式如下:

式中:l为当前时间步长,x(l)为当前时间步长下的输入,h(l-1)为上一个时间步长下的隐藏层,bf为该门的增益向量,Wf为遗忘门的权重,sigmod、tanh 为激活函数,C(l-1)为上一时间步长的隐藏状态。

1.3 管道健康评价算法

电厂锅炉管道主要承受温度和压力影响,因此本研究的管道健康评价模型基于温度和压力的正常运行值和未来变化趋势。考虑温度和压力正常运行值、一阶和二阶导数分别表示温度和压力的未来趋势的评价函数可以表示为:

式中:M、N分别为序列的行数和列数,Oi,j、Gi,j分别为真实数据和GAN 生成的数据,α、β为权重系数。由于该函数可以评价GAN 所生成的数据与真实数据的相似程度,因此,与正常运行数据越接近的数据健康程度越理想。

通过以上方式,将工况划分为正常运行工况、升温工况、降温工况、非理想工况与临界工况。其中,正常运行工况、升温工况、降温工程均属于锅炉管道的标准工况,健康评价函数值在0.9 以上,运维人员无需处理,非理想工况健康评价函数值在0.5~0.9之间,系统产生提示,运维人员可根据实际情况选择忽略或提前采取措施。当评价函数值达到0.5 以下时,此时锅炉管道系统处于临界工况,系统产生报警,运维人员需根据管道预测的未来温度与压力趋势立即采取相应措施。该方法的优势是,避免了传统有限元仿真以及理论分析的复杂建模过程,以正常运行数据与设计理论计算数据为依据,再利用CNN-GAN 的数据扩充方法,结合评价依据生成不同相关度的数据集,扩充了合成数据集的工况范围。

2 基于CNN-GAN-LSTM 的混合模型

考虑第一部分的数学模型,建立图2 所示的CNN-GAN-LSTM 混合网络模型。首先由函数不断生成初始序列,生成的初始序列为0 到1 之间随机无序小数。初始序列经过由5 层全连接层组成的生成器,全连接层参数分别为128、256、512、1 024、816,最后一层使用Tanh 激活函数激活以后,重新排列为真实图像大小进行输出。输出的合成序列与真实序列同时输入判别器,在判别器中,一部分为3 层全连接进行的1-Lipschitz 算法,全连接参数为512、256 和1。全连接层部分使用LeakyReLU 作为激活函数,该激活函数避免了小于0 的部分陷入死区,不能向下传递的问题。另外一层用CNN 网络进行式(5)的计算,该部分由卷积和池化组成,卷积核大小为[5,5]、[4,5],步长为1,池化采用最大池化,每层之间用ReLU 函数激活。最后两部分权重各为0.5,计算完的权重返回到生成器和判别器,并且作为管道健康评价函数。多层卷积将输入序列分别提取为16×20×30、16×10×15、32×4×6、32×2×3 的高维矩阵,最后展开为192 个神经元,经由全连接层缩减为1 个神经元,通过Tanh 函数进行激活。激活后的神经元与上一部分的全连接层取权重后相加输出。加入多层CNN 卷积和全连接层的作用是实现管道健康评价算法的阈值对比和一阶二阶积分运算,使用CNN 的优点是扩大了二维序列的运算视野,并且兼顾到前后不连续的温度或压力序列。

图2 CNN-GAN-LSTM 结构图

将现有的真实数据和CNN-GAN 网络生成的扩充数据合并为合成数据集,将合成数据集按照主汽温度、冷再热温度、主汽压力、冷再热压力的方式排布,输入的序列长度为120,预测的序列长度包括未来30 步的预测数值和4 个1 位长度的健康状态评价值。预测网络采用两层LSTM 网络堆叠进行时序数据非线性处理,输出部分取LSTM 输出层最后一个时刻的权重,先由一层全连接层调整输出序列长度,全连接层长度为2 048,再分割为两块全连接,分别用以未来趋势走向的预测和健康状态预测。该方法的优点是避免了健康状态被温度、压力时序信号湮没,提升健康预测准确度。

由于温度和压力具有不同的数值范围,因此输入的数据需要进行归一化处理,以便减少模型训练时间,提升训练精度。预测网络所采用的损失函数为均方根误差(Root Mean Squared Error,RMSE),优化参数为Adaptive Moment Estimation。

3 结果与分析

3.1 电厂锅炉主汽、冷再热管道温度压力分析

本研究采用的数据为某电厂锅炉实际运行中的主汽、冷再热管道温度和压力数据,数据采样频率为1 min/次,数据时长为200 d,期间锅炉正常运行,计划停机两次。图3 所示为电厂锅炉管道的温度和压力趋势走向,其中T1、P1 分别为主汽管道的温度和压力,T2、P2 分别为冷再热管道的温度和压力。在正常运行情况下,主汽管道的温度和压力分别在550 ℃~600 ℃与15 MPa~27 MPa 之间,冷再热管道的温度和压力分别在300 ℃~350 ℃与2 MPa~6 MPa 之间。图中有两个非常剧烈的温度与压力下降再上升的走势,为该锅炉的停机整修状态。

图3 电厂锅炉管道长时间温度压力图

由于长时间的管道温度与压力图谱显示的为整体变化趋势,可以分析出长时间运行的波动范围和升温、降温工况下的走势,但是难以发现短时间内的波动趋势。因此,图4 展示了锅炉管道的短时温度和压力图谱,图中温度、压力的采样频率为1 min/次,序列长度为150 min,此时锅炉处在正常运行状态。从图中可以看出,主汽与冷再热管道的温度、压力波动趋势随负载变化而不断波动。主汽与冷再热管道的温度波动变化趋势类似,但即使在相对平稳的状态下仍有2 ℃~6 ℃的波动。从整体变化趋势看来,主汽管道的温度波动幅值略大于冷再热管道,且温度波动的剧烈程度也大于冷再热管道。主汽与冷再热管道的压力变化趋势各不相同,主汽管道的压力在23.4 MPa下以0.2 MPa 的幅值上下波动,冷再热管道压力在4.2 MPa 下以0.05 MPa 的幅值上下波动。整体看来,主汽管道的压力变化趋势大于冷再热管道。

图4 电厂锅炉管道短时温度压力图

3.2 基于GAN 的数据增强

依据以过去120 min 实现未来30 min 短期预测的要求,将现有数据集按照150 min 的长度切分为21 840 组。如图5 所示,为了方便GAN 网络匹配特征,将其重新排序为10×15 矩阵,并且于外围补全一层0 以便区分。将主汽与冷再热管道的温度、压力拼接成一个24×34 的一维矩阵,排序为二维矩阵的优点是方便CNN-GAN 网络生成更逼近真实的温度与压力序列,同时CNN 网络能在更高的维度上学习不同时间点下序列的值与一阶、二阶导数关系。

图5 不同网络生成数据集对比

由于温度和压力的特征值范围不同,在进行数据扩增前需进行归一化处理。从图中可以看出,原始数据在稳定运行时温度有一定的波动,压力波动相对较小。GAN 网络生成的数据集较为平滑,尤其是主汽与冷再热管道的压力波动幅度较小,而CNN_GAN 所生成的温度和压力数据波动性更强,接近于原始数据。GAN 网络生成的温度压力数值与原始数据近似,CNN_GAN 所生成的温度压力为临界温度压力,呈现深色。

随着CNN-GAN 网络的不断迭代优化,生成数据集也不断向真实数据集逼近。图6 展示了CNN_GAN 生成温度、压力数据集的优化过程,图中由4个子区组成,每个子区代表一种工况下的温度与压力,每个子区包含了主汽与冷再热管道的温度、压力的150 min 走势。从图中可以看出,迭代开始时的温度与压力信号为随机信号;迭代初期,模型能够区分出主汽与冷再热的温度与压力幅值大小,不会出现同一工况下某一区域的值过大或者是过小的现象;随着迭代进行,子区信号逐渐有序化,波动区域逐渐得到控制,生成数据的噪点逐渐减少,最终得到不同状态下幅值不同、波动具有一定规律的温度与压力数据集。

图6 基于CNN-GAN 的数据集扩展

为了进行详细对比,选取了GAN 和CNN_GAN中与真实数据相似度为80%的数据进行展开。如图7 所示,为归一化的主汽温度序列。从图中可以看出,普通GAN 网络生成的数据波动较大,但是来回波动的均值处在0.74 附近,证明GAN 判别器进行评价时图像均值的权重较大。CNN-GAN 的波动明显减小,波动的均值也处在0.74 附近,并且走势与真实数据接近。这是因为CNN-GAN 判别器学习了图像的二维分布规律,考虑了图像的均值以及一阶和二阶导数关系,证明上文中建立的管道健康评价算法起到理想效果。

图7 不同网络生成数据对比

3.3 基于合成数据集的温度压力预测

将GAN 生成的扩展数据集与真实数据集合并后打乱传递至预测网络,其中,真实数据共有27 565组,GNN-GAN 生成的仿真数据集共34 452 组。图8所示为500 组独立于训练集的验证集预测结果的均值绝对误差。其中,T1、P1 为主蒸汽管道的温度与压力,T2、P2 为冷再热管道的温度与压力。从图中可以看出,温度、压力的预测结果都处于5%以内,预测结果理想。在未来30 min 的预测走势中,500组数据的绝对误差呈现波动趋势,证明未来30 min的预测趋势并不会随时间增长而非线性增长。相较于温度而言,压力的预测误差稍大,并且冷再热管道的压力预测误差最大。31 列的数据为健康状态预测数据,与温度、压力预测趋势相同,冷再热管道的健康预测误差最大。这是因为冷再热管道的压力曲线比较复杂,从而导致压力预测与健康状态预测误差稍大。

图8 LSTM 预测误差

500 组数据的绝对误差验证表明了该方法对随机工况的适用性,但是电厂锅炉管道工况较多,必须分开进行验证。图9 所示为非理想工况下主汽温度未来30 步的温度预测。根据管道健康评价函数的定义,非理性工况指的是锅炉管道的温度与压力和正常运行的真实数据有一定的偏差,但是该数值又处在温度与压力设计承压范围内。OrT1 为主汽管道真实温度,ReT1 为主汽管道预测温度。从图中可以看出,正常运行情况下主汽的温度呈现上下波动状态,但是波动的数据都在归一化值0.9 以下,这是因为在进行最大最小归一化时选取了管道的最大承温作为归一化极大值。序号31 为此时的管道健康状态,可以看出此时健康状态不为1,即此时管道的健康状态不是非常理想,这是因为该工况下管道温度的极大值过高且波动较大,可以看出管道评价函数能够准确分辨正常运行工况和欠理想工况。未来30 步的预测在温度波动范围比较小时误差较小,波动较大时预测误差较大,但是整体最大误差在6%以下。

图9 非理想工况下主汽管道温度预测

温度预测验证完后需要对主汽管道的压力预测趋势进行验证。图10 所示为非理想工况下主汽压力预测,OrP1 为主汽管道真实压力,ReP1 为主汽管道预测压力。因为管道内的压力最大值达到归一化0.9,同主汽温度一样,当归一化压力达到0.9 时证明此时压力已经不在正常运行的真实数据集范围内,但是仍处于管道设计时的承压范围内。此工况下,主汽压力的波动形式与温度不同,证明预测网络对不同趋势的曲线都有比较好的预测效果。与主汽温度预测不同的是,主汽的压力预测极值是略大于真实的极值的,但是极值的误差都在4%以内。

图10 非理想工况下主汽管道压力预测

非理想工况下的温度与压力预测结果表明CNN-GAN 生成的数据集有着比真实数据集更大的温度、压力波动趋势且波动峰值超过真实数据集的峰值。该工况下的管道健康评价算法计算值也低于0.9,证明所建立的管道健康评价算法能够区分出生成的非理想工况数据集与真实数据集的异同,CNNGAN 扩充数据集的方式有效。

针对上文中提出的不同工况下管道健康函数的预测,图11 呈现了临界工况下冷再热管道的临界工况预测。OrT2 为冷再热管道真实温度,ReT2 为冷再热管道预测温度。从图中可以看出,此时温度处在归一化值0.95 附近,证明此时已经接近冷再热管道的设计承压,并且该工况下的温度一直呈现波动上升状态,证明CNN-GAN 网络有着良好的数据生成和判别能力,此时的管道健康数值也降低到了0.4左右,属于比较严重的管道健康状态,此时运维人员需要紧急采取操作,保证冷再热管道的正常运行。该工况下,预测的最大误差在-6%一下,未来30 min预测的最大误差出现在预测曲线的波谷,该波谷呈周期性出现,但是预测曲线的最小温度仍在归一化值0.9 以上,超过了实际运行数据集中的温度极值。

图11 临界工况下冷再热管道温度预测

为了验证健康评价函数的主要权重不是来自于判断当前的温度与压力值,还需要对温度、压力较低时的工况进行分析。图12 展示了在升温工况下,冷再热管道的压力预测结果。从图中可以看出,此时归一化压力处在0.55 附近,并且逐渐上升。正常运行时,归一化压力处在0.7~0.8 之间。图中的真实压力值在20 个步长前缓慢波动,这是因为电厂升温是一个缓慢的过程,需要花一天到两天的时间。在20 个步长以后,压力先上升后下降。预测的压力值在20 个步长以前与真实压力值十分接近,20 个步长以后最大误差为-4%,其后随着真实压力慢慢降低,误差也逐渐降低,最终在预测的结尾时与真实值贴近,误差也降到最小。31 为健康状态预测,此时的健康状态约为0.95,这是因为健康预测权重除了有曲线的一阶和二阶导数外,仍有曲线当前值作为参考。但是整体的预测处在0.9 以上,证明此时管道处在理想的健康水平。

图12 升温工况下冷再热管道压力预测

4 结论

本研究通过CNN-GAN 算法建立了电厂管道温度压力预测仿真数据集,提出了管道健康状态评价函数。将仿真数据集与真实数据集建立的合成数据集输入至建立的LSTM 预测网络,对比与分析了管道温度、压力和健康状态预测数据,结果发现:①CNN-GAN 算法比原始GAN 能够生成更加真实的管道温度、压力仿真数据集,CNN-GAN 生成的数据集有着更贴近真实数据的波动和数值区间;②建立的管道健康评价函数能够准确判定温度、压力超额定和短期波动较大等非正常工况,对指导运维人员检修以及提前预警具有一定的价值;③在未来30 步的预测步长中,不同工况条件下,建立的预测网络最大绝对误差控制在6%以内。

猜你喜欢
主汽波动工况
热网异常工况的辨识
不同工况下喷水推进泵内流性能研究
基于非负矩阵分解的高速列车走行部工况识别
羊肉价回稳 后期不会大幅波动
微风里优美地波动
2019年国内外油价或将波动加剧
灵活性改造抽汽口的选择
干湿法SO2排放波动对比及分析
主汽压力影响因素分析及解决方案
低水头工况下溪洛渡福伊特机组振摆工况的探讨