基于多图卷积神经网络的主汽温系统故障诊断

2023-02-22 14:15:48吴铮，张悦，董泽

动力工程学报 2023年2期

吴铮，张悦，董泽

(1．华北电力大学控制与计算机工程学院,北京 102206；2．河北省发电过程仿真与优化控制技术创新中心,河北保定 071003)

随着我国“2030年实现碳达峰，努力争取2060年前实现碳中和”宏伟目标的提出，火力发电机组面临着低碳排放改造和新能源发电并入等一系列困难与挑战。现阶段，火力发电机组大多采用容量大、效率高的大型锅炉，主汽温系统的结构也变得愈发复杂。主蒸汽温度系统能否安全、稳定运行对火电机组的运行可靠性具有关键作用。主蒸汽温度过高会降低金属部件受热面的整体强度，机组发生故障的风险增加；主蒸汽温度过低则会大幅降低机组运行效率，从而影响机组的运行功率。同时，主汽温的剧烈变化也会对汽轮机运行的稳定性产生影响，所以主汽温系统的故障诊断研究具有重要意义。基于数据驱动的故障诊断方法可以充分利用已有的热工过程数据资源，可以准确高效地识别机组的故障类别。基于数据驱动的故障诊断方法已被广泛应用于电力系统[1]、热能工程[2]、航空航天[3]、新能源汽车[4]和化工[5]等领域。

目前，各地燃煤电站的智能化系统软件中储存着大量的机组历史运行数据，这为基于数据驱动的故障诊断方法的研究提供了信息基础。工业故障诊断方法主要分为定性分析和定量分析两类方法。其中，定性分析方法包括图论方法[6]、专家系统[7]和定性仿真[8]等，定量分析方法包括基于解析模型[9]和数据驱动[10]等方法。文成林等[11]对近年来基于深度学习的工业故障诊断技术进行了综述与探讨。韩旭东等[12]提出了一种基于知识图谱的火电机组智能诊断方法，通过结合专家信息构建知识图谱，建立了火电机组智能辅助诊断系统。王文标等[13]针对工业锅炉系统的多模态特性，利用交叉分段主成分分析方法进行故障诊断。顾崇寅等[14]提出了基于CatBoost算法的故障诊断方法，实现了在小规模训练集下对不同程度故障的准确诊断。但上述所提方法通常只对某些特定对象的故障诊断具有较高的识别精度，泛化能力较差。针对主蒸汽温度系统具有大迟延、大惯性、非线性和时变性等特性，笔者尝试采用基于深度学习的数据驱动方法来提高主汽温系统的故障诊断精度。

图卷积神经网络(graph convolution network，GCN)是由频谱卷积神经网络(Spectral CNN)和切比雪夫网络(ChebNet)演变而来的模型[15]。图卷积神经网络采用卷积操作和傅里叶变换等方法对图信息进行处理，结合深度图卷积结构实现数据的分类与回归。GCN可以建立各个节点间拓扑结构的连接关系，同时利用图卷积结构自适应地提取输入数据间的各项特征，所以在复杂工业运行数据的建模方面具有优势[16]。目前，图卷积神经网络已被成功应用于多个领域的故障诊断工作。Li等[17]建立了一种基于图神经网络的新型智能故障诊断与预测模型，模型在多个数据集中均取得了良好的诊断效果。Gao等[18]针对小样本机械故障诊断困难的问题，提出一种基于半监督图卷积神经网络(SSGCN)的智能故障诊断方法。Zhang等[19]提出采用剪枝图卷积网络(PGCN)进行特征提取与故障诊断，通过图结构的剪枝方法有效地从过程故障数据中提取重要信息，结果表明PGCN在特征提取和过程故障诊断方面的性能优于其他典型方法。然而，图卷积神经网络在国内火力发电生产建模方面的应用还处于探索阶段。

笔者提出了一种基于多图融合的图卷积神经网络(MG-GCN)模型，引入特征权重和截断参数来融合多图特征信息，将火电机组历史运行数据扩展为非欧式空间的图数据。同时，利用深层图卷积结构建立历史数据与系统运行状态间的映射关系，实现主汽温系统的故障诊断。

1 图卷积神经网络

GCN主要包括空域卷积和频域卷积，通过深度学习思想对图结构数据进行学习。空域卷积采用卷积神经网络中的卷积操作直接对图进行卷积。频域卷积通过图傅里叶变换和图傅里叶逆变换等进行图卷积[20]。所提出的多图卷积神经网络模型主要基于频域图卷积思想。

假设存在图结构G(V,E)，节点间邻接关系用图结构中全部边的集合E来进行描述，V为所有节点的集合，节点总数为N，节点特征数为T。将每个节点i的特征定义为xi，整体特征矩阵表示为XN*T。拉普拉斯矩阵L用于描述图结构G(V,E)的特征信息，具体公式为：

(1)

式中：A为邻接矩阵；D为顶点的度矩阵；IN为N阶单位矩阵。

通过特征分解所获得的特征向量和特征值可用于表示图结构中的信息。矩阵L分解后的结果为：

(2)

式中：λl为特征值,l=1,2,…,N;U为特征向量矩阵；Λ为分解后所得的特征值矩阵。

通过傅里叶变换后的图信息F(λl)为：

(3)

图卷积公式可以表示为：

g*x=UgθUTx=

(4)

在上式中，特征向量矩阵U的复杂度为O(N2)。当图结构比较庞大时，过大的计算量容易导致模型的运行效率降低。针对上述问题，Hammond等提出了利用Chebyshev多项式来进行处理：

(5)

图卷积层通过提取和融合图结构中的特征信息，对输出数据进行压缩处理，最终输出故障诊断结果。图卷积隐含层信息传递的公式为：

(6)

式中：σ为激活函数；W(l)为权重参数矩阵；H(l)为第l层的图节点矩阵。

图卷积神经网络的基本结构如图1所示。

图1 图卷积神经网络结构

2 模型整体结构

2.1 邻接矩阵的建立

图的生成是建立图卷积神经网络模型的关键。图数据形式可以有效地融合主汽温系统中各监测参数间的邻接关系和运行数值信息，形成拓扑结构，从而降低系统延迟、惯性程度高的影响。如果构建的图拓扑结构不能有效地反映节点间的相关性，系统延迟和惯性的干扰将会增加，从而降低故障诊断精度。

在构建图时，需要保证具有强信息相关性的变量间相互连接。目前针对于工业数据集，机理分析[21]和最近邻算法[22]是建立图数据的常用方法。为了更全面地度量主汽温系统中运行数据的特征信息关系，完成图拓扑结构的构建，笔者建立邻接特征图和相关性特征图，并利用图融合方法结合多图信息，生成样本数据间的拓扑结构。

2.1.1 邻接特征图

邻接特征图GN(V,E,AN)用于描述相邻近节点之间的空间特征关系。将每一个样本数据点作为一个节点，AN表示邻接特征矩阵，具体计算公式为：

(7)

(8)

式中：aij为样本数据vi与vj之间边的权值；dist(vi,vj)2为样本数据vi与vj之间的欧式距离；ζ为距离的标准差；η为常数项，取值为10；kl为用于确保特征矩阵稀疏性的阈值，取值为0.1。

2.1.2 相关性特征图

相关性特征图GS(V,E,AS)可表示空间距离较远但仍存在强关联性节点间的依赖关系。采用皮尔逊相关系数(Pearson Correlation Coefficient, PCC)来评估各节点之间的相似性程度。各样本数据间的皮尔逊相关系数值构成了相关性特征矩阵AS，具体计算公式为：

(9)

(10)

式中：bij为样本数据vki与vkj之间的皮尔逊相关系数值；xki和xkj均为输入变量。

2.1.3 特征图融合

特征图融合主要是指将建立的邻接图和相关图合并，充分提取各图拓扑关系之间的内在特征联系。现阶段的多图融合方式主要分为多图累加[23]和网络优化[24]等方式。针对小样本数据集，为防止模型过于复杂，出现训练时间长、收敛效率慢等问题，笔者采用多图累加方法，引入特征权重Wi和截断参数C来约束各节点间相关性，优化拓扑结构。具体计算公式如下：

(11)

(12)

2.2 模型基本流程

图2为多图卷积神经网络结构示意图。其中，a1～a7、b1～b6、X1～X10、Y1～Y6均表示图节点，1～6表示故障类型。图3为模型的整体流程图。基于多图卷积神经网络的主汽温故障诊断模型的具体步骤为：首先，对数据集进行预处理，归一化处理样本数据，消除各项特征值间的差异，采用组合特征选择方法进行特征提取，再使用KPCA方法提取主成分，降低非线性影响，生成特征矩阵，提升整体运行的精度和效率；其次，计算邻接特征矩阵AN和相关性特征矩阵AS，引入特征权重Wi和截断参数C，采用多图累加的方式融合多图信息，建立图网络的拓扑结构，生成邻接矩阵AT；设置图卷积层的层级结构、学习率和迭代次数等参数，选择Adam方法优化模型训练过程；再输入训练数据集，对图卷积神经网络模型进行训练，在模型训练过程中，结合训练结果调节各参数的设定值，使模型达到最优检测性能；最后，输入测试数据集，在深度图卷积层中自适应地提取出图数据的各项特征，得出主汽温系统的故障诊断结果。

图2 多图卷积神经网络整体结构示意图

图3 模型整体流程图

3 仿真实验结果与分析

3.1 实验数据集及预处理

采用国电智深DCS控制系统和STS仿真机平台进行故障模拟。笔者分别模拟了国电泰州电厂二次再热机组800 MW稳态工况下的5种主汽温系统故障状态，采集各故障状态和正常运行下的样本数据并组成实验数据集，验证所提模型的有效性。原始数据共6 000组。其中，训练集包括800组正常运行数据和4 000组故障数据，每种故障类型数据各800组；测试集包括200组正常运行数据和1 000组故障数据，每种故障类型数据各200组。表1给出了系统的故障及类别。

表1 系统主要故障类型

采用准确率、误判率和漏检率来评价模型的故障诊断效果，具体计算如下：

(13)

(14)

(15)

由于主汽温系统各参数间的数值水平相差较大，为防止数值水平过高或过低的数据被过度削弱或凸显，进而影响图结构的构建，所以对原始数据集进行归一化处理。同时，对数据集进行无效点去除、填补无效值和空数据等预处理。将各类别数据间差值大于整体均值5倍的数据定义为无效点，并用无效值与空数据前后25个点的均值进行填补。

为避免采用单一特征选择方法在选取特征时存在原理性差异，采用组合特征选择方法提取特征参数。依次使用最大互信息系数(MIC)、分类与回归决策树(CART)和XGBoost等方法计算各监测参数与主汽温间的相关性，对结果进行归一化求和并取均值，设定阈值为2%，选取出具有强关联性的重要运行参数。表2给出了所选主汽温系统的关键运行参数，图4为各参数与主蒸汽温度之间的相关性均值图。其中，高过表示高压过热。

表2 主汽温系统监测参数

图4 相关性均值图

数据预处理完成后，选择高斯径向基函数作为核函数，采用KPCA提取样本数据的非线性特征，降低系统非线性对建模的影响。根据累计贡献率大于95%的规则确定主元个数。图5为主成分累计贡献图。由图5可知，前11个主成分累计贡献率已经达到95%，因此主成分个数设置为11。

图5 主成分贡献图

3.2 图结构的生成

将提取的全部主成分数据作为各节点的特征信息来构建邻接特征图和相关性特征图，引入特征权重Wi和截断参数C融合生成多图拓扑结构，建立邻接矩阵。特征权重Wi主要用于衡量邻接图和相关性图的融合比例程度，设定W1=W2=0.5。图6给出了多图融合后的特征矩阵图和邻接矩阵图。

由图6(a)可知，由于节点与自身的相关性最大，所以其对角线是一条明显的突出亮线。由图6(b)可知，选取不同的截断参数C时，数据间也呈现不同的邻接关系。当C较小时，节点间的邻接关系较为松散，特征信息没有充分融合，在降低模型运行效率的同时也引入了过多的非相关性向量；当C较大时，节点间的邻接关系较紧凑，邻接关系易出现过度关联，从而影响模型的故障诊断效果。

(a) 特征矩阵图

构建完成图结构的特征及邻接关系后，将特征矩阵、邻接矩阵等输入多图卷积神经网络进行迭代。通过若干层深度图卷积结构的特征融合和维度变换，自适应学习网络的权重参数，生成拓扑结构与故障类型间的映射关系，输出主汽温系统的故障诊断结果。模型各项参数配置情况如表3所示。

表3 图卷积神经网络参数

3.3 不同截断参数和图结构下的对比试验

不同截断参数会影响模型的故障诊断性能。为了进一步提高多图卷积神经网络的整体性能，选择多个截断参数C进行模型的故障诊断性能对比，计算相应的模型评价指标。

不同截断参数下的故障诊断结果对比结果见表4。随着截断参数C的增大，故障诊断模型的性能也随之变化。当C=0.95时，模型训练集和测试集的评价指标均最佳，当截断参数继续增大时，模型精度下降，邻接关系出现过度关联。因此，选用0.95作为最佳截断参数。

表4 不同截断参数下的故障诊断结果

图的生成是建立图卷积神经网络模型的关键。图构建的原则是保障信息相关性强的变量之间相互连接。为验证多图融合方法的有效性，分别使用邻接图、相关性图和融合图等方式生成图数据，其中模型参数保持不变。表5和图7为不同图结构下的故障诊断结果。由表5和图7可知，与采用融合图相比，仅使用邻接图或相关图建立图数据结构时整体故障诊断性能均较低，证明了所提出的多图融合方法的有效性。

表5 不同图结构下的故障诊断结果

(a) 邻接图

3.4 对比试验

为进一步验证模型的有效性，选取现阶段故障诊断方法中效果较好的概率神经网络(PNN)、长短期记忆神经网络(LTSM)和最小二乘支持向量机(LSSVM)算法进行对比。所提MG-GCN模型的参数设置不变，截断参数为0.95。各算法下的评价指标见表6。设定LSTM的学习率为0.001，网络层数为3，隐层神经元个数为100，训练次数为3 000，模型优化方法保持不变。设定PNN中平滑因子为0.83，其余参数与LSTM一致。LSSVM中核函数选用高斯核函数，设定惩罚因子为45.56，核函数参数为0.13。相较于PNN、LTSM和LSSVM，MG-GCN的准确率分别提升了11%、7%和16%，说明该模型针对主汽温系统有良好的故障诊断性能，极大地降低了误检、漏检发生的概率，解决了系统具有大迟延、大惯性、非线性和时变性的问题，保证了火电机组的安全、稳定运行。

表6 各算法下的评价指标

4 结论

相较于PNN、LTSM和LSSVM，所提MG-GCN模型的故障诊断准确率分别提升了11%、7%和16%，误检率、漏检率均较低，具有良好的故障诊断性能，保证了火电机组运行的安全性和稳定性。