VMD和随机森林在反应堆金属撞击信号识别中的应用研究

2021-03-17 05:54刘才学杨泰波王广金
振动与冲击 2021年5期
关键词:变分反应堆决策树

者 娜,刘才学,杨泰波,何 攀,简 捷,王广金

(中国核动力研究设计院,成都 610200)

随着核电站反应堆运行时间的推移,反应堆某些零部件可能会因冲击、振动等因素而发生脱落。同时,在核电站反应堆安装或检修时,存在着将金属件遗留在反应堆系统内的风险。这些金属部件会在冷却剂的带动下不断游动而与压力边界产生碰撞,若不能及时将其发现,将使压力边界遭到严重破坏而危及反应堆安全。为了保证核电站反应堆系统的安全性,通常核电现场会采用松脱部件监测系统来对撞击信号进行监测,以识别是否存在松脱部件[1]。但在实际情况中,监测系统可能会因为现场复杂的工况条件、环境因素等而记录大量非撞击信号的信号,即脉冲尖峰信号、噪声信号、自检信号、噪声波动信号、通道闪断信号。因此有必要从监测系统采集到的信号中将真实撞击信号识别出来,以便于后期进一步的松脱部件确认。在国外,金属撞击信号识别过程主要依靠专家利用自身身经验对监测系统所采集的数据进行分析以得出结论,可靠性依赖于专家的分析水平,并且无法避免数据量大耗时过长的缺点,一旦反应堆存在金属松脱部件,可能由于无法实时给出诊断结论而导致严重的后果,对核电运行安全产生威胁。在国内,研究人员在采集端系统抗信号误报警方法研究方面做了大量工作,取得了一些进展,但目前核电站监测系统由于外界干扰或其他因素导致的系统误报警、误触发问题仍然未得到有效解决,大量干扰信号导致的“误触发”给诊断人员及时给出诊断结论带来了极大困难,因此,有必要利用智能识别手段来快速识别监测系统已采集到的单个通道信号是否为金属撞击信号。反应堆松脱部件的诊断主要包括金属撞击信号识别和综合诊断两个过程,诊断结果的准确程度与能否准确识别金属撞击信号直接相关。六类信号中,撞击信号来自外界真实撞击,而其余信号并非由撞击产生,如由于采集板卡的自激励脉冲而产生的脉冲尖峰信号,监测系统为定期进行自身性能检验而通过力锤器产生的自检信号,由于监测通道受外界运行环境影响而产生的噪声波动信号,由于电荷转换器过载保护导致的通道闪断。与干扰信号频率分布杂乱无规律相比,实际的金属撞击信号中包含了多种频率成分,且存在于某一较宽频带范围内,若采用全频带范围内的单一特征作为信号特征,将很难全面描述撞击信号与监测系统所采集的其他信号之间的差异,这给金属撞击信号的识别工作带来一定的困难,进而影响后续松脱部件的精确诊断。

变分模态分解[2]是近些年国内外学者广泛关注的一种信号分解方法,它能将信号按照其频率自低到高的顺序,自适应地分解为一定数目的固有模态分量(IMF),且分解过程中各分量频带无需人为干预,非常适用于处理非线性、非平稳信号。本文拟采用VMD方法将信号分解为若干个频带的分量并提取信号特征,以实现对信号的全面描述。但经VMD处理后得到的信号特征维数过高,支持向量机等智能分类方法分类准确率会随着特征维数的上升而下降,且支持向量机这类智能算法的分类准确率很大程度上取决于模型参数的的选择[3-5]。因此,需要寻找一种新的算法来进行信号的智能分类。

随机森林[6]是在20世纪80年代提出的分类树算法基础上发展起来的一种无需调参的智能分类算法,它通过多棵分类树的组合来实现分类,在处理高维数据方面具有明显的优势。

针对上述问题,笔者提出了一套新的反应堆撞击信号识别方法,采用VMD方法对信号进行分解得到各IMF分量信号,分别提取各分量信号的时域、频域特征构成原始信号特征向量,将原始信号特征向量作为输入,信号类型作为输出,建立随即森林分类模型来实现反应堆金属撞击信号的识别。

1 变分模态分解原理

Dragomiretskiy等[7]于2014年提出了一种新的信号处理方法—变分模态分解,作为一种新的信号处理方法,变分模态分解具有自适应、非递归特点,该方法在变分框架内来实现多成分信号的分解,通过迭代搜索变分模型的最优解,确定各个模态分量的带宽及其频率中心,从而自适应地实现包含多成分的信号中各个分量的有效分离,为从不同频带细致描述非线性且包含多种频率成分的金属撞击信号提供了条件。

假定各个模态分量μk是频率中心为wk的有限带宽,则约束变分模型可表示为[8]

(1)

式中,k为最终分解得到的分量个数。

为获得上述约束变分问题的最优解,引入二次惩罚参数α和拉格朗日乘子λ(t),将上述问题转换为非约束变分问题来求解。其中,二次惩罚参数可很大程度上减少高斯噪声带来的影响,而拉格朗日乘子是常用的一种保持约束严格执行的方式[9]。增广的拉格朗日函数可表示为

(2)

至此,初始的变分问题可通过拉格朗日法的交替方向乘子来实现求解,具体步骤如下:

步骤1 初始化μk、ωk、λ和n为0;

步骤2n=n+1,执行整个算法循环;

步骤4k=k+1,返回步骤3,重复至k=K时首个内层循环结束;

步骤6k=k+1,返回步骤5,直至k=K时内层第二个循环结束;

2 随机森林原理

随机森林算法是以CART决策树作为弱分类器的一种组合分类算法,其本质是一种由随机生成的若干个决策树组成的强分类器[10]。它在实现分类时要经历两个过程,分别为生成决策树过程和投票过程,其原理是针对原始样本集,每次选择样本构成一个容量小于原始训练样本集的训练子集并对应生成一棵决策树,再由N个决策树构成随机森林完成对原始训练样本的分类训练。其中,选择子集的和生成决策树的过程均是随机的。

2.1 生成决策树

随机森林是一种典型的Bagging方法,它应用自助法(bootstrap)重采样技术生成多个决策树分类器。决策树的生长步骤如下:

步骤1 从由M个样本数据构成的初始训练集数据中有放回地随机选择样本数据构成一个样本数量为N(N

步骤2 针对具有K个特征属性的样本子集,在单棵决策树的各个节点处,随机地从K个特征属性中选择m个特征属性,并且以节点不纯度最小为标准从上述特征属性中选择某个特征属性进行分裂生长,重复上述过程直至该决策树遍历所有的特征属性。在整个森林的生长过程中m将保持恒定。

随机森林中的单棵决策树从根节点开始对训练样本子集进行划分,它是一种自上而下递归分裂产生的二叉树。决策树分裂过程,是以分裂节点不纯度最小为原则分裂为两个节点,规则不变依次分裂直至满足分支终止规则时分裂终止。

随机森林采用的CART决策树在节点处随机选择特征属性的过程中,其选择标准为各个节点Gini不纯度最低。Gini不纯度可表示为

(3)

式中:G(i)为节点i的不纯度,设Pw是节点i上样本属于w类(假设样本的特征属性数量为W)的频率。

图1为单棵决策树的结构示意图,t0为根节点,ti(i≥1)表示分裂节点,Nt表示终端节点。

图1 决策树结构示意Fig.1 Decision tree structure

2.2 投票过程

生成若干个决策树后,由全部决策树构成随机森林分类器。采用随机森林分类器对样本数据进行分类时,最终的分类结果是通过对各决策树的分类结果进行投票来确定的,投票过程可表示如下

(4)

式中:nt为构成随机森林的决策树个数;I(*)为性函数;nhi,C为决策树hi对预测类样本C的分类结果;nhi是决策树hi的叶子结点数。

经投票后,生成混淆表CM,它是一个nc×nc表。表中的元素cm(ω≠∈)表示类型ω被分类为类型∈的次数,仅当(ω=∈)时,cm(ω,ω)表示类型ω被分类正确的个数。随机森林分类正确率CRT为

(5)

随机森林的分类原理决定了它在处理数据时,能够避免由于模型输入数据维数上升而使得分类精度下降的情况,保证了在原始信号特征维数较大的情况下,仍能获得良好的分类效果。

2.3 基于VMD_RF的反应堆金属撞击信号识别方法

本研究采用VMD和随机森林相结合的方法进行反应堆金属撞击信号的识别,具体流程如下:

步骤1 对原始信号进行VMD分解,得到分解后的N个固有模态分量信号;

步骤2 针对每一个IMF分量信号,提取16个时域特征量[11],如峭度、方根幅值、偏斜度指标等,时域特征参数反映了信号时域振动幅值、能量以及时间序列分布情况,同时根据式(6)、式(7)和式(8),提取3个时域特征量,式(6)为标准差计算公式,式(7)为衡量数据稳态变化的指标,式(8)为衡量信号突变的程度。针对各IMF分量信号频谱,提取13个频域特征量[12],如重心频率、均方频率、频率方差等,它们反映了振动信号频谱集中程度、主频带位置的变化等频域情况,将上述32个指标作为此IMF的特征;

(6)

(7)

F3=max{|xi|}/F2

(8)

步骤3N个固有模态分量信号的特征构成一个包含N×32个元素的特征向量,作为原始信号的特征向量;

步骤4 将上述过程提取的原始信号特征向量作为输入,信号类别作为输出,建立随机森林模型,利用测试样本验证模型分类的准确程度。

图2为反应堆金属撞击信号识别流程图。

图2 反应堆金属撞击信号识别流程Fig.2 Recognition process of reactor metal impact signal

3 反应堆金属撞击信号识别分析

3.1 数据获取

数据来源为国内某核电站现场LPMS监测系统记录的数据,LPMS系统主要由加速度传感器、信号调理、数据采集卡(A/D转换)、数字信号处理芯片、计算机构成。加速度传感器布置在反应堆压力容器顶部和底部,监测系统的采样频率为50 kHz,采样时间为1 s。本研究中获得的样本包含六种信号类型数据,信号类型分别为撞击信号、自检信号、噪声信号、脉冲尖峰信号、通道闪断信号、噪声波动信号,六类信号时域波形如图3所示。将样本分为训练集和测试集,其中训练集样本容量和测试集样本容量分别为800和240,样本数量如表1所示。

表1 各类信号样本数量

3.2 识别结果及分析

笔者以金属撞击信号为例,说明VMD分解和特征提取过程。首先对原始信号进行VMD分解,研究表明[13],模态分量的分解层数影响着VMD分解结果的合理性,理论上经VMD分解后得到的各个模态分量信号的频率分布情况为由低到高,当最后一个分量信号的中心频率第一次达到最大值时的分解层数即为最佳分解层数,本研究中通过观察最后一个分量信号的中心频率确定出VMD最佳分解层数为4,信号分解后得到由低频到高频分布的4个IMF分量,如图4所示。然后求取各个IMF分量信号的频谱,结果如图5所示。

其次,根据特征计算公式提取撞击信号IMF1分量信号的19个时域特征量,以及13个频域特征量,依次提取IMF2、IMF3及IMF4的相同特征。将从4个IMF分量信号及其频谱中提取出的128个特征量作为原始信号的一组特征向量。同理,对脉冲尖峰信号、噪声信号、自检信号、噪声波动信号以及通道闪断信号提取特征向量。六类信号各自的128个特征的特征值如图6所示。

(a) 撞击信号

(b) 脉冲尖峰信号

(c) 噪声信号

(d) 自检信号

(e) 噪声波动信号

(f) 通道闪断信号图3 原始信号时域波形Fig.3 Tine-domain waveform of original signals

(a) IMF1

(b) IMF2

(c) IMF3

(d) IMF4图4 撞击信号各IMF分量信号Fig.4 IMF components of impact signal

(a) IMF1

(b) IMF2

(c) IMF3

(d) IMF4图5 撞击信号各IMF分量信号频谱Fig.5 Frequency spectrum of IMF components of impact signal

由图6可以看出,不同类型信号经VMD分解后提取的特征在数值上和变化情况上存在明显的差异,说明本研究所采用的特征提取方法提取出的特征的在全面表征原始信号所含的信息方面是有效的。

将上述过程提取出的训练集特征作为输入,训练集样本信号对应的类别标签作为输出,建立随机森林模型,其中随机森林模型的决策树个数为500(默认参数)。将测试集特征作为随机森林模型输入,进行预测分类。为对比和评估模型分类效果,采用将训练集特征作为输入向量建立的支持向量机模型和从未经VMD分解的原始信号中提取的相同特征作为输入建立的随机森林模型来对测试集进行分类,其中,SVM的核函数为径向基核函数,采用网格法进行参数寻优,惩罚参数c为84,核函数参数g为0.1,分类结果如图7所示。

(a) 撞击信号(b) 脉冲尖峰信号(c) 噪声信号

(d) 自检信号(e) 噪声波动信号(f) 通道闪断信号图6 六类信号特征值Fig.6 Eigenvalues of six kinds of signals

(a) VMD_SVM模型(b) RF模型(c) VMD_RF模型图7 三类模型分类结果Fig.7 Classification results of three models

从图7可以看出,三类模型均能实现六种信号的分类,但明显可以看出,三类模型中,本研究提出的方法建立的VMD_RF模型在实现上述信号分类时错分样本最少。计算三种模型分类结果的分类误差,误差计算结果如表2所示。

表2 三类模型分类误差

从表2可以发现,三类模型中支持向量机分类模型的分类误差最大,为17.01%,RF模型的分类误差为7.47%,而VMD_RF分类模型的误差仅为2.90%,进一步说明了VMD分解后提取的信号特征更全面地表征了原始信号的信息,同时说明在实现反应堆金属撞击信号识别方面,VMD_RF模型的识别效果要优于单一的随机森林模型和支持向量机模型。

4 结 论

通过实际工程实例验证表明,采用基于变分模态分解和随机森林的方法进行反应堆金属撞击信号识别是有效的。本研究主要结论如下:

(1) 利用变分模态分解将原始信号分解为多个分量信号,能够实现从多频带角度描述包含多个频率成分的原始信号。

(2) 提出的基于变分模态分解的反应堆金属撞击信号特征提取新方法提取的特征可以更全面地表征原始信号所含的特征信息,解决了由于特征信息不足而导致的识别精度低的问题。

(3) 构造的VMD_RF分类模型,可实现反应堆金属撞击信号的识别,并获得良好的识别效果,避免了由于特征维数上升后模型构建不合理而产生的识别精度下降的缺陷,为后续松脱部件的进一步确定奠定了良好基础。

猜你喜欢
变分反应堆决策树
逆拟变分不等式问题的相关研究
求解变分不等式的一种双投影算法
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
关于一个约束变分问题的注记
月球反应堆屏蔽研究
一个扰动变分不等式的可解性
基于决策树的出租车乘客出行目的识别
核电反应堆压力容器顶盖J型接头内壁残余应力
铅基反应堆研究现状与发展前景