杨磊
(昆明工业职业技术学院,云南 昆明 650302)
基金项目:本文系2022 年度云南省教育厅科学研究基金项目“基于管道协同创新中心校企共研的VMD 样本熵集成学习管道泄漏故障识别研究”(2022J1431 )研究成果。
运输管道运行环境复杂多变,当管道发生故障时,故障信号很难收集和识别。因此,本文提出采用通过模拟实验获取不同类型的3 类信号:金属棒敲击、砂纸和断铅3 种声发射声源信号。对获得的实验数据进行EEMD分解,并求取近似熵作为特征向量,应用BP 和PNN 进行信号识别,对比基于EEMD 近似熵和BP 故障识别和基于EEMD 近似熵和PNN 故障识别的识别率。
由Huang 等提出了经验模态分解(Empirical Mode Decomposition,EMD)是一种自适应信号分解方法。EMD 方法不需要选择基函数,根据信号特征自适应地将其分解为一组固有模态函数分量,在非平稳、非线性信号处理领域得到了广泛的应用。由于其对信号的间歇性等复杂问题存模态混叠问题,致使信号分解结果失真,在复杂的信号处理场合受到了限制。为了克服EMD 存在的缺点,Wu 和Huang 提出了一种新的添加噪声的EEMD 方法—聚合经验模态分 解(Ensemble Empirical Mode Decomposition,EEMD),EEMD 在改善模态混叠方面取得了较大进展。
EEMD 分解方法的具体步骤如图1。
图1 EEMD 方法算法流程图
近似熵(A p p r o x i m a t e Entropy ApEn)指的是由Pincus 根据k 氏熵的定义将近似熵函数定义为相似性的向量,相对原始化的信号,随机化的信号衍生的一系列信号具有更高的熵值,即使原始随机信号可能代表在多个不同时空空间尺度上具有相关性结构的复杂动力学信息输出。但是,这种产生原始衍生信号的技术旨在彻底打破衍生信号间的复杂联系,从而大大降低了原始衍生信号过程中的复杂信息量。近似熵计算原理如图2 所示。
图2 近似熵原理图
近似熵的算法表述如下:
(1)设存在一个以等时间间隔采样获得的m 维向量x(i);
(2) 计 算 向 量x(i)与 其 他 向 量的距离;
(3)给定阈值r(r>0),r一般为0.2,对每个ci统计dij<r的数目;并计算出总数(N-M)与数目的比值,记作即:
得到近似熵估计值,并记作:
满足:
假设有n个样本,第i样本所计算出来的近似熵特征为:
所有样本所计算出来的近似熵共同构成了近似熵特征矩阵:
近似熵特征矩阵:
1986 年由Rumelhart 和McCelland 为首的科学家小组提出BP(Back Propagation)神经网络,BP 神经网络需要进行学习和存储输入-输出关系,当通过不断的训练,调整不同的参数后,得到合适的训练函数和参数后,形成高识别率的运算模式,这时再输入测试信号,将得到最终所需要的识别效果。
BP 神经网络包含3 层结构。所建立的BP 神经网络各层神经元个数随着样本类别个数和输入样本的维度不同也会相应改变。样本的维度决定了输入层神经元的个数,同时,因本文是设置3 种故障识别,所以输出层神经元的个数决定了样本分类个数为3 类。
BP 神经网络算法的学习步骤如图3。
图3 BP 神经网络算法过程
图4 断铅、敲击、砂纸3 种信号经EEMD 分解的IMF 分量
图5 BP 神经网络的具体结构
基于EEMD 近似熵和BP、PNN 故障识别步骤如下。
(1)采集断铅、敲击、砂纸3 种故障信号。
(2)用EEMD 方法对采集的信号进行分解,之后数据求取近似熵并进行归一化处理。
(3)选取一定数量的训练样本进行程序测试,然后再输入测试样本,分别用BP 和PNN 网络进行识别,得出实验结果,比较不同神经网络的识别率。
经EEMD 分解后断铅、敲击、砂纸信号分解出来的IMF 分量,除了第一个为原始信号分量,前5 个IMF 分量包含故障信号的主要信息,又因为EEMD 方法对相应故障分量进行分解后,分解出的分量比较多,经过比较分析后取EEMD分解得到的前6个IMF分量来提取特征值,第一列的分量跟原始信号分量相同,所以我们取第二列的分量作为IMF1 分量。
BP 网络包括输入层、隐含层和输出层,而输入层的个数由输入数据的维数决定,所以对于每个样本特征向量维数为都5,故障类别为3 类。
近似熵为特征向量,BP 神经网络训练与测试过程:每种信号共有60 组近似熵样本,每种故障随机选出40组向量,3 种共120 组作为训练样本;每种故障随机选出20 组特征向量,3 种共60 组作为测试样本,设置BP 神经网络参数为:训练次数为1000,训练目标为0.01,学习速率为0.1。
设定训练样本为输入量X,用BP 网络进行训练,比较实际输出Y与期望输出iY的差值大小,若差值大于设定值,则网络会自动调整连接权值Wih、Whj和阈值,最终使输出达到或接近期望值,此时,BP 网络就是实验所需要的测试网络。
试验结果,BP 网络断铅信号的识别率为75%,识别率居中;敲击故障的识别率为85%,识别率较高;砂纸信号的识别率为65%,识别率最低。基于EEMD 近似熵和BP 神经网络对断铅、砂纸、敲击的识别率高低分别为:敲击>断铅>砂纸。
为了进行对比,我们用PNN 来做声发射故障识别。概率神经网络(Probabilistic Neural Network,PNN)最早是由D.F.Speeht 博士在1989 年首先正式提出,是优径向自由基神经网络的一个重要分支,属于径向前馈神经网络的一种。它具有以下几大点;学习程序过程简单、训练过程速度快;准确分类,容错性好等。从技术本质上看,它只是属于一种有严格监督的新型分类器,基于贝叶斯最小风险准则。PNN 的层次模型,由输入层、模式层、求和层、输出层共4 层组成。
由于每个样本中特征向量维数为5,故障信号为3类,因此本章中PNN 神经网络的输入层采用5 个神经单元,分别对应输入的特征向量为Aj1,Aj2,…,Aj5;PNN 网络的输出层为3 个输出神经单元,分别对应输出的特征向量为数据断铅Y1、数据敲击Y2、数据砂纸Y3。
以近似熵为特征向量,PNN 概率神经网络训练与测试过程:每种信号共有60 组近似熵特征向量,每种故障随机选出40 组向量,三种共120 组做为训练样本;每种故障随机选出20 组特征向量,三种共60 组作为测试样本。
通过试验发现,对于60 组测试样本,对于断铅故障信号识别率为PNN 网络识别结果60%,较相同条件下BP 识别率(75%)有所降低;敲击故障信号识别率为85%,与相同条件下BP 识别率(85%)相同;砂纸故障信号识别率为70%,较相同条件下BP 识别率(65%)有所提高。综合识别率为,PNN 故障信号识别率(71.67%)低于BP 故障信号识别率(75%)。
因此,基于EEMD 近似熵和BP 网络故障识别和基于EEMD 近似熵和PNN 网络故障识别方法进行故障信号识别。BP 神经网络对故障信号识别率都高于PNN 概率神经网络,由此,将对后续进一步的研究提供一定的技术保障,在故障信号识别中,也将不断探索更高识别率的神经网络形式。