闫 菁, 冯 早, 吴建德, 马 军
(1.昆明理工大学 信息工程与自动化学院,云南 昆明 650500;2.云南省矿物管道输送工程技术研究中心,云南 昆明 650500; 3.昆明理工大学 机电工程学院,云南 昆明 650500)
LMD特征融合与SVM的供水管道堵塞识别*
闫 菁1,2, 冯 早1,2, 吴建德1,2, 马 军3
(1.昆明理工大学 信息工程与自动化学院,云南 昆明 650500;2.云南省矿物管道输送工程技术研究中心,云南 昆明 650500; 3.昆明理工大学 机电工程学院,云南 昆明 650500)
针对城市供水管道早期堵塞难以检测的问题,提出了一种基于局部均值分解(LMD)的分量信号特征提取,结合支持向量机(SVM)的堵塞故障识别方法。先对声响应信号进行LMD,得到若干乘积函数(PF)分量,进而采用相关分析法选取有效PF分量,对有效PF分量分别提取能量熵、近似熵和平均声压三个指标的特征,构建分类特征集。最后利用交叉验证(CV)方法优化参数的SVM分类器识别堵塞故障信号。实验结果表明:采取基于LMD特征融合和通过CV优化的SVM相结合的方法可以有效识别供水管道的初期堵塞。与基于LMD特征融合和BP神经网络的方法进行了对比,结果表明:本文方法具有更好的堵塞故障识别效果。
供水管道; 堵塞物识别; 局域均值分解; 特征融合; 支持向量机
供水管网在城市基础设施中有着非常重要的作用。然而,由于国内部分管道最初的设计存在缺陷,并且使用时间长,造成管道故障率较高。管道堵塞故障早期表现为不同程度的部分堵塞,容易被检测人员忽略,最终导致堵塞面积扩大,不仅会造成管道无法正常运行,还有可能带来安全隐患。因此,对早期的管道堵塞故障进行研究,及时发现并且排除故障非常必要。
根据检测原理,目前常用的管道的故障研究方法有:红外线照相法[1]、质量平衡法[2]、负压波法[3]、示踪气体探踪法[4]等。在众多检测方法中,声学检测方法有其独特的优势,表现在声音在固、液、气介质中均可传播且可以携带丰富的故障信息。声学检测方法分为主动检测和被动检测。在被动检测中,运用较多的是声发射方法。然而,声发射只能检测故障本身发出的声信号,如果故障没有发出声信号或者仅发出微弱的声信号,则难以用声发射方法进行故障检测。供水管道堵塞故障,属于这种情况。针对声学被动检测方法难以有效检测供水管道堵塞故障的问题,本文采取主动检测的方法。主动检测由检测人员在管道的一端发射声激励信号,声音在管道中传播遇到管壁或者堵塞物发生反射,由此得到声学响应信号。通过对响应信号进行分析,可以判断供水管道故障类型。
声响应信号为非线性非平稳信号,传统的平稳信号分析方法无法取得理想的处理效果。将非线性非平稳信号有效分解为单一模态函数是解决非线性非平稳信号处理问题的主要途径之一,典型代表如局部均值分解(local mean decomposition,LMD)方法。LMD方法可将非平稳信号分解为一系列纯调幅—调频信号,且具有较好的时频分析效果,已被广泛应用于脑电信号处理、机械故障诊断等领域[5]。因此,本文采用LMD处理声响应信号。
根据声学检测原理,声信号在管道中传播,只有部分的声信号会遇到堵塞物,且管道环境中还包含各种噪声,这种情况造成故障信号的部分特征与正常信号或者环境噪声有重叠,因此,单一的特征提取方式会造成特征提取不足的情况。文玉梅等人[6]提取了谱宽和近似熵特征进行故障识别,取得了比单一特征更好的识别效果。
本文针对管道堵塞故障信号的声学特性,分别从能量、时间序列复杂度、声压变化三个角度出发,提取LMD分解后有效分量信号的能量熵、近似熵和平均声压三个指标,构建特征集合。最后,利用支持向量机(support vector machine,SVM)进行故障识别。为了验证方法的有效性,将该方法与方向传播(back propogation,BP)神经网络进行了对比。实验结果表明,本文提出的方法具有更好的故障识别效果。
传统的声发射检测方法可以有效地检测管道泄漏[6],但是在检测堵塞方面并不理想。针对这种情况,现有管道堵塞检测多采用主动检测方法,对管道发射激励声信号,采用过程响应信号进行故障检测。
检测过程为:将一根长杆通过地面的井盖伸入到供水管道当中,长杆的尾端连接着声音传感器,采集到的数据通过数据采集和传输装置发送和储存到指定设备中。检测时,声音传感器发射端发射激励声信号X(t),信号在管道中传播,当遇到堵塞物时,部分声音能量发生反射,此时传感器接收端可以接收到反射的声信号Y(t)。数据采集系统采集传感器接收端的信号,此时, 即可得到整个系统的响应信号G(t)为
(1)
通过对响应信号进行分析,判别管道故障。
1.1 LMD
LMD方法能够自主地确定信号在不同尺度的分辨率,从原信号分离出纯调频信号si(t)和包络信号ai(t),将二者相乘可以得到有物理意义的乘积函数(PF)分量,即
PFi=ai(t)si(t)
(2)
将PF1从原始信号x(t)中分离出来,得到一个新的信号u1(t),将u1(t)作为新的信号继续分解,直到最后的uk(t)为单调信号。通过循环迭代分解,将原始响应信号分解为k个PF分量与一个残余分量之和,即
(3)
1.2 LMD分量能量熵
当管道某部分出现堵塞时,声响应信号中频率分布和能量分布也会发生相应改变[7]。因此,在LMD分解的基础上,通过计算各PF分量的能量分布,进一步求取信号能量熵[7]特征,来构成故障特征向量。
对原信号LMD分解后的所有分量都提取特征会造成特征向量冗余,故需要选取有效分量提取特征。本文采用相关分析法和能量分布法选取有效PF分量。选取与原信号相关度大于15 %且所占能量较多的分量计算能量熵。能量熵计算步骤如下:
1)计算k个PF分量的能量 ,将所有计算的分量能量相加,计算总能量,即
(4)
2)计算k个特征PF分量在总能量中占取的比重
(5)
即得到k个能量占比。
3)计算k个特征PF分量的能量熵
(6)
通过此提取方法,即可提取特征PF分量的能量熵,构建分类样本。
1.3 LMD分量近似熵
当管道仅为部分堵塞时,仅用能量熵进行特征提取,正常和堵塞管道的能量熵值会出现部分重叠。本文从信号的随机性特征出发,提取特征来弥补能量熵提取方式的不足。
近似熵表征了分析信号在维数发生变化的情况下,产生新模式的可能性的大小,即可以表征信号的时间序列复杂性[8]。近似熵的数值越大,表明信号的随机性和不规则性的程度越大。给定一个时间序列{x(i),i=1,2,…,N},预先设置模式维数m和相似容限r的值,则近似熵的值为
(7)
式中
(8)
本文对有效PF分量计算近似熵与能量熵,二者为平行的特征,共同构成特征向量。
1.4 LMD分量平均声压
信号的均方根值的量纲为幅值,是表征信号强度的重要指标。信号的均方根值在声学中也被称为平均声压[9],具体公式如下
(9)
在压力相同的情况下,堵塞声信号的平均声压高于正常管道声信号的平均声压。但是由于信号本身平均声压幅值较小,所以文中仅作为辅助特征。
文中故障分类模型采用基于交叉验证(crossvalidation,CV)的SVM。SVM是一种适用于二分类的分类算法,SVM在样本数量较少的情况下,亦能获得很好的统计规律[10]。
SVM本质是寻找一个分类面函数。给定一个训练集合G={xi,yi,i=1,2,…,l},每个样本xi∈Rd属于一个分类,y为分类标签。分类的曲线表示为w×x+b=0,式子中w为权重向量,b为阈值。分类函数构造如下
f(x)=sgn(wx+b)
(10)
求SVM的最优分类平面,可以表示为优化问题
(11)
Subject toyi[(wxi)+b]-1≥0,i=1,…,l化为对偶问题
Minimize
(12)
(13)
如果线性不可分,则转换为高维问题,令变换函数为Φ(x),核函数用K(x,y)表示,则
K(x,y)=Φ(x)Φ(y)
(14)
用核函数代替内积运算,最终的分类函数为
(15)
SVM的核函数有多种类型,而径向基(RBF)核具有较好的学习能力和较宽的收敛域等优点,是理想的分类依据函数[11]。本文选取RBF核函数。
关于SVM的参数选取方式,目前并没有公认的统一的方式,普遍办法是将参数限定在一定的范围内进行重复试验,最终选取分类准确率比较高的参数作为最终的分类参数[12]。但是这种方法效率不高。
本文采用CV的方法寻求最优参数。CV方法目前常用的有Hold-Out Method,K-fold CV(K-CV),leave-one-out CV(LOO-CV)等方法[13]。本文选取的是K-CV方法,将信号均分为K组,每一组分别做一次测试组,其余的作为训练组,由此得到K个模型。用这K个模型最终的分类准确性所对应的值作为SVM的分类指标。本文K取10,此时取得到结果最可靠稳定[13]。
本文也将用BP神经网络与交叉验证SVM分类进行对比。本文所提出的堵塞检测方法原理如图1所示。
图1 管道堵塞故障辨识原理
本文采用的辨识信号样本来源于英国布拉德福德大学管道实验室采集到的管道数据[14]。采用的供水管道为一段15.4m长的黏土管道。在管道的首端放置声音传感器,管道尾端采用半封闭形式以模拟真实供水管道的运行,信号接收端采集到从管道内部反射回来的声信号。实验中,检测人员在管道内部放置堵塞物,模拟实际部分堵塞工况堵塞物的高度为55mm。
实验共有36组正常样本,40组故障样本。数据分析的采样频率为44 100Hz,每组选取4 410个点,即对0.1s的数据进行信号分析。供水管道正常信号和堵塞信号的时域波形和LMD分解结果如图2所示。
图2 信号LMD分解结果
信号忽略残余分量,可以分解出来6个PF分量。如果对于每个分量信号都提取特征,会导致特征向量冗余。基于此,本文用相关分析法选取特征分量,提取与原信号相关系数大于15 %的分量进行分析。此外,也提取分量的能量分布特征作为参考。以正常管道的信号为例,分析PF分量信号的相关系数和能量分布。结果如图3所示。
图3 能量分布结果
由PF分量信号的相关性分布表和能量分布图综合说明,前三个PF分量包含了原信号的大部分特征,所以选取前三个PF分量,作为特征提取的分量信号。
首先提取信号的能量熵特征,能量熵特征可以区分两类信号,表现在正常管道有效PF分量能量熵值比堵塞管道大。但是有少量故障信号的能量熵与正常信号的能量熵十分的相近。为了直观显示特征提取效果,各选取20组正常和堵塞管道信号的PF1分量能量熵的值,由图4(a)可看出,能量熵特征值有所重叠。
基于此,进而提取信号的近似熵特征。两种工况类型各选取20组信号的PF1的近似熵值,由图5(b)可看出近似熵特征提取效果比能量熵稍好,但是仍有重叠。近似熵特征区分度特点,表现在正常管道的有效分量近似熵值比堵塞管道的值高。分析认为,当供水管道发生堵塞时,声响应信号的频率分布将更加集中在故障部分。但是管道正常情况则不然,其声信号频率分布更为的分散,故信号更加无序。此外,本文还提取有效分量的平均声压指标。同样方式如图4(c)。管道发生堵塞故障时,信号的平均声压会比正常情况下的平均声压大。由于平均声压计算出来的数值较小,所以仅将其作为辅助特征。
图4 PF1分量特征提取效果
最后,构建总体的分类特征集,本文采用的是PF1,PF2,PF3所计算的能量熵、近似熵、分量平均声压3个指标,最终构成9维的特征集合。特征PF分量集合如表1所示。
表1 特征PF分量特征集合
本实验选取正常和堵塞管道各15组数据作为训练样本。正常管道的21组,堵塞管道的25组作为测试样本。使用CV方法对SVM的参数进行寻优。将所有特征输入,得到的寻优结果如图5所示。
图5 参数寻优结果
经过网络不断地进行交叉寻优,得到参数值c=6.964 4,g=2.297 4,分类准确率为97.826 1 %。
为了验证本文特征融合的有效性,也对单个特征进行分类,并且使用BP神经网络与交叉验证的SVM分类器做对比实验。BP神经网络使用的测试集和样本集与SVM相同。BP神经网络采用的数据隐含层为20,隐含层使用的传递函数为tan-sigmoid,训练目标误差小于0.000 1,训练次数为500次。最终的分类结果如表2所示。
表2 辨识准确率 %
由表2可知:三个特征融合的特征集分类效果最好,有效弥补了单个特征的不足,以达到最好的故障分类效果。并且在样本特征一致的情况下,基于CV方法的SVM比BP神经网络的分类效果好。
供水管道堵塞故障是一种难以直接用声发射方式检测判别的故障。因此,采用主动检测方法,用声学响应信号进行分析。本文对原始信号采用LMD分解后,根据相关系数及能量分布准则选取有效分解PF分量,进而提取有效PF分量的能量熵、近似熵和平均声压三个指标作为故障分类模型的输入特征向量。根据实验结果,三个特征融合进行分类,可以有效弥补单个特征分类的不足。当对SVM进行参数寻优之后,可以进一步提高辨识的准确性。未来可进一步研究信号在不同频段的特征,以寻找更加明显的指标进行故障识别。
[1] 赵 洁.城市供水管网泄漏报警系统研究[D].天津:天津大学,2006.
[2] 徐 洁,丁金婷,江 皓.管道泄漏检测方法综述[J].管道技术与设备,2004(4):14-16.
[3] 王桂增,叶昊.流体输送管道的泄漏检测与定位[M].北京:清华大学出版社,2010.
[4] 王继华,彭振斌,关镶锋.供水管网检漏技术现状及发展趋势[J].桂林工学院学报,2004,24(4):456-460.
[5] Sun J,Xiao Q,Wen J,et a1.Natural gas pipeline small leakage feature extraction and recognition based on LMD envelope spectrum entropy and SVM[J].Measurement,2014,55(9):434-443.
[6] 文玉梅,张雪园,文 静,等.依据声信号频率分布和复杂度的供水管道泄漏辨识[J].仪器仪表学报,2014,35(6):1223-1229.
[7] 丁国君,王立德,申 萍,等.基于EEMD能量熵和LSSVM的传感器故障诊断[J].传感器与微系统,2013,32(7):22-25.
[8] 杨 进,文玉梅,李 平.基于相关分析和近似熵的管道泄漏声信号特征提取及辨识方法[J].仪器仪表学报,2009,30(2):273-279.
[9] 石志标,王文宁,苏天一.液体管道堵塞声波的分析[J].东北电力大学学报,2014,34(3):21-25.
[10] 孙洁娣,肖启阳,温江涛,等.基于 LMD 包络谱熵及 SVM 的天然气管道微小泄漏孔径识别[J].机械工程学报,2014,50(20):19-25.
[11] 林升梁,刘 志.基于RBF核函数的支持向量机参数选择[J].浙江工业大学学报,2007,35(2):163-167.
[12] 王 凯,侯著荣,王聪丽.基于交叉验证SVM的网络入侵检测[J].测试技术学报,2010,24(5):419-423.
[13] Zao Feng.Condition classification in uuderground pipes based on acoustical characteristics[D].Bradford:University of Bradford,2013.
Identification of water supply pipeline blockage based on LMD features fusion and SVM*
YAN Jing1,2, FENG Zao1,2, WU Jian-de1,2, MA Jun3
(1.Faculty of Information Engineering & Automation, Kunming University of Science and Technology,Kunming 650500,China; 2.Engineering Research Center for Mineral Pipeline Transportation of Yunnan Province,Kunming 650500,China; 3.Faculty of Mechanical and Electrical Engineering,Kunming University of Science and Technology,Kunming 650500,China)
Aiming at the detection problem of blockage within the urban water supply pipeline in the early stage,a method combined component signal feature extraction with support vector machine(SVM)for blockage recognition based on local mean decomposition(LMD) is proposed.The first step of this method is to decompose the acoustic response signal by LMD,so that a number of PF components can be obtained.Then the correlation analysis method is used to select the effective PF components.The characteristics of energy entropy,approximate entropy and average sound pressure of the effective PF components are extracted respectively,so the classification feature sets can be constructed.Finally,the cross validation(CV)is used to optimize the parameters of the SVM classifier to identify the blockage fault signal.The results from the experiments have shown that the method can identify the blockage in the water supply pipeline effectively based on the combination usage of LMD component features and cross validation SVM.In addition,the method is compared with the method based on LMD feature fusion and BP neural network and the results suggest that the proposed method has a better performance on the partial blockage recognition.
water supply pipeline; blockage identification;local mean decomposition(LMD); feature fusion;support vector machine(SVM)
10.13873/J.1000—9787(2017)07—0057—05
2016—08—02
国家自然科学基金资助项目(61563024,51169007); 昆明理工大学引进人才科研启动基金项目(KKZ3201503015)
TH 165.3
A
1000—9787(2017)07—0057—05
闫 菁(1993-),女,硕士研究生,主要研究方向为信号处理、模式识别、管道故障诊断。
冯 早(1979-),女,通讯作者,博士,讲师,主要从事声学无伤检测、信号处理、机器学习方向研究工作,E—mail:6483975@qq.com。