基于EMD和GA-SVM的超声检测缺陷信号识别

2016-03-29 09:13:17李大中
中国测试 2016年1期
关键词:经验模态分解支持向量机遗传算法

李大中,赵 杰

(华北电力大学自动化系,河北保定071003)



基于EMD和GA-SVM的超声检测缺陷信号识别

李大中,赵杰

(华北电力大学自动化系,河北保定071003)

摘要:为提高金属探伤时对缺陷的识别能力,提出一种遗传优化支持向量机,结合经验模态分解(EMD),对超声波缺陷信号进行自动识别。首先进行经验模态分解法分解,提取出原始信号特征,构建特征向量。鉴于常用的神经网络模型识别率不高及支持向量机参数难确定的问题,利用遗传算法优化支持向量机模型(GA-SVM)的惩罚因子和核参数,提高支持向量机建模精度。分别采用神经网络模型、SVM模型和GA-SVM模型对特征向量进行训练与测试,GASVM模型识别率达到98.4375%,优于神经网络方法和未改进的交叉验证法SVM模型。试验结果表明:遗传算法能有效提高支持向量机的性能,在小样本条件下能够提高超声缺陷的识别率。

关键词:缺陷信号识别;遗传算法;支持向量机;经验模态分解

0 引言

超声检测由于其穿透力强、检测灵敏度高、使用方便等优势得到广泛使用,如对缺陷大小、形状、位置、类型等的无损评判[1]。目前,超声定位分析技术比较成熟,缺陷的定性自动识别已成为超声检测和模式识别领域的研究热点。现实作业中,超声定性评定通常由专业工程师通过肉眼和经验来进行,工作量大,效率较低,检验水平受检验者主观因素的影响较大[2]。随着计算机数据处理技术和人工智能技术的发展,为提高效率和准确率,减轻人员的劳动强度,保证评判结果的一致性,提高识别稳定性,减少人工差异,研究开发计算机辅助识别的专家系统是行之有效的措施[3]。

信号分析的传统方法处理的基本都是平稳信号,而超声回波信号呈现出有限的非平稳特性,采用传统的傅氏分析方法所得到的频谱,无法同时反映出其时域突变位置和对应频率等特征信息。而缺陷回波信号的特征提取和选择则是缺陷分类的前提,因此,特征提取方法的优劣直接影响着缺陷分类的正确性和可靠性[4]。

文献[5]结合EMD和欧式距离公式对尼仑材料超声缺陷进行识别,识别率为83%。文献[6]采用神经网络模型对平底槽和平底孔进行超声缺陷识别,识别率为89%。文献[7]采用支持向量机模型对管道超声缺陷进行识别,识别率为93%。

考虑到超声检测缺陷信号作为非线性、不平稳信号,难以提取到有效特征,神经网络模型结构确定困难和训练速度较慢,支持向量机参数难以确定等现状,本文采用近年来出现的一种适合非线性、非平稳信号的新方法——经验模态分解法(EMD)。并结合改进遗传算法支持向量机(GA-SVM)进行缺陷分类识别。

1 经验模态分解

经验模态分解可以将任何复杂超声信号分解成一系列具有不同时间尺度的本征模态函数,即imf。由于任何信号都是由有限的本征振动模态组成,经验模态分解法便在这个思想上形成,即先对信号x(t)进行平稳化处理,通过把要分解的信号相邻峰值点间的时延定义为时间尺度,在此基础上对信号进行分解[6],可以得到一组平稳信号ci(t)(i=1,2,…,n)和残差r(t),它们包含不同时间尺度,可以用下式表示分解结构:

式中,ci(t)表示不同时间尺度的本征模函数分量,每个本征模态函数必须满足以下2个条件:

2)无论在超声缺陷信号的哪一点,若由局部极大值点所形成的包络线均值为c,局部极小值点形成的包络线均值为b,则存在c=b,即信号关于时间轴局部对称。

超声缺陷信号经过EMD分解后得到的各imf分量分别反映频率由高到低的振动模态,而剩余的残差r(t)则反映原信号的总体趋势。

图1 钢材料试块图(单位:mm)

为采集真实的钢材料超声检测缺陷信号,制作钢材料试块如图1所示。在60mm×40mm×30mm的试块中做直径分别为1mm和5mm,深10mm的圆柱形孔。通过超声波发生接收器CTS-8077PR与示波器DPO2012连接,用中心频率为5 MHz,直径为10mm的直探头采集到此钢材料中两种缺陷Φ1和Φ5样本信号各8个,采样频率为1 GHz,数据长度为2 000,分别进行EMD分解,仿真结果如图2、图3所示。

EMD方法是从特征时间角度出发,逐步分离不同特征时间尺度的分量,这样x(t)分解为若干个imf分量c1,c2,…,cn和一个残余分量rn之和,所分解出的imf突出了原信号的局部特征信息,并且各imf分量分别包含了原信号的不同时间尺度的局部特征信息,而残余分量则反映了信号的中心变化趋势。分别计算各imf分量与原始信号的相关系数,如表1所示。

由EMD分解可以将信号分成若干分量之和,由表1可知,Φ1样本的分量主要是imf4~imf7,Φ5样本的分量主要是imf3~imf6,反映了该方法的自适应滤波能力。每一个imf分量都有不同的振幅和频率,分解顺序按超声波频率从高至低进行,分解后各imf分量体现了原始信号中本来看不到的显著信息。res为残余分量,是信号本身微弱的趋势或仪器的漂零。EMD分解后使得与原信号相比imf分量相对简单,适合对其进行精确分析或者进一步处理[8]。

2 GA-SVM模型

图2 Φ1样本EMD分解

图3 Φ5样本EMD分解

表1 各imf与原始信号相关系数

本文利用两种超声缺陷信号建立支持向量机模型,并用遗传算法优化参数得到GA-SVM模型,对已有数据进行智能分类。

2.1特征向量构造

由两种样本的EMD分解结果可知,Φ1样本信号EMD分解主要集中在imf4~imf7,而Φ5样本信号EMD分解主要集中在imf3~imf6,下面主要分析这几个分量,分别对各imf分量求过零点、信号面积、最大幅值作为特征值,对各imf分量进行傅里叶变换之后得到频域图,求出信号频域的的最大幅值和信号能量,作为特征值,以Φ5样本为例,实验数据如表2所示。4个imf分量的数组构成表征该缺陷的32个特征向量。

表2 Φ5实验数据

2.2GA-SVM模型建立

本文用遗传算法优化支持向量机方法对超声波缺陷信号进行分类识别,建立支持向量机模型,运用遗传算法寻优,取最终测试集数据和预测集数据误差最小时的c和g两个参数,并进行仿真分类。

2.2.1参数的选择

SVM核函数参数选择的好坏将直接影响最终的SVM分类器泛化能力的优劣。理论研究表明,参数的选择能很大程度地提高支持向量机的识别率。目前参数寻优方法有网格寻优、交叉验证寻优、PSO寻优等,传统的参数选取方法具有一定的不足,如人为选取参数取决于个人经验,受人为影响较大;交叉验证法选取参数一般计算量比较大,程序也复杂。而遗传算法具有很强的适应性,是一种全局最优化算法,具有很好的鲁棒性能和搜索能力,在诸多领域都有广泛应用[9]。

影响支持向量机性能的主要参数是惩罚因子c、RBF的参数g和σ。本文分别用交叉验证法和遗传算法寻优,取最终测试集数据和预测集数据误差最小时的c和g两个参数如表3所示,遗传算法和交叉验证法的适应度曲线图分别如图4、图5所示。

在适应度曲线中,可以看到遗传算法的平均适应度曲线更接近最佳适应度曲线,而平均适应度曲线反映了整个种群的好坏和收敛情况。

表3 两种寻优方法结果对比

图4 遗传算法适应度曲线(终止代数=100,种群数量=50)

图5 交叉验证法适应度曲线(终止代数=100,种群数量=50)

2.2.2遗传算法优化支持向量机模型

Vapnik等提出的支持向量机结构较简单、学习速度快、全局最优、泛化性好,它的基本思想是通过核函数将输入空间映射到一个高维特征空间,然后在此空间里构造最优分类超平面(optimal separation hyperplane,OSH),从而得到唯一的全局最优解。但是,SVM的性能与核参数的选取密切相关,通常调整参数的方法是采用交叉验证法,该方法不仅计算量大,推广性差,而且当核参数超过2个时,该方法难以凑效[10]。

1)数学模型

支持向量机是一种专门适合研究在有限样本情况下的机器学习规律的理论,可以较好地解决小样本、高维数、非线性和局部极小点等实际问题。当对n个样本进行两类分类时,设样本集为(xi,yi),i=1,2,…n,xi∈Rm,yi∈{+1,-1}。其中xi为类属性,yi为类标记,n为数据个数。支持向量机就是把输入向量映射到高维空间,寻找最优的超平面,最优准则是两类之间间隔的宽度最大。分类超平面定义为

式中:ai——拉格朗日乘子;

b——偏置。

2)基本步骤

利用遗传算法选择支持向量机参数,具体运算步骤如下:

①参数初始化,对各GA-SVM的参数设初值如下:

maxgen:最大的进化代数为100;sizepop:种群最大数量为20;pCrossover:交叉概率为0.4;pMutation:变异概率为0.01;cbound=[cmin,cmax],参数c的变化范围为[0.1,100];gbound=[gmin,gmax],参数g的变化范围为[0.01,1000];ν:SVM Cross Validation参数,默认为3。

②产生初始种群并初始化,得到初始适应度(CV准确率)。

③利用该初始种群对训练集进行训练,由训练好的SVM模型对测试集进行测试。

④根据GA适应度对遗传算法种群进行选择、变异以及交叉等一系列操作,选择出下一代参数种群。

⑤重新对SVM模型进行训练和测试,同时计算适应度;如果满足遗传算法训练停止准则,得到最终最佳参数c和g,则继续运行,如不满足则返回④。

3 GA-SVM模型智能识别实例

针对两种缺陷信号进行采样,每种信号采集8个样本,每个样本的数据长度为2000。对样本数据进行N=10阶经验模态分解,得出特征数组,分别进行归一化将数据限制在一定的范围内,避免训练数据之间因单位不同而导致的数据间的量级差,得到特征向量64个。分别采用神经网络模型、SVM模型和GA-SVM模型对该特征向量进行训练,神经网络模型用时0.73 s,SVM模型用时0.52 s,GA-SVM模型用时0.43 s。经过GA-SVM模型测试,32个测试样本中,Φ1样本16个测试样本全部分类准确,Φ5样本有15个样本测试结果准确,综合识别率为96.875%。而交叉验证法SVM模型的综合识别率为95.3125%,神经网络模型综合识别率为85.875%。实验结果如表4所示,可见本文提出的GA-SVM模型训练速度最快,识别率最高,对已知两类样本综合识别率为98.4375%,对未知的测试数据识别率达到了100%。

表4 采集样本实验结果

4 结束语

本文针对超声检测信号不平稳以及存在大量干扰噪声的情况,通过对采集到的两种超声缺陷信号Φ1和Φ5缺陷样本进行N=10阶EMD分解,得到不同的本征模函数(imf),突出了信号的局部细节特征。对主要的4个imf分量利用FFT变换为频域信号,提取出时频域故障特征各32个。通过对数据归一化处理,采用改进支持向量机模型GA-SVM,对特征向量进行训练与测试,测试数据识别率达到100%,综合识别率98.4375%。结果表明,本文模型在训练速度和识别率方面优于常用方法,结合人工识别可以对超声缺陷故障信号进行有效模式识别分类。

参考文献

[1]姚凯.基于金属磁记忆法的铁磁材料早期损伤检测与评价的实验研究[D].北京:北京交通大学,2014.

[2]白冬莆,崔书赫,张娉婷.超声波探伤检测的影响因素分析及监督与控制[J].硅谷,2014(5):71-71.

[3]杨川.焊缝缺陷图像特征提取研究[D].武汉:武汉理工大学,2010.

[4]都衡,潘宏侠.基于局域波信息熵的高速自动机故障诊断[J].中国测试,2014,40(1):115-118.

[5]李娟,杨录,张艳花.基于EMD与欧氏距离的缺陷信号识别方法[J].山西电子技术,2011,33(2):35-36.

[6]阮晴,罗飞路,王鹏.基于BP网络和D-S证据理论的超声检测缺陷识别[J].兵工自动化,2011,30(9):72-76.

[7]刘清坤,阙沛文,郭华伟,等.基于支持向量机和特征选择的超声缺陷识别方法研究[J].中国机械工程,2006,17(1):9-12.

[8] HUANG N E,SHEN Z,LONG S R,et al. The empirical mode decompositionandthe hilbert spectrumfor nonlinear and non-stationary time series analysis[J]. Proc R Soc Lond,1998(454):903-995.

[9]韩文虹,高淑婷. SOM离散化和IGA优化神经网络传感器故障诊断[J].中国测试,2014,40(5):88-91.

[10]王春龙,刘建国,赵南京,等.基于支持向量机回归的水体重金属激光诱导击穿光谱定量分析研究[J].光学学报,2013(3):307-312.

(编辑:李妮)

Flaw signal identification in ultrasonic testing based on EMD and GA-SVM

LI Dazhong,ZHAO Jie
(Dept of Automation,North China Electric Power University,Baoding 071003,China)

Abstract:In order to improve the flaw-recognizing ability in crack detection,a genetic algorithm optimization support vector machine(GA-SVM)has been proposed to identify automatically the ultrasonic defect signals in combination with the empirical model decomposition(EMD). First,the EMD is applied to extract the features of original ultrasonic signals and create feature vectors. Considering that common neural network models are low in recognition rate the SVM parameters are difficult to determine,the penalty factor and kernel parameter of the GA-SVM were employed to enhance the modeling precision of the GA-SVM. The feature vectors are trained and tested with the neural network model,SVM model and GA-SVM model. The recognition rate of the GA-SVM model is up to 98.437 5%,higher than the neural network model and the unimproved cross validation SVM model. Experimental results show that genetic algorithm can improve SVM performance. This machine can increase the recognition rate of ultrasonic defects in small samples.

Keywords:flaw signal recognition;genetic algorithm;SVM;EMD

作者简介:李大中(1961-),男,内蒙古包头市人,教授,博士,研究方向为新能源发电系统控制、智能优化理论及应用、分布式新能源发电及冷电联产控制系统。

收稿日期:2015-05-18;收到修改稿日期:2015-06-27

doi:10.11857/j.issn.1674-5124.2016.01.023

文献标志码:A

文章编号:1674-5124(2016)01-0102-05

猜你喜欢
经验模态分解支持向量机遗传算法
基于自适应遗传算法的CSAMT一维反演
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于遗传算法和LS-SVM的财务危机预测
统计与决策(2017年2期)2017-03-20 15:25:24
网络不稳定节点的动态特征挖掘模型
HHT和HMM在血细胞信号识别中的应用
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
价值工程(2016年32期)2016-12-20 20:36:43
基于熵技术的公共事业费最优组合预测
价值工程(2016年29期)2016-11-14 00:13:35
基于支持向量机的金融数据分析研究
基于联合采用EMD与高通低通滤波的信号分析
科技视界(2016年6期)2016-07-12 13:25:06