基于支持向量机的磁粉探伤智能识别算法

2015-06-06 12:40李远江
西南科技大学学报 2015年1期
关键词:后验磁粉裂纹

李远江 张 华 王 姮 张 静

(西南科技大学特殊环境机器人技术四川省重点实验室 四川 绵阳621010)



基于支持向量机的磁粉探伤智能识别算法

李远江 张 华 王 姮 张 静

(西南科技大学特殊环境机器人技术四川省重点实验室 四川 绵阳621010)

磁痕图像的自动分类方法是磁粉探伤智能化的关键技术之一。针对目前磁粉探伤自动识别漏识率和虚警率高的问题,提出采用支持向量机算法后验概率输出的判断方式对磁痕图像进行分类。对采集到的图像进行预处理和特征提取,然后使用支持向量机对特征数据处理得到后验概率,利用此后验概率得到分类信息将结果映射为有无裂纹与类别模糊区三类,实现智能识别。实验证明算法的有效识别率高,在漏检率和虚警率上取得了较好的平衡。

磁粉探伤 支持向量机 类别模糊区 漏检率 虚警率

磁粉探伤又叫磁粉检测,是无损检测五大常规方法之一,工业应用十分广泛。缺陷判别技术是磁粉检测中关键技术之一,传统的缺陷判别主要采用人工判别方式,存在着检测速度慢、效率低,容易因疲劳导致漏判、检测质量一致性难以保证等问题[1]。围绕磁粉探伤的智能化、自动化技术国内外相关专家学者展开了深入研究[1-3],并取得了一定的成果,但由于工件缺陷的多样性和复杂性,目前的磁粉探伤自动化系统均存在着漏识率和虚警率高而无法实际投入使用的问题。目前大多数的研究都是基于图像处理技术。文献[4]对磁痕图像的分割算法进行了研究;文献[5]利用二维直方图结合Fisher判别方法进行的缺陷识别研究,主要对裂纹提取进行了研究,对判别结果分析较少;文献[6]引入了智能算法支持向量机(SVM)对磁粉图像进行分类,文中使用的是SVM硬分类,误识率较高;文献[7-8]对支持向量机的后验概率进行了研究,扩展了SVM的使用范围。

针对智能分类算法存在错分类的事实和磁粉检测对漏检的高要求,本文使用智能分类算法即利用支持向量机算法的后验概率输出,同时结合阈值参数,将判别结果映射为三类:有裂纹、无裂纹、模糊区。支持向量机适用于小样本分类的特点[9],很适合在磁粉检测领域中运用,同时使用后验概率输出结合参数调整将输出结果映射为3种情况,这种改进能够解决当样本特征模糊时的错分类,同时通过参数适当的调节能够让漏检率下降为接近于0,使算法更贴近实际应用。

1 系统组成及算法原理

磁粉探伤是利用铁磁性材料磁化后会产生剩磁,然后在裂缝处形成漏磁而吸附荧光磁粉,当紫外光照射时荧光磁粉会发出黄绿色亮光,在图像中呈现出高亮特征(图2),判断裂纹时主要是根据高亮区域的特点。因此,本系统是建立在前期图像处理结果之上的一个典型的模式分类系统,系统框图如图1所示。读取图像后首先进行图像预处理,分离疑似裂纹部分再进一步进行特征提取,然后输入SVM分类器得到后验概率,再与训练集得到的阈值进行比较判断是否为模糊区域,得到判断结果。

图1 系统框图Fig.1 System block diagram

在图像预处理步骤中主要是根据裂纹图像区域高亮、连续、暂变的特点,通过图像平滑和增强将目标图像中的疑似裂纹部分突出并与背景图像分离,然后对图像进行连通域标记处理,将互相邻接(本文采用8邻域) 的疑似裂纹部分的像素集合提取出来,并为图像中不同的连通域记录不等的数字标记,为下一步特征提取做准备。图3是荧光磁粉图像处理后的典型结果图像。

图2 荧光磁粉图像Fig.2 Image of fluorescent magnetic particle

图3 荧光磁粉图像预处理结果Fig.3 Pretreatment image of fluorescent magnetic particle

1.1 特征提取研究

选取适当的特征对分类算法有十分重要的意义,根据磁粉检测工艺过程以及裂纹在图像中所呈现的特点,选取了典型的5种特征。这里的特征提取是针对图像预处理后的图片(即图3)中的连通区域部分,此部分即为可能的裂纹区域。

(1)面积特征:统计连通区域的像素个数作为面积Area特征的量化代表。

(2)周长特征:围成各连通区域的边缘像素个数作为周长Peri特征。

(4)圆形度特征:R=(4π*Area)/Peri2,圆形度是由面积与周长的平方比值得到,主要反映目标区域的紧凑程度以及与圆的相似程度。

(5)矩形度:R=Area/(H*W);其中H为区域高度,W为区域宽度。矩形度反映了目标区域对其最小外接矩形的充满程度,对任意区域R的取值在R∈(0,1),当区域为矩形时R将取得最大值1。

这5种特征有效描述了裂纹的特点,基本能够代表图像中有关裂纹的信息,对每一幅预处理过后的图像进行特征提取处理就得到了支持向量机训练和分类测试的数据。

1.2 支持向量机分类

磁痕图像分类的特点是样本量少,对错分类要求较高,基于统计学习的支持向量机是针对小样本情况最佳的智能分类算法,相对于其他分类算法保持了较好的性能[10]。支持向量机的基本思想是假定已知观测样本集:Z={(xi,yi)|xi∈Rn,yi∈(-1,+1),i=1,2,…m}(其中xi是n维空间中的向量,yi是xi所属类的标识)能够被超平面(w,x)-b=0分类,这个超平面称为最优超平面,为了寻找这个最优超平面需要求解下面的二次优化问题[11-12]:

s.tyi(+b)>1-εi,i=1,2,…,m,

εi≥0

(1)

其中w是超平面的法向量,b是超平面的偏移量,C是指定的惩罚因子,是w和xi的对应点集,εi是松弛变量。针对非线性情况,使用映射φ:X→H,将x从输入空间X映射到一个高维的特征空间H,该映射即为核函数k(xi,xj)=<φ(xi,xj)>用于特征空间中的点积运算。此时,其对偶Lagrange表达式为:

s.t. 0≤ai≤C,i=1,2…m,

(2)

其中ai是Lagrange算子。求解此对偶问题得

(3)

由此得到最终的判别函数为

(4)

式中yi是类别标签,k(xi,x)为核函数,ai和b是利用SVM方法在样本训练集中训练的参数。此处的支持向量机是由Vapnik提出的一种标准支持向量机,是各种基于支持向量机分类的基础。由于这种标准支持向量机的输出是硬输出,即输出只有待预测样本的所属类别,在这个过程中本质上是对分类信息进行了模糊化处理,丢弃部分细节以得到分类结果,在磁粉检测的裂纹图像识别中这部分细节即为有无裂纹的判别概率,是一个十分重要的信息,所以本文在标准支持向量机的基础之上结合了后验概率输出的方法来进行磁粉检测目标图像的分类。

2 基于支持向量机后验概率输出的映射方法

对SVM后验概率输出已有不少研究,Vapnik研究了SVM与Logistic回归之间的关系,提出了一种将SVM的离散输出映射为概率的方法。此方法虽能得到样本的后验概率,缺点是对每个样本都需要求解一个线性方程组,影响了求解速度。Wahha和Platt先后对此方法进行了改进,本文基于platt提出的Sigmoid函数模型将支持向量机决策函数的输出映射为类后验概率的算法。其目标函数形式如下[13]:

f=f(x)

(5)

其中,f是相应样本的函数值,A,B是Sigmoid函数形态参数,通过以下最大似然函数问题求解得到参数值:

(6)

其中:pi=1/exp(Afi+B),ti由下式确定:

(7)

其中,N+,N-分别为正负样本数。

由式(4)得到样本的SVM分类结果,在此基础上由式(5)得到样本是有裂纹或无裂纹类别的概率P(xi|+1),P(xi|-1),其中+1表示有裂纹,-1表示无裂纹。针对磁粉检测领域应用的特点,本文在得到后验概率后对二者做差得到:

Pbi=|P(xi|+1)-P(xi|-1)|

(8)

其中 Pbi∈(0,1)

这里根据Pbi的值将结果分为三类,即有裂纹,无裂纹、模糊区域。这个过程中增加了一个与Pbi进行比较的模糊区域判断的阈值mt(mt∈(0,1)),它所代表的含义是在实际应用中分类器输出两类的接近率,当mt值较大时表示在这个区间以内的接近率都属于类别模糊区域,也即对错分类代价更大,当mt值较小时表示更小的接近率才属于类别模糊区域,则表示错分类代价更小,同时若把类别模糊区域和有裂纹都称之为报警,那么通过对mt的调节还能够表示漏检率和虚警率之间的调节,当mt较小时表示允许漏检率更大虚警率就更小,当mt更大时表示允许漏检率更小,则虚警率更大。

3 实验分析

为搭建实验平台,此处选用台湾林智仁教授及其团队实现的开源libSVM[14],在其基础上进行实验验证。在对样本图片进行预处理后对图像进行特征提取,部分样本特征如表1所示。

表1 部分样本特征Table 1 Part of the sample characteristics

表1记录了对样本图片的连通域进行特征描述的特征值。特征值的计算方式已在1.1节中有详述。由于样本量太大表中只列出了部分样本。

此处选取962个训练样本,两组测试样本:第一组623个测试样本,第二组700个测试样本。得到样本的特征数据后,先将这些特征数据转换为满足libSVM的数据格式,然后利用其中的训练函数进行样本训练。这里选用的核函数为径向基函数,为了能够得到较好的分类效果,需要仔细选择SVM的参数,即惩罚因子和径向基核函数的参数,采用交叉验证法进行参数寻优,当C=3,g=0.266 393时是较好的参数,得到分类的正确率为82.925 7%,并且很容易得到错误样本的编号:19,20,43,46,49,50,58,63,73…。在libSVM基础上利用公式(5)得到测试样本的后验概率,前70个测试样本的两类概率折线对比分布图如图4所示。

由图4和错分类样本的编号容易发现,错分类样本的地方基本是在两类样本概率接近和有交叉的地方,由此可以得出模糊区域样本即为出现类似情况的样本。由图5中的上水平线和下线水平线做差就得到了模糊区域判断的经验阈值mt,当得到样本对两类的概率后由式(8)得到概率之差Pbi,当Pbi>mt时就相信SVM的判别结果,将其类别输出作为判别结果:有裂纹或无裂纹,当Pbi

图4 测试样本两类概率对比图Fig.4 Two types of probability of test samples

图5 类别模糊区域Fig.5 Fuzzy region of categories

表2 分类测试结果Table 2 Classified test results

在系统中加入阈值mt后,当判别程序执行碰到处于模糊区域样本时就暂停并报警,由此判别正确率达到了99.5%,漏检率为0,即没有将有裂纹判别为无裂纹。实验证明加入模糊区域判断的阈值mt后在虚警率较低的情况下有效地减少了错分类,降低了漏检率,并且通过调节这个值的大小能够调节报警与错分类率的关系,同时达到了接近于0的漏检率。

4 结束语

本文针对磁痕图像的智能分类采用了支持向量机后验概率输出映射方法,实现了智能分类算法。对预处理后的磁痕图像进行特征提取,通过训练集得到判别模型和模糊区域阈值参数,然后对样本进行预测分类,综合考虑了系统对漏检率和虚警率的要求。实验表明本算法有效降低了错分类率,在漏检率和虚警率之间取得了较好平衡。模糊区域阈值参数的优化选取和进一步降低虚警率是下一步的研究工作。

[1] 吴海滨,张杰,陈军,等.基于CCD成像的纶箍表面荧光磁粉探伤方法及缺陷图像处理研究[J].大气与环境光学学报,2006,(1):155-160.

[2] 朱凌云,曹长修.基于支持向量机的缺陷识别方法[J].重庆大学学报:自然科学版,2002,25(6):42-45.

[3] 周军,彭培欣.自动磁粉探伤系统中的图像技术[J].仪器仪表学报,2003,24(4):461-463.

[4] 陆宝春,李建文,王婧,等.基于特征差异性的荧光磁粉探伤图像分割算法[J].南京理工大学学报,2011,35(6):797-800.

[5] 吴海超,曾奇夫,查苏倩.荧光磁粉探伤裂纹智能识别图像处理研究[J].铁道技术监督,2010,38(10):6-10.

[6] 黄涛.全自动荧光磁粉探伤中目标识别图像处理技术研究[D].南京,南京理工大学,2012.

[7] 张翔,肖小玲,徐光.支持向量机方法中加权后验概率建模方法[J].清华大学学报:自然科学版,2007,(47)10:1689-1691.

[8] 吴高巍,陶卿,王珏.基于后验概率的支持向量机[J].计算机研究与发展,2005,42(2):196-202.

[9] GAO Yang,WANG Xue-song,CHENG Yu-hu. Fault diagnosis using a probability least squares support vector classification machine[J].Mining Science and Technology,2010,20(6):917-921.

[10] DUDA R O, HART P E, STORK D G. Pattern Classification[M].Second Edition. New York:John Wiley&Sons,2001.220-231.

[11] VAPNIK V. The Nature of Statistical Learning Theory[M].Springer-Verlag,1995.244-249.

[12] LI Wei-jun, LIU Zhen-yu. A method of SVM with Normalization in Intrusion Detection [J]. Procedia Environmental Sciences, 2011, (11), 256-262.

[13] PLATT J C. Probabilistic output for support vector machines and comparisons to regularized likelihood methods[C]. In Advances in Large Margin Classifies. Cambridge, MA: MIT Press. 1999 .

[14] 朱培根,梅卫江,石秀锋,等.基于LibSVM代用燃料有效功率增量预测方法的研究[J].石河子大学学报:自然科学版,2012,30(5):657-660.

Intelligent Recognition Algorithm Based on Support Vector Machine Magnetic Particle Detection

LI Yuan-jiang, ZHANG Hua, WANG Heng, ZHANG Jing

(KeyLaboratoriesforSpecialEnvironmentRobotTechnologyofSichuanProvince,SouthwestUniversityofScienceandTechnology,Mianyang621010,Sichuan,China)

The automatic classification method for magnetic images is one of the key technologies of intelligent magnetic particle inspection. Aiming at the problem of identifying both leakage recognition rate and false alarm rate by the magnetic particle detector automatically, a method using support vector machine algorithm outputs to posterior probabilities to classify the magnetic images is proposed. After pre-processing the collected images and extracting their feature accordingly, the support vector machine was used to process characteristic data to get a posteriori probability, which was then used to obtain the classified information of the following three categories: cracks, no cracks and a fuzzy area, and finally an intelligent recognition system was achieved. The experimental system was established to prove the effective recognition rate of the algorithm and a better balance between the leakage recognition rate and false alarm rate was obtained.

Magnetic particle detector; Support vector machine; Fuzzy zone of categories; Leakage recognition rate; False alarm rate

2014-10-08

四川省科技支撑计划项目(2013GZX0152);四川省科技厅科技支撑计划项目(2014RZ0049)。

李远江(1988—)男,硕士,研究方向为机器学习,智能控制。E-mail:lyjliyuan@sina.com

TP181

A

1671-8755(2015)01-0066-05

猜你喜欢
后验磁粉裂纹
基于扩展有限元的疲劳裂纹扩展分析
亲疏水性SiO2复合有机树脂包覆对FeSiCr磁粉芯性能的影响
一种基于微带天线的金属表面裂纹的检测
浅谈《磁粉检测技术》在线教学提问设计
Epidermal growth factor receptor rs17337023 polymorphism in hypertensive gestational diabetic women: A pilot study
基于贝叶斯理论的云模型参数估计研究
心生裂纹
一种基于最大后验框架的聚类分析多基线干涉SAR高度重建算法
纯三元及含Zr, Ga元素磁粉的各向异性
基于后验预测分布的贝叶斯模型评价及其在霍乱传染数据中的应用