孙 熠,李志农,*,闫敬文
(1.无损检测技术教育部重点实验室(南昌航空大学),南昌 330063;2.广东省数字信号与图像处理技术重点实验室(汕头大学),广东 汕头 515063)
金属断口图像识别是进行机械故障诊断以及断口分析定量化和智能化的关键,高效准确地提取断口图像特征是识别的关键。近年来,多种特征提取方法应用于金属断口图像分类领域,例如Fourier 变换[1]、小波变换[2-3]、灰度共生矩阵[4]等。
目前在断口图像识别中应用最广泛的是小波变换。小波变换虽然解决了Fourier 变换的不足,但是在金属断口图像特征提取方面仍然存在不足,小波基的支撑形状是正方形,只能获取图像的横向、纵向以及对角线上的有限的方向信息,不能利用图像边缘曲线的连续性,在处理复杂纹理的金属断口图像时不能够很好地提取图像的纹理信息。
Grouplet 变换由Mallat 于2009年提出[5],由于Grouplet 变换相比小波变换的诸多优势,国内外学者将Grouplet 变换应用于多个领域。Peyré提出了一种Grouplet 变换的动态纹理合成方法[6-7]。Maalouf 等采用Grouplet 变换来合成与修补自然图像[8],并提出了一种基于Grouplet 变换的图像质量评价方法[9]和彩色图像超分辨率算法[10]。Saito 等利用Grouplet 变换对 图像消噪[11]。Wei 等提出了一种视听Grouplet 方法[12]。闫敬文等将Grouplet 变换用于图像消噪[13]并结合贪婪算法和动态规划算法对Grouplet 变换进行改进,提出了一种新的变换AGT(Advanced Grouplet Transform)[14]。本研究将Grouplet 引入航空构件断口识别中,采用Grouplet 变换处理断口图像,并结合熵的概念将Grouplet 熵作为图像的特征,选取关联向量机(Relevance vector machine,RVM)作为识别器,提出了一种基于Grouplet 熵-RVM 的金属断口图像识别方法。
Grouplet 变换是在正交Haar 变换的基础上提出的,它建立了一种稳定的几何图像表示,Grouplet 基能够根据图像的纹理结构而自适应改变,能够更准确地提取图像的纹理特征。
对于M×N 的二维断口图像,先将其定义为二维网格G0,网格中的点对应为图像的像素点,在G0中划分一组子网格Gj,1≤j≤J,子网格又经过层层划分形成嵌入式网格系统。经过Haar 变换,在每个尺度2j上,得到分解后的子网格Gj+1和,这两个子网格互补且没有交集。将每个的点关联到m∈Gj+1的点上后,能够得到每个尺度的子网格中各个点的位置关系,这些点之间的距离就是关联值,存储于Aj[中,Aj就是关联域。
对于低频系数aJ(即平均系数)和高频系数dj(即细节系数),Grouplet 变换计算出两个关联平均之间的规范化细节[14]:
这些值存储在
其中,m∈Gj。在最大尺度上2j=2J上,平均系数被归一化。
由式(1)~式(5)计算得到图像的各尺度细节系数dj、平均系数aj[m]和关联域系数Aj[~m]。再次结合熵的概念对得到的系数计算其熵值大小,获得基于断口图像的Grouplet 熵特征值。
在基于小波变换的金属断口特征提取中,常常采用小波熵来描述金属断口的纹理特征。小波熵的定义[15]为:
式中:pi为相对小波能量,即第i 个尺度下的能量占总能量之比。断口图像的小波熵能够反映图像信息的多少,其值越大,说明细节信息越丰富。小波熵不直接处理大量的小波系数,它包含了大量小波系数所反映的特征量,意义明确,计算快捷。但是小波变换在处理金属断口图像中存在不足,由于小波变换的支撑形状是方形的,只能获取图像的横向、纵向以及对角线方向的信息,缺乏自适应性,导致分类结果较差。
仿照小波熵,提出Grouplet 熵的概念。首先对需要识别的图像进行Grouplet 变换提取图片的Grouplet 系数,再针对这些频带系数求熵值,所求的熵值为Grouplet 熵。
其中,x 为Grouplet 变换后的各个频带的Grouplet系数,M×N 为该频带尺度大小,m,n 对应为该频带的行与列。x2(m,n)是Grouplet 变换各频带系数的平方[16],即系数频带的能量,经试验发现,如果采用系数本身即x(m,n),再对其计算熵值得到的Grouplet 熵特征值较小,得到的分类结果不理想,因此采用频带能量来计算熵值。
基于Grouplet 熵的关联向量机的金属断口识别(Grouplet 熵-RVM)分类步骤如图1 所示。识别步骤如下:
1)对断口图像进行Grouplet 变换,得到图像的Grouplet 系数子带。
2)针对各频带输出的Grouplet 系数进行计算,得到基于Grouplet 熵的断口图像特征数据。
3)将得到222 张图像的特征数据分为两部分,前半部分的111 张图像特征数据用于训练,建立识别模型。
4)将后半部分的111 张图像的特征数据用于测试分类,进行归一化后送入已经建立好的识别模型中进行分类识别。
图1 Grouplet 熵-RVM 识别分类过程Fig.1 Recognition process based on Grouplet entropy-RVM
支持向量机(Support vector machine,SVM)是一种典型的机器监督学习算法,被广泛用于图像识别领域,但是随着问题的深入研究,发现SVM的几个显著问题,例如SVM 的误差参数选取困难,且支持向量的数量会随着样本的增加而显著增长,这不仅导致可能产生过度拟合,而且造成识别时间增加[16]。RVM 是2000年由Tipping 在支持向量机的基础上改进而来的一种新的机器学习算法[17],关联向量机与支持向量机的函数形式一致,其训练识别模型在贝叶斯框架下建立的,且RVM 仅需较少的支持向量,因此,在样本量较大时RVM 的识别速度优于SVM。基于此,本研究采用RVM 作为识别器。
RVM 分类器采用逐层分类淘汰法,即首先分离类别1,再将剩下的特征数据分离出类别2,以此类推,经过n 次分类,得到个不同的类别。逐层分类淘汰法具有内存开销小,分类速度快等优点。
其中,M 为核函数的数目,K(x,xi)为核函数,{wi}为相关向量的权值,w0为初始权值。
为避免权w 值过度拟合,令wi服从正态分布),则有
其中,超参数定义为:α=[α0,α1,…,αN]。
整个样本的最大超参数似然函数为:
式中,η(xi)=[1,k(xi,x1),k(xi,x2),…,k(xi,xn)],ci=y(xi,w)+εi。
令B=[η(1),η(x2),…,η(xn)],则关联向量机分类器可以写成
综上所述,总结整个识别过程为:首先将断口图像进行Grouplet 变换,由式(1)~式(5)得到断口图像的Grouplet 系数,由式(7)计算断口图像的Grouplet 熵特征数据,将得到的特征数据送入RVM 识别器并由式(11)得到分类结果。
图2 所示为几种典型的断口图像。可以看出,3种断口图像有各自不同的微观结构。选取222 张大小为256×256 的金属断口图像进行识别。
本研究由matlab 仿真实现,首先对断口图像进行Grouplet 变换,然后根据式(7)计算得到Grouplet 熵特征量,结果如图3 所示。
图2 3 种典型的断口形貌Fig.2 Three typical fracture morphology
图3 基于Grouplet 熵的断口图像特征数据Fig.3 Metal fracture characteristic data based on Grouplet entropy
将上述特征值送入RVM 分类器,得到如图4所示的分类结果。由图4 可以看到,在对111 张断口图像的识别中,共计有16 个图像被误判,其中有解理断口误判数为3,韧窝断口误判数量为8,沿晶断口被误判数量为5。
图4 基于Grouplet 熵-RVM 的识别结果Fig.4 The results of Pattern Recognition based on Grouplet entropy-RVM
为了验证所提出方法的有效性,首先与小波熵-RVM 方法对比,实验结果见表1。在对比试验中,小波熵-RVM 与本研究提出的Grouplet 熵-RVM 具有相同的识别器,但图像的特征向量不同。由表1 可知,Grouplet 熵-RVM 正确识别率为85.58%,小波熵-RVM 识别率略低,这是因为正方形的小波基不能够自适应的逼近断口图像的纹理曲线,用小波变换所提取的断口图像特征信息不如Grouplet 变换提取的特征信息丰富。
表1 Grouplet 熵-RVM 与小波熵-RVM 的识别方法对比Table 1 Comparison of the two methods based on Grouplet entropy-RVM and Wavelet entropy-RVM
Grouplet 熵-SVM 方法与Grouplet 熵-RVM具有相同的特征向量,但是识别器不同,本研究将提取得到的断口图像的Grouplet 熵特征数据送入SVM 进行识别,与RVM 进行对比,结果见表2。由表2 可知,采用SVM 作为识别器的识别速度较低,这是由于Grouplet 熵-SVM 方法的支持向量随着样本的增加而线性增长,导致识别速度降低。
1)Grouplet 变换的基是多方向和各向异性的,表示图像几何结构时具备更好的稀疏性,可以最大限度地利用图像的几何特征。而小波变换不能有效逼近奇异性曲线,只能获取图像有限的方向信息,不能够充分利用图像本身的几何正则性。因此,采用Grouplet 熵作为特征值能够更准确的反映断口图像的纹理信息。
表2 Grouplet 熵-RVM 与Grouplet 熵-SVM 的识别结果比较Table 2 Comparison of the two methods based on Grouplet entropy-RVM recognition method and Grouplet entropy-SVM
2)试验结果表明:Grouplet 熵-RVM 方法比小波熵-RVM 方法的识别率略高,为85.58%,相比于Grouplet 熵-SVM 的识别速率更快,约是Grouplet 熵-SVM 方法的5 倍。
[1]颜云辉,王德俊,黄雨华,等.疲劳断口分析的Fourier 变换方法[J].金属学报,1997,33(4):386-390.
[2]颜云辉,高金鹤,刘勇,等.基于小波变换的金属断口模式识别与分类[J].金属学报,2002,38(3):309-314.
[3]张莉,黎明,杨小芹.基于树形小波变换的断口图像识别[J].南昌航空大学学报:自然科学版,2007,21(2):42-45.
[4]苏静,黎明.基于灰度共生矩阵的金属断口图像的分类研究[J].计算机工程与应用,2008,44(9):223-225.
[5]Mallat S.Geometrical grouplets[J].Applied and Computational Harmonic Analysis,2009,26(2):161-180.
[6]Peyré G.Dynamic texture synthesis with grouplets[C].Proceedings of MAPMO workshop on image processing,Orléans,France,2008,9:1-12.
[7]Peyré G.Texture synthesis with Grouplets[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2010,32(4):733-746.
[8]Maalouf A,Carré P,Augereau B,et al.Inpainting using geometrical grouplets[C].16th European Signal Processing Conference (EUSIPCO 2008),Lausanne,Switzerland,2008,8:1-5.
[9]Maalouf A,Larabi M CH,Fernandez-Maloigne Christine.A Grouplet-based reduced reference image quality assessment[C].International Workshop on Quality of Multimedia Experience(QoMEx 2009),San Diego,CA.2009:59-63.
[10]Maalouf A,Larabi M CH.Grouplet-based color image superresolution[C].17th European Signal Processing Conference(EUSIPCO 2009),Glasgow,Scotland,2009:25-29.
[11]Saito T,Ishikawa K,Ueda Y,et al.Image denoising with hard color-shrinkage and grouplet transform[C].28th Picture Coding Symposium (PCS 2010),Nagoya,Japan,2010:430-433.
[12]Wei J,Loui A C.Video concept detection by audio-visual grouplets[J].International Journal Multimedia Information Retrieval,2012,1(4):223-238.
[13]Yan J W,Wang Z,Dai L Q,et al.Image denoising with Grouplet transform [C].The 2nd IEEE International Conference on Advanced Computer Control.Shenyang,China,2010:65-69.
[14]王治玺.Grouplet 变换及其应用研究[D].汕头:汕头大学,2010:24-28.
[15]张荣标,胡海燕,冯友兵.基于小波熵的微弱信号检测方法研究[J].仪器仪表学报,2007,28(11):2078-2084.
[16]梁鹏,李志农.基于Contourlet-RVM 航空构件断口图像识别方法研究[J].机械强度,2013,35(4):395-399.
[17]Tipping M E.The relevance vector machine[J].Advances in Neural Information Processing Systems,2000:652-658.