马江林 赵忠明 彭 玲 钟建强
(中科学院遥感应用研究所遥感图像处理研究室1) 北京 100101) (第二炮兵青州士官学校2) 青州 262500)
纹理分类的一个重要步骤是纹理特征的提取,好的纹理特征应该满足同类间的特征差异性小而不同类之间差异性大的特点.在过去的几十年里,研究者提出了很多纹理特征提取的方法,Tuceryan将这些方法分为四类[1]:统计的方法(如灰度共生矩阵(GLCM)、灰阶差分(GDTM))、几何的方法(如Gabriel图、Voronoi图)、模型的方法(如高斯马尔科夫随机场(GMRF)、同步自回归模型(SAR))和信号处理的方法(如小波变换(Wavelet)、傅里叶变换(FFT)).这些方法从不同侧面试图描述人脑对纹理的认知能力,然而由于纹理在模式上的多样性,使得没有一种方法适用于所有纹理特征的描述[2].本文研究了GLCM,GMRF和Wavelet在纹理特征表达方面的互补性和协同性,提出了基于特征融合与约简的纹理分类算法,采用基于K-NN分类器的留一法交叉验证错误率作为顺序前向搜索算法(SFS)的评估函数对GLCM,GMRF和Wavelet方法提取的特征进行融合与约简,从而有效地将多特征进行联合,最后利用K-NN对融合后的特征进行分类.
灰度共生矩阵(GLCM)由Haralick在1973年提出[3],是应用最为广泛的纹理特征提取方法之一.采用GLCM进行纹理描述需要考虑以下几个问题:(1)影像的灰阶范围.此参数决定了GLCM的大小,图像中灰度动态范围通常为0~255,其GLCM大小将达到了256×256,计算量将非常大,若将灰度阶缩减为16个灰阶,则计算量将大大降低.Clausi在研究中指出[4],影像的灰度值对纹理的分类辨识影响很小,从而为利用灰阶缩减提高GLCM计算速度提供了依据;(2)统计特征选择.Haralick推荐14种可以量化的纹理统计量作为特征,但由于这些特征之间具有很强的相关性,通常采用了Conner推荐的四个常用纹理统计量[5]:对比度、相关度、能量和同质度,计算公式为
对比度
相关度
能量
同质度
式中:Pi,j为规一化 GLCM 中(i,j)位置上值;ui,δi分别为i行GLCM的均值和方差.
该模型可以用式(5)来表示
式中:ηg为一组二阶邻域系统所对应的坐标偏移量;{θs,t:t∈ηg}为一组反映邻域像素与中心像素关系的相关系数,纹理特征就是通过这组相关系数和系数的方差来表达的;es为一个方差为的平稳高斯噪声序列,而则表示集合Ws的内部.集合Ws可以被划分为互不交叠的2个子集:内部子集和边缘子集.这2个子集分别定义如下.
采用GMRF进行纹理表达需要考虑以下几个问题:(1)随机场的确定:文献[5]推荐随机场采用对称临域方式,Clausi认为GMRF的阶数为4或5能够足够表达纹理的统计特征[6],因此采用4阶或5阶的对称临域GMRF来表征纹理特征,是一种可行的随机场确定方案;(2)随机场参数估计的一致性和稳定性:所谓一致性是指估计GMRF参数结果能够收敛到这些参数的真实值,而稳定性则是指GMRF的联合概率密度函数表达式中的协方差矩阵是正定的.采用Chellappa提出的基于最小二乘的模型估计算法,可获得一致性和稳定性的GMRF参数,本文采用这种方法:
式中:Θs为GMRF系数的集合;Qs为GMRF邻域灰度列向量,对任一幅纹理图像和表达了纹理特征.
利用二进制小波进行纹理分析[7]需要考虑以下几个问题:(1)小波基的选择.Mojsilovic等采用偶数长度的双正交滤波器比奇数长度的更适合纹理分析[8];(2)通过小波系数获取纹理特征.基于小波系数能量分布的均值和方差可以来表征纹理特征的思想[9],假如图像在某个尺度和方向的小波系数为Ii(x,y),其中i表示了特定的子图像,则该子图像所代表的纹理特征可以表示为f={μi,δi}.式中:
特征融合与约简纹理分类方法的基本思想是:特定的纹理特征提取方法总适合某类纹理,如GCLM方法特别适合分析细纹理、GMRF特别适合分析自然纹理、Wavelet方法特别适合随尺度变化剧烈的纹理,一个自然的想法是将多种方法提取的特征按照一定的方式组合,增加不相关的特征,融合后的特征更能全面地描述纹理,从而改善纹理分类精度.然而特征融合所面临的一个问题就是“维数灾难”,即当类的特征属性超过一定的维数时,分类精度就开始降低.为了解决这个问题,采用顺序前向搜索算法(SFS)进行特征的约简[10],与特征降维克服“维数灾难”方法相比,这种方法的好处在于:(1)挑选出的特征具有明确的物理意义,可以清楚看到那些特征更适合纹理的辨识;(2)纹理特征提取算法的复杂度都是非常高的,通过对特征选择,选出最适合纹理辨识的特征,在纹理识别系统应用阶段(图2(b)),可以放弃一些特征生成的计算,这样就降低了计算的复杂度.
SFS方法的流程如下:设X代表了所有的特征集合,Yi代表了选择第i次选择的特征集合,J(Yk)代表了目标函数.
(1)开始是一个空的特征集合Y0={Φ}.
(2)选择下一个最优特征,使得x+=
(3)更新特征集合Yk+1=Yk+x+,k=k+1.
(4)J(Yk+1)是否满足要求,如果不满足,返回到(2).
在SFS算法中,非常关键的一点是定义目标函数,目标函数可以是属性分离性判距、相关性测度,也可以是某个分类器采用某种方法获得的精度标准[11].采用K-NN作为顺序前进算法的评估分类器、利用“留一法”交叉验证作为顺序前进算法的精度标准.随着挑选出来的特征的增加,识别的精度也随之提高,当识别精度随着特征的增加而不发生变化或降低的时候,即J(Yk+1)-J(Yk)≤0时,对应的特征组合就是特征融合与约减算法所寻找到的特征组合.
特征融合与约简的方法的流程如图1所示.
图1 特征融合与约简纹理分类算法
测试纹理分类的比较有名的测试库有Meas-Tex,VisTex,CUReT和Brodatz,本实验采用了最为常用的Brodatz[12]中111类纹理进行算法的测试.每幅大小为640×640像素的纹理图像被分割成不重叠的25个分块,从而构成了25×111=2775幅测试纹理库.
纹理分类的目的是判断所考察纹理图像的类别,纹理分类系统设计包含了两个步骤:设计测试阶段和应用阶段,整个过程如图2所示.设计测试阶段通过训练样本以及所掌握的先验知识,设计用于判断新纹理图像类别的分类器.在应用阶段根据设计测试阶段形成的特征提取策略、特征选择策略和分类器设计策略对新纹理图进行分类.实验流程主要采用了图2a)设计测试阶段.
图2 纹理分类系统设计
1)预处理 预处理的目的是减弱同一类纹理由于光照不均而造成的纹理特征差异,我们采用了直方图均衡化处理方法.
2)特征提取 特征提取阶段分别采用GLCM,GMRF和Wavelet方法进行纹理特征提取.
对于GLCM方法,参数设置如下:(1)影像灰阶为16,则GLCM大小为16×16矩阵;(2)像对距离选为1个像素;(3)由于方向是纹理的一个重要特征,所以每个方向上求取的特征值可作为独立的特征;(4)每个方向上抽取的特征对比度、相关度、能量和同质度.这样对于任意一副纹理图像,对应的GLCM的特征维数为16维,记作Fg(1),Fg(2),…,Fg(16).
对于GMRF方法,采用了4阶对称马尔科夫结构,对应的特征为11维,分别对应GMRF参数和参数的方差,记作Fm(1),Fm(2),…,Fm(11).
对于Wavelet方法,采用了Daubechies 4小波[13],分解层次为3层,每个尺度、每个方向上小波变换后系数和最后一层低频系数能量分布的均值和方差作为特征,总的特征维数为20维,记作Fw(1),Fw(2),…,Fw(20).
3)特征规一化 特征规一化的目的是为了保证特征向量中的每个量在欧式距离计算中的地位是相同,这里采用了高斯规一化方法[14].
4)特征选择、分类器设计和精度评价 本文提出的融合与约简的纹理分类算法在测试阶段将这三个部分有机的整合到一起,通过精度评价的结果指导特征的约简.
表1列出了反映了算法选择特征的过程,随着选择特征维数的增加,识别的精度随之增加,当维数增至18维的时候,识别精度达到最大值87.8%,此时对应的特征来自GLCM的有7维、来自GMRF的有4维、来自Wavelet的有7维.这一结果证实了三种特征提取方法具有很强的互补性与协同性.
表1 融合与约简纹理分类算法特征选择顺序
为了验证本文提出的方法的有效性,本文从2个方面进行比较验证,其中精度评价仍然采用“留一法”交叉验证.
1)与GCLM,GMRF,Wavelet方法比较表2列出与GLCM,GMRF、Wavelet方法进行分类结果的比较,与单独的纹理特征提取方法相比,特征融合与约简的方法取得了更高的识别精度,识别率提高约10%以上.
表2 四种特征提取方法效果比较
2)与主成分变换(PCA)、Fisher线形判据(LDA)和简单特征组合方法比较 从表3可以看到,与简单的特征联合方法相比,我们提出的方法识别精度提高约4%;当PCA变换维数达到37维,识别效果与简单特征联合方法效果相同;当LDA变换维数达到33维时,识别效果最好,达到了与SFS近似的识别精度,但利用的特征维数远远超过了本文提出的方法.SFS的优势还在于识别的效率方面,在纹理识别系统应用阶段特征提取过程中(如图2b)),可以有选择地生成选择好的特征,而采用LDA方法需要各种方法生成的所有特征.
表3 4种特征融合方法效果比较
本文提出了一种新的特征融合与约简的纹理分类方法,该方法充分利用了GCLM、GMRF和Wavelet提取纹理特征之间的互补性,为了克服特征维数增加而带来的“维数灾难”问题,采用了基于K-NN分类器的留一法交叉验证错误率作为SFS的评估函数进行特征约简,从而有效地将多特征进行联合,对Brodaz纹理库的测试结果证实了该方法的有效性.
本文提出的方法同时也具有很强的可扩展性,可以从两个方面进一步提高纹理分类的精度:(1)增加或替代单独特征提取的方法,如可以利用小波框架来代替二进制小波提取纹理特征;(2)改变或替代分类器设计方法,K-NN是本文算法中利用的分类器,但是对于其他分类器,如神经网络、支持向量机,该算法同样适用.
[1]Tuceryan M,Jain A K.The handbook of pattern recognition and computer vision[M].World Scientif-ic Publishing,1998.
[2]Randen T,Husoy J H.Filtering for texture classification:a comparative study[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1999,21(4):291-310.
[3]Haralick R M.Textural features for image classification[J].IEEE Transactions on Systems,Man and Cybernetics,1973,3(6):610-621.
[4]Clausi D A.An analysis of co-occurrence texture statistics as a function of Grey-level Quantization[J].Canadian Journal of Remote Sensing,2002,28(1):45-62.
[5]Chellappa R,Chatterjee S.Classification of texture using gaussian markov random field Models[J].IEEE Transactions on.Acoustics,Speech,and Signal Processing,1984,33(4):959-963.
[6]Clausi D A,Comparing cooccurrence probabilities and markov random fields for texture analysis of SAR sea Ice imagery[J].IEEE Transactions on Geoscience and Remote Sensing,2004,42(1):215-228.
[7]李亚春,夏德深,徐 萌.小波变换在图像纹理分析中的研究进展[J].计算机工程与应用,2005,41(35):47-51.
[8]Mojsilovic A,Popovic M V,Rackov D M.On the selection of an optical wavelet basis for texture[J].Characterization[J],IEEE Transactions on Image Processing,2000,12(9):2043-2050.
[9]基于小波域隐马尔可夫树模型的多光谱遥感影像纹理分割技术研究[J].武汉理工大学学报:交通科学与工程版,2006,30(4):561-565.
[10]Whitney A W.Direct a method of nonparametric measurement selection[J].IEEE Transactions on Computers,1971,20(9):1100-1103.
[11]Witten I H,Frank E.Data mining:practical machine learning tools and techniques[M].Morgan Kaufmann,2005:149-151,288-294.
[12]Brodatz P.Textures:aphotographic album for artists and designers[M].New York:Dover Publications,1966.
[13]Daubechies I.Ten lectures on wavelets[M].Society for Industrial and Applied Mathematics,Phiadelphia,1992.
[14]夏定元,周曼丽.基于内容的图像特征相关性检索方法[J].华中科技大学学报:自然科学版,2002,30(3):97-99.