多通道Gabor特征的融合聚类图像纹理分割

2015-08-01 05:34邝神芬
韶关学院学报 2015年2期

邝神芬

(韶关学院数学与统计学院,广东韶关512005)

多通道Gabor特征的融合聚类图像纹理分割

邝神芬

(韶关学院数学与统计学院,广东韶关512005)

摘要:针对图像纹理分割,提出了采用图像Gabor多通道特征进行融合聚类方法.首先采用Gabor小波对图像进行卷积滤波,得到每个像素点的多尺度多方向的Gabor特征,然后对其进行标准化以及Gauss平滑,减少噪声影响.对每个优化后的Gabor特征作为训练值,采用融合聚类算法每次随机选择部分特征进行聚类,通过运行多次基聚类,然后对聚类结果采用投票的方式得到最终的图像纹理分割,通过人工合成纹理与自然纹理图像实验证明该方法对纹理的分类具有较高的正确率.

关键词:Gabor小波;多通道Gabor滤波;聚类融合;纹理分类

图像纹理分割是图像处理和计算机视觉领域一个有挑战且非常基本的问题,其主要目的是将图像依据不同纹理区域的分成不同的类别即把图像划分成若干互不交叠区域的集合.由于纹理是很多图像的基本特征,纹理分析对很多计算机视觉应用如文件图像处理,远程遥感,医学图像等起着重大作用.因此很多学者已经提出了很多关于纹理分类的方法,这些方法可以归根为三种:基于统计的、基于模型的、基于信号处理的方法[1-2].近年来,很多学者已经将许多关于统计的分类算法应用于纹理分割,这包括使用多元正态分布的贝叶斯分类、非参数最近邻分类、费希尔变换、分类树、前向神经网络以及最近的支持向量机[3]和自组织影射.但是提取有效的图像特征用于纹理描述和分类一直是纹理分析的难点,要实现对图像纹理的分割,一个重要的方法就是找到好的图像特征集去表示纹理特征.随着Daugman对视觉细胞与Gabor小波的研发发现[4-5],图像纹理分割得到了更好的效果,但由于图像的多通道特征维数比原图像的灰度特征大得多,而且仅用单一聚类方法,其聚类结果往往不太理想,因此为了获得更稳定的特征和鲁棒的纹理分割结果,本文结合这些思想的基础上,提出使用Gabor特征的融合聚类方法对图像纹理进行分割.

1 Gabor小波

Gabor小波提取图像特征,最初由Daugman中的用二维Gabor函数对在视觉纹理里的简单细胞的空间感知域的属性进行建模文章中提出的[4],Gabor小波实质为一个高斯函数与一个余弦函数的乘积,表示为:

其中:x′=x cosθ+y sinθ,y′=-x sinθ+y cosθ.x,y指定视觉域在轻脉冲的方向,而f,θ,ø,σ,γ是未知参数,这5个未知参数通过适当取值就可以与人类视觉域的多通道特性一致,其中各参数的含义为:f为频率,指定Gabor函数的余弦函数的频率,该值决定了Gabor函数平行条纹的大小;θ为长轴方向,指定Gabor函数的平行条纹的方向,方向以度为单位,一般的取值为0~180度;φ为相位,指定Gabor函数的余弦因子的偏移,0度表示实部,90度表示虚部;γ为纵橫比,指定高斯因子的椭圆形状,即Gabor函数平等条纹的长宽比例;决定高斯窗宽度与波向量长度的比率,其值越小则图像平滑的范围越小,值越大则图像平滑范围越大;同时比率决定带宽(b)[2],其公式为:

2 特征提取

将不同尺度与方向的Gabor小波对图像进行滤波,可获得图像的多通道Gabor特征,而使用Gabor小波进行特征提取,实质就是图像与二维的Gabor滤波器的卷积,设输入图像为用I=I(x,y)(I(x,y)表示图像的灰度值分布,(x,y)∈D,(D为图像的点集),则使用Gabor小波的图像滤波特征可表示为:

其中,*表示卷积.图像的卷积可通过快速傅里叶变换实现,固定φ,λ,b,则图像滤波特征仅由θ和f决定,故通过取代不同的方向θ与f频率,则一个图像经过{f,θ}组成的不同Gabor小波进行滤波后形成集合O= {Of,θ(x,y)|f=1,2,…,Nf,θ=1,2,…,Nθ},即经过Gabor滤波后,每一点后每个像素点(x,y)从原来的一维灰度值变为Nf*Nθ维的特征向量.由于经过Gabor小波滤波得到相应的Nf个频率和Nθ个方向的特征,即整个图像具有Nf×Nθ×N×N维的特征,该特征显然比原料图像的维数要高得多,但比原图像含有信息量更大,能更全面反应图像的信息,但由于维数过高,不宜直接采用该特征进行对图像纹理进行分类,这是由于维数过高容易导致分类算法陷入的维数灾难,对于一幅纹理图像,设计一个最优方向与尺度的Gabor滤波器,它能够抑制背景纹理图像的主频率(目标纹理图像的次要频率)分量,同时增强目标纹理图像的主频率分量,每个纹理都对应一个最优的方向与尺度Gabor滤波,即滤波后目标区域纹理与背景区域纹理具有明显的差异性,因而虽然Gabor滤波特征维变大了,但对图像纹理区域的特征却变得更有区分性,本研究主要利用图像纹理和背景特征的这种特点采用融合聚类算法对其进行分类.

3 图像纹理分割

由于对图像进行Gabor过滤时得到的特征比原来图像的维数高得多,如果直接采用聚类算法对特征进行聚类,则由于维数过高而导致聚类结果与实际有偏差,同时由于图像纹理的不规则性,采用单一聚类其分类效果往往不够理想,为了提高图像分类的效率与准确性,本研究借鉴bagging和boosting算法的思想,采用K-均值算法对Gabor特征进行基聚类,每次挑选部分Gabor特征,用K-means基聚类算法在该样本集上产生一个基聚类结果,这样在给定训练轮数 n后,就可产生n个基聚类,然后对基聚类结果采用投票的方式将这n个基聚类结果进行投票融合,产生最后的融合结果.在这n个基聚类中,每个单个的K-means算法的分割效果不一定很高,但他们联合后的结果有很高的识别率,这是由于只选择部分特征进行基聚类,K-means运行效率高,通过基于投票的方式对多次基聚类结果进行融合,又可提高聚类的稳定性与正确性,本研究的纹理分割流程如图1所示.算法的描述如下.

(1)基聚类算法K-means的流程

a.选择k个数据点作为初始凝聚点,将这k个像素点作为k个类的重心;b.对所有数据点逐个归类,将每个数据点归入凝聚点离它最近的那个类(采用欧氏距离度量),同时更新该类的凝聚点,凝聚点为该类的样品的平均值,更新该值,直至所有数据点都归了类;c.重复步骤b,起至所有数据点都不能再分配为止,或者满足一定准则结束聚类.

(2)算法主要过程

输入:图像的Gabor滤波特征O={Of1,θ1,Of2,θ2,…,OfN,θN},(Of1,θ1代表频率为fi及方向为θi的Gabor函数与图像卷积得到的特征),选择要聚类的特征数m,要运行的聚类次数n,对图像纹理分类的数目k.

Step1:

for i=1 to n

(a)从n个变量中随机选择m(m<n)个变量对应的数据作为训练数据;

(b)对这m个变量组成的训练数据进行K-means聚类;

(c)将聚类结果保存为Ti;

end

Step2:

对n次基础聚类的结果{Ti}ni=1,采用投票的方式进行融合.由于不同的聚类结果的类标签不一致,如对于一个含7个数据点的数据,运行2次基础聚类,分类结果分别为:X1={1,1,2,2,3,3,1},X2={2,2,1,1,3,3,2}.显然X1与X2这两个聚类的分类的结果是一致的而只是聚类结果的标签不一致;为解决这个问题,对聚类结果进行融合前对基聚类结果进行标签的转换;首先采用第一次聚类结果标签作为每次聚类的统一标签,每次运行完基础聚类后,得到的聚类结果均与第一次聚类的结果进行相似性匹配,找出每个类别对应统一标签的类别,从而使每次聚类的类标签与统一标记类别相一致,标签转换完成后,统计每个像素点的聚类结果,该像素点的最终类别为多次基础聚类中将其分到同一类次数最多的那个类别.

输出:最终的聚类结果,即图像每个像素点对应的类别.

图1 图像纹理分割算法

综合以上的方法和算法步骤,可以得到图像纹理分类的过程,由于图像纹理一般是区域性的,因此相对其它的图像分类,还需经过一些预处理和特殊的变换以保证后期聚类结果的稳定,过程如下:

Step1:

采用公式(3)对图像I(x,y)与Gabor函数作卷积;得到不同频率不同方向的多通道Gabor滤波特征Of,θ(x,y).

Step2:

将各个Gabor特征O归一化,即O′=(O-min O)/max O.

Step3:

对Gabor特征进行高斯平滑,取高斯函数为gauss(x,y)=,即Gf,θ=O′f,θ(x,y)*gauss(x,y),平滑后的特征主要作用是减少噪声影响.

Step4:

对运行融合聚类算法,得到最终的纹理分类结果.

4 实验分析

4.1参数选择

参照文献[2],首先设置Gabor滤波器函数的参数,由于共有5个参数,固定γ=1,φ=0,b=1而σ=,又Gabor函数的θ和频率控制过滤器中心的位置,通过调整这两个参数,可以获得多个滤波器从而覆盖图像的空间频率域,进而获得图像多通道特性,在这里将θ取6个值,分别为0°,30°,60°,90°,120°,150°,而频率取值见参考文献[6],按照图像大小取低频和高频即:flow(i)=-2i-0.5/ Nc,fhigh(i)=+2i-0.2/Nc其中i=1,2,…,log2(Nc/8),Nc为图像的宽度;则对于256*256大小的图像,计算可得f取值0.248 0,0.244 1,0.236 3,0.220 7,0.189 5,0.127 0,0.252 0,0.255 9,0.263 7,0.279 3,0.310 5,0.373 0共12个;结果显示:Gabor函数的方向直接影响Gabor函数条纹的方向,而频率控制条纹大小.

而对于聚类融合算法的参数选择,通过实验交叉验证后,取m=5,n=12时聚类的结果比较理想,而图像纹理聚类数k则根据图像纹理的实际情况进行选择.

4.2实验结果

本研究采用经典的brodatz纹理数据库进行人工合成多纹理图像进行实验分析,同时采用真实图像进行实验分析,先对两个简单的图像进行分割,分别为人工合成纹理图像与自然图像及其分类结果,如图2所示.

图2 合成纹理与自然图像分割结果

对于图2的自然图像及合成纹理图像,可以看到,通过Gabor滤波后,能较好地对其进行分割,将前景与背景很好的分离,对于图像中存在多个纹理的图像,如图3的两个纹理合成图像,采用聚类融合算法对其进行分割,图像分割结果如图3的对应图像右边所示.

图3 纹理分类结果(k=4)

为了对纹理分类的结果的正确率作分析,引入了分类的正确率,即分类的正确率=像素被正确分类/总像素点,通过对图像3,由于图3的两个图像均是合成的,四个部分(上右下左)各为一类,因此对纹理分类后的结果计算其分类的正确率,约为91.2%和90.6%,其分类效果是比较高的,同时可以看到图3的聚类在纹理的交界处聚类结果不够好,这是由于图像纹理是人工合成的,在拼接过程中导致了在交界处出现一定的重叠或且拼接空隙,因而在交界处的像素聚类时出现的结果与实际不同,当然如果对图像的合成采用更专业的合成方式完全可避免这个问题,而这两个图像的纹理分类用需时间为15.12 s和16.56 s,这是由于融合聚类过程消耗的时间比较大,若采用并行的优化算法可解决此类问题.

5 结语

对图像纹理进行分类,先对图像进行不同方向与频率的Gabor滤波提取特征,得到图像多通道的Gabor特征,由于多通道Gabor特征维数大,故每次只挑选部分特征进行聚类;然后对特征运行多次聚类算法;最后使用基于投票的聚类方法融合多次聚类的结果,对纹理分类得到较稳定的结果,其分类效果也较为理想.但多通道的图像Gabor特征维数一般较高,在后续工作中,有必要考虑特征之间的统计相关性,为进一步提高其分割效率与正确率,采用适当的方法进行特征降维或提取特征主成分.

参考文献:

[1]Grigorescu S E,Petkov N,Kruizinga P.Comparison of texture features based on Gabor filters[J].Image Processing,IEEE Transactions on,2002,11(10):1160-1167.

[2]Hammouda K,Jernigan E.Texture segmentation using Gabor filters[R].Canada:McGill University,2000.

[3]Waske B,Van Der Linden S,Benediktsson J A,et al.Sensitivity of support vector machines to random feature selection in classification of hyperspectral data[J].Geoscience and Remote Sensing,IEEE Transactions on,2010,48(7):2880-2889.

[4]John G Daugman.Uncertainty relation for resolution in space,spatial frequency,and orientation optimized by two-dimensional visual cortical filters[J].Optical Society of America,1985,2(7):1160-1169.

[5]Jain A K,Farrokhnia F.Unsupervised texture segmentation using Gabor filters[J].Pattern Recognition,1991,24(12),1167-1186.

[6]Zhang Jian-guo,Tan Tie-niu,Ma Li.Invariant texture segmentation via circular Gabor filter[C]//Pattern Recognition,Proceedings of the 16th IAPR International Conference on.IEEE,2002:901-904.

[7]Khan J F,Adhami R R,Bhuiyan S.A customized Gabor filter for unsupervised color image segmentation[J].Image and Vision Computing,2009,27(4):489-501.

[8]Rahman M d,Hafizur M,Pickering R,et al.Scale and rotation invariant Gabor features for texture retrieval[C]//Digital Image Computing Techniques and Applications(DICTA),2011 International Conference on.Noosa,QLD:IEEE,2011.

[9]Liu Y,Muftah M,Das T,et al.Classification of MR tumor images based on Gabor wavelet analysis[J].Journal of Medical and Biological Engineering,2012,32(1):22-28.

[10]Singh S,Aggarwal A,Dhir R.Use of Gabor Filters for Recognition of Handwritten Gurmukhi Character[J].International Journal of Advanced Research in Computer Science and Software Engineering,2012,2(5):378-386.

[11]雷琳,王壮,粟毅.基于多尺度Gabor滤波器组的不变特征点提取新方法[J].电子学报,2009,37(10):2315-2320.

[12]李金磊,朱晓莲,朱海燕.种基于投票策略的聚类融合算法[J].计算机仿真,2008,25(3):126-133.

[13]曹林,王东峰,刘小军,等.基于二维Gabor小波的人脸识别算法[J].电子与信息学报,2006,28(3):490-494.

(责任编辑:邵晓军)

中图分类号:TP391

文献标识码:A

文章编号:1007-5348(2015)02-0006-05

[收稿日期]2014-04-21

[基金项目]国家自然科学基金(F030402).

[作者简介]邝神芬(1985-),男,广东广州人,韶关学院数学与统计学院讲师,硕士;研究方向:机器学习和模式识别.

Clustering Ensemble By Multi-channel Gabor Features for Texture Segmentation

KUANG Shen-fen
(School of Mathematics and Information Sciences,Shaoguan University,Shaoguan,512005,Guangdong,China)

Abstract:For the purpose of image texture classification,this paper proposes a clustering ensemble method by the use of multi-channel Gabor features.Firstly,it filtered the image by the multi-frequently and multi-direction Gabor wavelets,and then it standardized the image and Gaussian smoothed it to reduce the effects of noise;secondly,it used the multi-channel filters as training data,randomly selected some of the feature for k-means clustering as the base and run the procedure for many times;lastly,it run clustering ensemble algorithms that voting for the base clustering results to get the final image texture classification.Experimenting with synthetic texture and natural texture images,it proves that the method of texture the classification has a high accuracy rate.

Key words:Gabor wavelet;multi-channel Gabor filter;clustering ensemble;texture classification