胡雅婷,李长明,柳振鑫,任虹宾,陈营华
(1.吉林农业大学 信息技术学院,长春 130118;2.长春光华学院 电气信息学院,长春 130033;3.大连理工大学 数学科学学院,辽宁 大连 116024)
在图像分割中,光照不均匀、噪声干扰等都将增加图像分割的复杂度,对噪声和野值的鲁棒性是衡量图像分割算法的一个重要指标[1-2].基于划分聚类的图像分割方法以其高效、快速的特点,在图像分割领域应用广泛[3-6].目前,对典型基于划分聚类的图像分割算法的研究已有许多结果:Ahmed等[7]提出了在FCM(fuzzyC-means clustering)算法目标函数中引入图像的空间约束项,并考虑了邻域像素的信息,分割结果优于传统FCM算法;Chen等[8]通过在目标函数中分别引入均值滤波和中值滤波,利用邻域信息在一定程度上提高了聚类效率;Szilagyi等[9]提出的基于灰度值的图像分割算法进一步提升了计算效率;Cai等[10]在图像分割框架中引入了一种相似性度量,鲁棒性更高且参数设置简单,在一定程度上实现了抑制噪声并保持图像细节的目的.但上述方法均是在传统FCM算法的基础上加入空间约束信息,在提升了FCM算法分割性能的同时,仍存在FCM算法对噪声和野值敏感的问题,且这些算法需要人为指定聚类数目,其分割结果也与聚类数目有关.为了提高图像的分割性能,已有研究者采用抗噪性更强的可能性聚类算法[11-12]进行图像分割.通过将图像空间信息融入可能性聚类,对含有噪声的图像分割效果更好[13-14].目前,基于可能性聚类的图像分割算法中,聚类初始化中心及聚类个数的确定仍是需要解决的问题.因此,本文运用均值漂移算法确定可能性C-均值(PCM)聚类的初始化聚类中心,并利用带宽的调节得到不同尺度的聚类分割.通过图像加权进一步抑制噪声的影响,对自动加权后的图像用无监督可能性聚类算法进行图像分割,并验证了其有效性和优越性.
可能性聚类放松了模糊聚类算法中对隶属度的概率限制,隶属度值表示样本属于聚类的绝对可能性,适合对含有噪声的数据进行聚类分析.可能性C-均值聚类[12]算法对初始化极其敏感,其在图像分割中的主要问题是初始化中心的选取.均值漂移算法[15-16]是一种模式搜索的非参数密度估计算法,通过自适应地寻找概率密度局部最大值作为目标位置以实现聚类目的,不需要对聚类中心进行初始化.因此,本文利用多尺度无监督可能性聚类算法[17],通过均值漂移迭代获得PCM算法的初始化中心,有效解决了可能性聚类初始化的敏感问题.给定数据集X={x1,x2,…,xn}⊂s,均值漂移向量m(x)可表示为
(1)
由于均值漂移向量m(x)方向与fK(x)的梯度方向一致,因此均值漂移迭代序列x(k+1)=x(k)+m(x(k))(k=1,2,…)将沿fK(x)的梯度方向达到其局部极值.当选定一个带宽h值,则对应一种聚类划分,因此可通过调节带宽h值获得不同尺度的聚类划分.
将上述均值漂移迭代得到的向量作为PCM聚类算法的初始化中心,PCM聚类模型可描述为如下优化问题:
(2)
其中:U=(uij)c×n为可能性划分矩阵;uij表示数据点xj属于第i类的可能性;c为聚类个数;V={v1,v2,…,vc}表示数据集的聚类中心;dij=‖xj-vi‖为数据点xj与中心vi的距离;m为模糊加权指数;ηi(i=1,2,…,b)为参数,通过运行FCM算法获得.可能性隶属度和聚类中心可表示为
(3)
(4)
为了增强算法对噪声的鲁棒性,将图像分割分为两个阶段: 第一阶段,对图像灰度值进行加权处理,以抑制噪声的影响;第二阶段,应用聚类算法对图像灰度值实施无监督聚类,自动得到最终的分割结果.
为了抑制噪声对图像分割的影响,首先对图像进行加权.对于给定的图像I:
I={f(x,y)|f(x,y)∈[0,L-1]}, 0≤x≤N1-1, 0≤y≤N2-1,
其中:f(x,y)表示I中坐标(x,y)处像素的灰度值;L表示图像的灰度级;N1和N2分别表示图像长度与宽度的像素值.本文利用图像中单个像素点灰度值与周围的差异性判断像素为噪声的可能性.令PN(x,y)表示坐标(x,y)处像素为噪声的可能性,其取值由其邻域内像素的灰度值确定.为避免将图像边缘点与角点等正常灰度信息像素点误判为噪声,本文在以图像目标像素点为中心的正方形窗口邻域内搜索灰度值相接近且彼此连通的m个点(其中m=(窗口宽度-1)/2).记窗口内相连通像素点灰度值差值绝对值的最大、最小值分别为dmax和dmin,其成为噪声的可能性为
(5)
其中θ为设定的阈值.显然,当dmax=0时,有PN(x,y)=0.dmax值越大,其成为噪声的可能性也越大.因此,PN(x,y)体现了像素成为噪声的可能性,以其为依据进行灰度加权,将加权后的灰度值函数记为ψ(f(x,y)),则有
ψ(f(x,y))=τ1·ψ1(f(x,y))+τ2·ψ2(f(x,y)),
(6)
图1 不同σ值下τ1关于变量X的函数曲线Fig.1 Function curves of τ1 with respect to variable X for different values of σ
其中τ1,τ2≥0且τ1+τ2=1.为了更好地反映PN(x,y)的信息,文中取τ1=[1-h(PN(x,y))]/s,其中h(X)=exp{-(X-1)2/σ2}为径向基函数,h(X)与s的选取应满足当PN(x,y)=1时,即坐标(x,y)处像素必为噪声时,有τ1=0,τ2=1.此时,加权后的灰度值完全由处理后的灰度值ψ2(f(x,y))确定.而当PN(x,y)=0时,即坐标(x,y)处像素未受噪声影响,有τ1=1,τ2=0.此时,加权后的灰度值完全由原始图像的灰度值确定.ψ1(f(x,y))取为(x,y)处的中值函数,以保证算法对噪声有较好的鲁棒性,而ψ2(f(x,y))=f(x,y)保持原始灰度值信息.参数σ控制权值大小与噪声可能性之间的关系,如图1所示.
本文算法在进行图像分割时,无需指定聚类个数,这是由于聚类过程中的步骤4)和步骤5)都不需事先指定聚类数目.步骤4)中,均值漂移算法通过收敛的最终位置自动获得聚类结果;而步骤5)中的可能性聚类具有模式搜索性质,其最终聚类数目由聚类算法自动确定,多余的聚类将以重合的聚类中心进行体现.本文算法也可用于彩色图像分割,只需将算法中的灰度值集合G设置为彩色图像对应的各分量所构成的颜色向量集合.
为验证本文算法的性能,将其与几种经典的基于空间约束聚类图像分割算法进行比较.本文算法中采用带宽为100的高斯核函数,设置PCM中m=2,最大迭代次数为100.对比算法的参数设置与原文献一致.
图2 Baboon图像的分割结果Fig.2 Segmentation results of Baboon images
图2为应用不同算法对含有不同程度噪声的Baboon图像进行分割的结果.图2(A)为Baboon图像原图,图2(B)~(D)分别为加入5%,10%,20%椒盐噪声的Baboon图像;图2(E)~(H)分别为应用文献[8]中S1算法对图2(A)~(D)进行图像分割得到的结果;图2(I)~(L)分别为应用文献[8]中S2算法的分割结果;图2(M)~(P)分别为应用文献[9]中EN算法得到的分割结果;图2(Q)~(T)分别为应用文献[10]中FG算法得到的分割结果;图2(U)~(X)分别为应用本文算法进行无监督图像分割得到的结果.本文算法进行聚类图像分割时,对原始图像自动分割为4类,加入5%椒盐噪声图像自动分割为5类,加入10%和20%椒盐噪声图像自动分割为6类.为在同等条件下进行对比分析,本文将其他几种对比算法的聚类个数设置为与本文算法相同.由图2可见,对于不同程度的噪声图像,本文算法能更好地保持图像细节,对噪声的鲁棒性最强.
下面应用聚类有效性指标定量分析各算法的图像分割性能.采用应用最广泛的Xie-Beni和PE聚类有效性指标对图像分割结果进行分析,两种聚类有效性指标取得最小值均对应最优聚类划分.图3为对图2(A)~(D)进行分割时,不同算法对应的Xie-Beni和PE指标值.由图3可见,在两个指标共8组数据的比对中,本文算法在其中5组中取到最小值,对应的聚类结果最优.在另外3组数据上处于中等水平,整体上仍表现最好.尤其是PE指标值,本文算法明显优于其他对比算法.
图3 不同算法的聚类有效性指标对比Fig.3 Comparison of clustering validity indexes of different algorithms
图4 不同算法的窗口宽度与时间关系对比Fig.4 Comparison of window width and time of different algorithms
下面对算法的时间复杂度进行分析.图4为Baboon图像分割的窗口宽度与时间关系曲线.由图4可见,各对比分析算法中,EN算法的时间复杂度最低,且对于不同大小窗口的变化较小.但EN算法时间复杂度的降低是以分割质量下降为代价,分割效果最不理想;本文算法对于小窗口的时间复杂度较高,但其时间复杂度不随着窗口的增大而增加,当窗口宽度大于700像素时,其时间复杂度低于S1,S2和FG算法,适合较大尺寸的图像分割.
综上所述,为了改进基于FCM聚类的图像分割性能和效率,本文提出了一种自动加权的无监督聚类图像分割算法.该算法首先根据像素灰度值与邻域像素灰度值的关系对图像像素进行自动加权以抑制噪声,加权系数与像素的噪声可能性大小动态相关;然后应用均值漂移迭代确定可能性聚类算法的初始化中心;最后利用可能性聚类的模式搜索性质自动确定聚类个数与最终的可能性聚类划分.算法无需人为假设聚类个数,实现了全自动无监督图像分割.实验结果表明,本文算法不仅能较好地保持图像细节,对噪声的鲁棒性强,且对较大尺寸图像进行无监督分割时计算效率较高.