李 伟
(哈尔滨工程大学 信息与通信工程学院,哈尔滨 150001)
图像分割是计算机视觉研究中重要的研究领域.根据Fu和Mui 的综述,图像分割的方法可以被归为3 类,即特征阈值化和聚类、边缘检测、区域检出[1].模糊聚类分析是非监督模式识别的主要技术之一.模糊聚类在图像分割中是一种较好的方法,能有效解决经典数学不能精确表达的问题,是一种有效的聚类方法.该算法广泛应用于特征分析、模式识别、图像处理与分析、智能信息处理等领域[2-3].本文用K 均值聚类算法对模糊C-均值(FCM)聚类算法进行改进,对灰度图像进行聚类分割.FCM 算法是由Dunn 提出,经过Bezdek 的推广后,获得了较广泛的应用.该算法用于图像分割,是一种非监督模糊聚类后标定的过程,适合于图像中存在模糊性和不确定性的特点.然而,由于传统的FCM 算法实际上是一种基于像素分类的图像分割方法,仅利用了图像的灰度信息而没有考虑像素的空间信息,对于分割含噪图像不能得到满意的结果.该算法存在着一些明显的不足:1)有时聚类类数无法预先确定,使用时需要确定聚类的有效性准则;2)类中心位置不一定事先知道,必须进行初始猜测;3)对大数据样本集进行聚类时,运算开销太大.4)对初始化极为敏感,容易陷入局部极小值而得不到全局最优解[4].这些不足之处限制了该算法的应用.
本文结合图像的邻域信息,对图像的直方图作均衡化处理,把原本不清晰的图像变得清晰,通过自适应滤波降低噪声对分割效果的影响.利用K均值具有快速、简单的优点对图像作初次分割,得到初次分割图像和较为准确的聚类中心.以K 均值得到的聚类中心为初始聚类中心,在FCM 算法中用邻域灰度均值代替灰度信息对K 均值得到的初次分割图像作二次分割.该方法能更好的抑制噪声的干扰,提高了聚类的分割精确度.
FCM 算法用于图像分割,是根据图像中像素和C个聚类中心的每一个中心间的加权相似性测度对目标函数进行迭代优化,以获得最优聚类结果[5-6].目标函数如下:
其中:X={x1,x2,……xn}为样本集合,xj∈Rp,n 是聚类空间的样本数;V={v1,v2,…,vc}为c个聚类中心组成的集合,vi∈Rp,c 是聚类的类别数;uij是第i 类样本点xj的隶属度;dij=‖xj-vi‖2是内积矩阵范数,表示样本点xj距聚类中心vi的欧氏距离;隶属度矩阵U=[uij]c×n满足式(2)、(3).在每次迭代的过程中,uij和vi的最小化是分别进行的.最小化必须的条件在执行过程中服从于更新方程式.模糊隶属函数独立于所选的距离函数和原型,表示为式(4):
在标准的FCM 算法中,聚类中心是和数据同维度的向量,聚类中心的更新方式为
在众多的聚类算法中,K 均值是最常用的一种基于硬划分准则的算法.该算法通过不断反复迭代的思想将每个对象惟一的划分到一个类中.在满足式(6)的非线性目标函数最小化的条件下,把数据集(由n个对象Xj(j=1,2,…n)构成)划分成k个类Gi(i=1,2,…,k),这k个类尽可能独立、紧凑[7],即类间对象的相似性尽可能的低,而类内对象的相似性尽可能的高.
Gj表示含有n个数据对象的Gj的质心:
K 均值聚类算法的步骤[8-9]:
步骤1:选定聚类类别数目k;
步骤2:随即选取数据集Xj中的k个对象作为Gi的初始聚类中心;
步骤3:计算Xj与Gi的距离d(Xj,Gi),将对象划分到与之距离最小的那个类中;
步骤4:新生成的类中所有对象的均值作为新的聚类中心;
步骤5:如果非线性目标函数的误差变化很小,达到所设定的阈值则停止迭代,否则重复步骤3~5.
迭代过程结束后,得到被分割的图像和聚类中心.
鉴于K-均值聚类算法具有简洁、搜索力强、适合处理大数据集的优点,被广泛的应用于数据挖掘领域中.
由于图像中噪声的影响,图像变得模糊不清.自适应滤波器保留了图像的边界和图像的高频部分,会产生比线性滤波更好的效果.为了减少噪声对分割效果的影响,需要对待分割图像做自适应滤波处理.
由于各种拍摄条件的限制,导致图像模糊不清,对比度较差.图像的直方图是一个统计像素个数的图形,它统计一幅图像中相同像素值的个数.
从图1、2 可以看出,图像的像素主要集中分布在70~160 之间,在[0,70]和[160,255]之间基本为没有像素分布.由于该幅图像的像素值在中间部分,导致像素的区分度较小,因此图像的对比度不够,图像模糊不清.因此,可以利用直方图均衡化调整图像的灰度范围,提高图像对比度,使图像细节更加清晰.通过直方图均衡化处理,图像变得清晰,如图3所示.
图1 小女孩图像
图2 小女孩图像灰度直方图
从图3、4 可以看出,经过直方图均衡化和自适应滤波处理之后,图像的灰度直方图反应的灰度范围增大,图像也变得清晰.
图3 预处理后图像
图4 预处理后图像的灰度直方图
K-均值聚类算法通常采用误差平方和函数作为优化的目标函数,如式(6)所示,Gj表示含有n个数据对象的Gj的质心,目标函数表示数据样本与簇之间中心间的差异度平方的总和,目标函数值的大小跟簇中心有密切的关系.显然,目标函数的值越小则代表聚类结果的质量就越好.
新算法中首先利用直方图均衡化与自适应滤波改善图片质量,降低噪声对分割效果的影响.然后利用K 均值聚类算法对图像进行分割,得到分割的图像和聚类中心Gj.由于K 均值聚类算法具有简单、快速的优点,所以用K 均值聚类算法对图像做一次分割,得到初次分割图像和聚类中心,可大大提高FCM 分割算法的效率,避免了FCM 图像分割算法中因聚类中心选择不当造成的死点问题.而且该算法中,用邻域灰度均值代替灰度信息,能有效降低噪声对分割效果的影响.
新算法的步骤如下:
1)设定循环迭代终止的条件,对待分割图像作直方图均衡化处理得到较为清晰的图像;
2)在图像中加入高斯噪声;
3)对新图像进行自适应滤波处理,降低噪声对分割效果的影响;
4)用K 均值聚类算法对1)~3)处理后的图像作分割处理,得到分割后的图像和聚类中心;
5)在标准的FCM 图像分割算法中,初始聚类中心为步骤4)得到的聚类中心,用邻域灰度均值代替图像的灰度信息,对步骤4)得到的图像进行循环迭代,当达到迭代终止条件时停止迭代,否则继续循环;
6)迭代终止后,根据最大隶属度原则对清晰图像进行分割;
实验及分析见图5~14.
图5 K 均值算法
图6 标准的FCM 算法
图7 本文算法
图8 大米图像
图9 大米图像加入高斯噪声
图10 加入高斯噪声的图像灰度直方图
图11 预处理后图像的灰度直方图
图12 K 均值算法
图13 标准的FCM 算法
图14 本文算法
从图10 可以看出,噪声的存在严重影响了图像的直方图的分布情况.
由于标准的FCM 算法采用了对噪声敏感的欧式距离,而且没有考虑到图像中不同的像素对分割的贡献不同,未将邻域灰度信息加入到算法中,因此分割出的图像含有较多的噪声,甚至会产生误分割.通过对比标准的FCM 算法、K 均值聚类时算法和本文算法的分割效果可以看出,本文算法能有效去除噪声对分割效果的影响,提高分割精度.
本文对标准的FCM 分割算法进行了改进,新算法不仅保持了传统的FCM 算法的模糊划分优势而且降低了对噪声的敏感度.在该算法中,通过直方图均衡化和自适应滤波,尽可能的减少图片中噪声的影响,增强图像对比度.利用K 均值聚类算法快速、简单的优点对图像作初次分割,得到初次分割图像和聚类中心.然后用图像邻域灰度均值信息代替了传统的灰度信息用FCM 算法以K 均值的聚类算法得到的中心为初始聚类中心对初次分割图像作二次分割,不仅依靠K 均值算法提高算法的速度,而且用K 均值聚类中心为初始聚类中心,有效的避免了初始聚类中心选择不当造成的死点问题.实验结果表明,改进的FCM 算法大大提高了算法的鲁棒性,更好的抑制了噪声的干扰,提高了分割算法的精度.
[1]杨金龙,张光南.基于二维直方图的图像分割算法研究[J].激光与红外,2008,38(4):400-403.
[2]李德俭,柏正尧.一种基于二维直方图与FCM 的图像分割方法[J].仪器仪表学报,2009,30(6):276-279.
[3]沙秀艳,何 友.邻域灰度差加权的模糊C 均值聚类图像分割算法[J].火力与指挥控制,2008,33(12):34-40.
[4]张 扬,王士同.基于改进模糊聚类算法鲁棒性的图像分割[J].中国图像图形学报,2008,13(5):911-917.
[5]张云飞,张 晔.二维直方图创建的新方法实现图像自动分割[J].光电工程,2007,34(1):76-79.
[6]杨润玲,高新波.基于加权模糊C 均值聚类的快速图像自动分割算法[J].中国图像图像学报,2007,12(12):2105-2111.
[7]路彬彬,贾振红.基于邻域灰度的模糊C 均值图像分割[J].光电子激光,2011,22(3):469-473.
[8]AWATE S P,ZHANG H.A Fuzzy,Nonparametric Segmentation Framework for DTI and MRI Analysis:With Applications to DTI-Tract Extraction[J].IEEE transactions on medical imaging,2007,26(11):1525-1536.
[9]肖 刚.基于小波域软阈值的指纹分割方法研究[J].哈尔滨商业大学学报:自然科学版,2012,28(2):231-234.