崔 亮, 徐玉冰, 程耀瑜
(1. 中北大学 计算机与控制工程学院, 山西 太原 030051; 2. 中北大学 信息与通信工程学院, 山西 太原 030051)
一种改进的FCM聚类算法在噪声图像分割中的应用*
崔亮1, 徐玉冰2, 程耀瑜2
(1. 中北大学 计算机与控制工程学院, 山西 太原 030051; 2. 中北大学 信息与通信工程学院, 山西 太原 030051)
摘要:针对传统模糊C均值聚类算法(FCM)在图像分割应用中具有噪声敏感性的问题, 提出一种改进的NFCM算法. 该算法通过依据邻域期望极大值准则考虑一个中心像素的邻域像素值对其的影响,进而修改标准FCM算法的目标函数来实现. 实验结果表明, 该算法在分割带有噪声的图像时, 图像去噪效果较其他FCM衍生算法更好, 耗时更少, 而且具有很好的鲁棒性.
关键词:FCM聚类算法; 邻域期望极大值; 图像去噪; 图像分割; 鲁棒性
图像分割是指将一幅图像分解为若干互不交叠的有意义且具有相同属性的区域, 是数字图像处理中的一项关键技术, 其分割的准确性直接影响后续任务的有效性, 具有十分重要的意义. 目前, 已有很多发展较成熟的图像分割技术[1-3], 大致分为4类: 阈值、 聚类、 边缘检测和特征提取[1], 本文考虑的是基于聚类的图像分割方法.
聚类分析是多元统计分析的一种, 也是非监督模式识别的一个重要分支, 在模式分类、 图像处理和模糊规则处理等领域获得广泛的应用. 它把一个没有类别标记的样本集按某种准则划分为若干个子类, 使相似的样本尽可能归为一类, 而将不相似的样本尽量划分到不同的类中. 目前有许多聚类算法已经被应用, 如硬聚类和模糊聚类. 传统的硬聚类把每个待辨识的对象严格地划分到某类中, 即每个图像的像素值仅属于一类. 然而, 实际情况中, 很多图像具有低的对比度, 不均一的噪声和强度变化, 这就加大了硬聚类分割的难度. Zadeh提出了模糊理论, 即用一个描述局部成员归属的隶属度函数来描述一个成员属于某一分类的程度[4]. 在模糊聚类算法中, 模糊C均值聚类算法(FCM)[5]因其有很强的鲁棒性, 而且可以保留比硬分割更多的图像信息[6]被广泛应用. 模糊聚类作为一种软分割方法已被广泛研究并成功用于图像分割[7-18].
尽管传统的FCM算法可以较好地应用于无噪声图像的分割, 但它不包含任何图像背景信息, 导致分割时对图像的噪声很敏感. 为了弥补这个缺点, 需要在分割前进行图像的平滑处理, 然而, 传统的图像平滑处理会使图像丢失很重要的信息, 尤其是图像边界或边缘信息, 更重要的是无法严格控制平滑和聚类之间的权衡. 因此, 对传统FCM算法的改进大致分为两类: ① 通过修改传统FCM算法的内部参数或者目标函数进行改进[7-11]. 文献[7]提出了一种基于粒子群优化算法的模糊C均值算法, 可以提高图像分割的准确性和鲁棒性. 文献[8]提出了一种快速、 有效的模糊聚类算法. 该算法将图像分为n×n块, 并使用块方差来判断是否均匀分区, 然后比较不同的隶属度函数块方差来计算分割结果. 文献[9]将空间邻域信息纳入制定集群的隶属函数, 利用邻域像素的分布统计信息和先验概率共同形成一个新的隶属函数, 该算法不仅可以有效去除噪声点, 还可以减少像素误判. 文献[10]利用图像相似度来校正传统FCM的欧几里德距离作为相似准则的数据点, 进而修改目标函数. 文献[11]利用熵方法计算每个像素属性的权重, 像素间的距离以及他们对分类的影响, 然后设定阈值来进行集群分析. ② 通过对传统的FCM算法进行条件限制进而产生一些衍生的FCM算法. 文献[12]提出一种塔型模糊C-均值聚类 (PFCM)方法, 它综合利用了图像的灰度信息和空间信息特征向量. 文献[13]提出一种基于临近元素空间距离的模糊C均值聚类算法, 即SFGFCM算法. 文献[14]在传统的FCM算法中引入了均值漂移(MS)算法,分割图像时利用MS算法可快速找到峰值点和图像空间信息, 对颜色漂移区域和细长区域均能保留更多的图像信息. 文献[16]利用先验概率来表示空间中心像素的相邻像素的影响,实现自动确定模糊邻近像素的隶属. 文献[17]提出了一种根据图像中的像素的空间位置计算自适应距离的自适应FCM算法. 尽管很多衍生FCM算法都对噪声具有鲁棒性, 但都表现出相当大的计算复杂性.
本文提出一种新的称之为Neighbour FCM(NFCM)的改进FCM算法, 该算法考虑了像素之间的空间依赖性, 产生新的FCM算法的目标函数, 根据零梯度条件来最小化这个目标函数, 该算法的优势在于可以调整新的目标函数中的惩罚项系数来处理少量或大量的噪声信息, 实验结果显示该算法是有效的, 而且具有很好的鲁棒性.
1传统的模糊C均值聚类算法
模糊聚类算法由Dunn首次提出, 之后被Bezdek改进[5], 该算法是一种迭代聚类算法, 通过最小化加权聚类目标函数方差之和来产生最佳的C区间[5]
(1)
(2)
⑤ k从1到n, 计算成员值U(b+1), Ik={i|1≤i≤c,dik=‖xk-vi‖=0}, 对于矩阵的第k个元素, 计算新的成员值:
a) 如果Ik为空, 那么
(3)
⑥ 如果‖U(b)-U(b+1)‖<ε, 迭代结束, 否则设置b=b+1, 返回到④继续.
2邻域期望极大值算法(NEM算法)
为了包含空间依赖性到目标中, 文献[18]提出了一种传统的期望极大值算法的改进版. 在这个方法中, 最大似然准则被一个可以量化空间相邻的像素支持各自组件的概率密度模型程度的项所限制, 给定数据集的空间结构通过W=(wjk)来定义
(4)
然后用式(5)调整最大似然准则
(5)
式中: c为类的个数; cij表示xj属于类i的可能性, 用来描述分割的均匀性, 类包含越多相邻的元素, 其值就越大. 新的邻域期望极大值算法准则通过最优化两个术语的加权和来获得
(6)
式中: D(c,φ)为期望极大值算法中的对数似然函数; β>0为一固定不变的参数, 有关NEM算法可参考文献[15], 该算法已经可以很好地运用于图像的分割.
3改进的FCM算法
从式(1)可以看出, 传统的FCM算法没有考虑空间信息, 图像分割过程只跟图像的灰度值有关, 使得对噪声很敏感, 本文中的算法在分类时考虑邻域信息, 为了把空间环境包含进来, 目标函数(1)被一个正则项所调整, 这由上面的NEM算法启发并根据FCM算法原则修改, 改进NFCM算法的目标函数如下
(7)
新的目标函数的约束条件为
式中: wkj按照式(4)定义, 系数γ控制惩罚项的影响程度, 图像信噪比越低, 系数γ就越高, 反之图像信噪比越高, 系数γ就越低. 当γ=0时, JNFCM等同于JFCM.NFCM算法和NEM算法的主要差别就在于它最大化了惩罚项而在NEM算法中为了满足FCM算法的原则而最小化了惩罚项, 而且, 在NFCM算法中由权重系数q来控制成员函数的模糊程度, 而在NEM算法中它是偏激的, 这个惩罚项被最小化, 当一个特定类的成员值是大的或者同一个类的相邻像素值成员也是大的时, 反之亦然. 换句话说, 它限制同一个类的像素值跟它的相邻像素值是相关的.
NFCM目标函数可以类似标准FCM算法那样被最小化, 最小化算法迭代可以通过估计矩心和成员函数得到, 以满足零梯度条件, 式(7)中的约束最优化可以利用拉格朗日乘法解决.
(8)
对式(8)求uik的偏导, 并设置结果零增益
(9)
(10)
(11)
解得
(12)
联立式(10)和式(12), 零梯度条件下的成员估计函数为
(13)
类似地
(14)
式(14)与FCM算法中的式(2)完全相同, 因为实际上目标函数(7)中的惩罚项与vi无关的.
NFCM算法描述如下: ① 设置聚类中心vi, 模糊参数q, c和ε的值;② 利用式(13)计算成员; ③ 利用式(14)计算聚类中心; ④ 返回步骤②并重复直到函数收敛.
当这个算法已经达到收敛, 接下来是解模糊化的过程, 为的是把模糊分割矩阵U转变成精确的不模糊的矩阵. 目前有很多方法可以解模糊化, 其中最重要的是最大成员函数法, 该算法利用最大成员函数把对象k分配到类c
(15)
经过这个过程之后, 模糊图像就可以被精确地分割.
4实验结果分析
利用NFCM算法进行图像分割的实验结果跟标准的FCM算法、 空间FCM算法(SFCM)以及基于核的空间限制技术模糊聚类算法(SKFC)的结果做比较. 所有情况下, 除非另有说明, 加权指数q=2.0, ε=0.000 1, γ=400, 其中参数γ通过实验选择以给予适当的结果. 本文选择3*3的窗口图像, 所以中心像素有8个邻域像素.SFCM中设置参数α=0.8,SKFC中设置参数α=3, σ=150,所有的算法在VS2010中编译.
为了评价上述方法的性能, 所有的实验首先在两张合成的图像上实现. 首先生成一个简单的二阶合成图像, 它的灰度值分别是100和60, 图像尺寸为256*256, 然后用5%的高斯噪声损坏图像, 如图1(a),FCM、SFCM、SKFC和NFCM结果如图1(b)~(e), 可以看到, 没有空间关联信息的FCM算法甚至不能分开两个级别, 尽管SFCM算法可以把图像分为两部分, 但每个区域还是有很多噪声, 在有噪声的情况下, 利用NFCM处理的结果类似于SKFC而且显著优于传统的FCM算法和SFCM算法的结果.
图 1 不同算法对被5%高斯噪声污染的二阶合成图像分割结果比较Fig.1 Comparison of segmentation results on a two-class synthetic image corrupted by 5% Gaussian noise with different algorithm
本次试验中不同算法对错误分类像素的数量和消耗的时间数据见表 1.从表 1 可以看出NFCM算法对像素错误分类的数量是最少的, 传统FCM算法大概是它的452倍, 而且,SKFC算法耗时最长,SFCM和NFCM算法耗时差不多.
其次, 是一个多级别合成的图像. 他们的灰度值分别是0,255,128, 图像尺寸是256*256, 加入10%的高斯噪声. 为了效果更加明显, 图像使用4种算法分别处理. 图2(a)是加了噪声后的图像, 图2(b)~(e)分别是FCM,SFCM,SKFC,NFCM的处理结果. 由图 2 看到, 4个算法都很好地分出了3个区域, 但是, 用FCM算法分割, 结果还是有很多噪声, 而用NFCM算法分割的结果很少斑点, 而且很光滑, 在这方面SFCM和SKFC算法具有基本相同的结果.
表 2 记录了对像素错误分类的数量和消耗的时间, 从表 2 可以看出,FCM对像素错误分类的数目是NFCM算法的63倍. 这两个合成图像的例子可以证明, 对于噪声图像, 加入空间邻域限制条件可以很明显地提高分割结果, 尽管SFCM和SKFC可以得到相似的结果, 但耗时较长.
表 1 不同算法对图1(a)的错误分类像素数和耗时
图 2 不同算法对被10%高斯噪声污染的三阶合成图像分割结果比较Fig.2 Comparison of segmentation results on a three-class synthetic image corrupted by 10% Gaussian noise with different algorithm
算法FCMSFCMSKFCNFCM错误分类像素数5642789耗时/s24302
另外, 实验测试γ值对NFCM算法结果的影响看出, 随着γ的增大, 错误分类像素数的数目在减少, 当γ>400后, 没有明显的变化, 实际上, 这些算法在400~500之间可以达到最小值, 效果比较稳定.
然后, 使用Lena标准图像进行测试, 没有加任何噪声. 原始图像如图3(a) 所示, 由于SFCM和SKFC算法的结果基本上跟NFCM类似, 所以不再用这两个算法比较, FCM算法和NFCM算法的结果分别为图3(b) 和图3(c).
由图3可以看出, FCM和NFCM两个都可以很好地把目标从背景中提取出来, 但是, 很明显NFCM分割出来的结果具有更均匀的区域, 比如Lena的脸部、 帽子和肩部, 实验结果可以证明NFCM算法不仅可以处理噪声图还可以处理成品图.
最后, 使用添加了椒盐噪声的Lena图像进行测试. 加了椒盐噪声的Lena图像如图4(a), 同样只比较FCM算法和NFCM算法的分割结果, 分别为图4(b) 和图4(c).
由图4可以看出, FCM算法和NFCM算法同样都可以很好地把目标从带有噪声的背景中提取出来, 但是, NFCM算法分割出来的结果具有更均匀的区域和更少的个别噪点, 效果要优于传统FCM算法, 从图4(c)还可以看出对加了椒盐噪声的Lena图像的分割结果与没加噪声的Lena原图的分割结果基本上没有什么差别, 这也证明了NFCM算法具有很好的抗噪性.
图 3 Lena标准图像的分割结果比较Fig.3 Comparison of segmentation results on standard images named Lena
图 4 带有椒盐噪声的Lena图像的分割结果比较Fig.4 Comparison of segmentation results on images named Lena with salt and pepper noise
另外, 对本次试验中FCM算法和NFCM算法分别对Lena标准图和加有椒盐噪声的Lena图像进行分割时错误分类像素数和消耗的时间进行了统计, 具体见表 3.从表 3 可以看出, 不管是标准Lena图像还是带有椒盐噪声的Lena图像, NFCM算法在错误分类像素数上都明显比传统FCM算法少很多, 效果更好, 而且NFCM算法并没有因为处理噪声图像而耗时增加.
表 3 FCM算法和NFCM算法分割Lena图像数据比较
5结论
本文提出了一个新的改进的FCM算法, 称之为NFCM算法, 该算法能够把本地空间环境信息和特征空间信息整合到图像分割中, 通过依据邻域期望极大值准则考虑一个中心像素的邻域像素值对其的影响,进而修改标准FCM算法的目标函数来实现, 有效克服了传统FCM算法因只考虑单独像素值而造成的分割不均匀以及抗噪性差的缺点. 通过与FCM、 SFCM和SKFC实验结果作比较表明, 证明该算法是有效的, 而且对噪声图像同样具有很好的鲁棒性, 在成品图像分割方面也比FCM算法更好. 接下来的工作就是能够自适应地决定该算法的惩罚系数, 以及补偿分割图像时强度的不均匀性.
参考文献:
[1]王威, 曾小能. 图像分割技术研究与应用[J]. 计算机时代, 2015, 23(1): 26-28.
Wang Wei, Zeng Xiaoneng. Research of image segmentation technology and application[J]. Computer Era, 2015, 23(1): 26-28. (in Chinese)
[2]张丹丹, 赵双. 图像分割技术综述[J].科技创新与应用, 2013, 22(10): 36-36.
Zhang Dandan, Zhao Shuang. Review of image segmentation technology[J]. Technology Innovation and Application, 2013, 22(10): 36-36. (in Chinese)
[3]汪梅, 何高明, 贺杰. 常见图像分割的技术分析与比较[J]. 计算机光盘软件与应用, 2013, 16(6): 63-64.
Wang Mei, He Gaoming, He Jie. Analysis and comparison of common image segmentation technical[J]. Computer CD Software and Applications, 2013, 16(6): 63-64. (in Chinese)
[4]Zadeh L A. Fuzzy sets[J]. Information and Control, 1965, 8(3): 338-353.
[5]Bezdek J C. Pattern recognition with fuzzy objective function algorithms[M]. New York: Plenum Press, 1981.
[6]张洪艳. 模糊C均值聚类算法及应用[J]. 科技资讯, 2014(5): 178-179.
Zhang Hongyan. Fuzzy C-means clustering algorithm and its application[J]. Science & Technology Information, 2014(5): 178-179. (in Chinese)
[7]蒲蓬勃, 王鸽, 刘太安. 基于粒子群优化的模糊C-均值聚类改进算法[J]. 计算机工程与设计, 2008, 29(16): 4277-4279.
Pu Pengbo, Wang Ge, Liu Taian. Research of improved fuzzy C-means algorithm based on particle swarm optimization[J]. Computer Engineering and Design, 2008, 29(16): 4277-4279. (in Chinese)
[8]Wang Gaihua, Li Dehua. A fast and effective fuzzy clustering algorithm for color image segmentation[J]. Journal of Beijing Institute of Technology, 2012, 21(4): 518-525.
[9]Li Yanling, Shen Yi. Fuzzy C-means clustering based on spatial neighborhood information for image segmentation[J]. Journal of Systems Engineering and Electronics, 2010, 21(2): 323-328.
[10]Lou Xiaojun, Li Junying, Liu Haitao. Improved fuzzy C-means clustering algorithm based on cluster density[J]. Journal of Computational Information Systems,2012, 8(2): 727-737.
[11]王海起, 朱锦, 王劲峰, 等. 基于空间加权距离的自适应Fuzzy C-means算法研究[J]. 测绘与空间地理信息, 2014, 37(2): 18-21.
Wang Haiqi, Zhu Jin, Wang Jingfeng, et al. An adaptive fuzzy C-means clustering algorithm based on spatial weighted distance[J]. Geomatics & Spatial Information Technology, 2014, 37(2): 18-21. (in Chinese)
[12]欧阳明, 陈钢, 俞帆, 等. 塔型模糊C-均值聚类图像分割方法[J].云南大学学报(自然科学版), 2000, 22(2): 105-108.
Ouyang Ming, Chen Gang,Yu Fan, et al. Tower type fuzzy C-means clustering image segmentation method[J]. Journal of Yunnan University(Natural Sciences Edition), 2000, 22(2): 105-108. (in Chinese)
[13]王军玲, 周建林, 包芳, 等. 基于临近像素空间距离的模糊C均值聚类算法[J]. 计算机工程与设计, 2013, 34(7): 2476-2482.
Wang Junling, Zhou Jianlin, Bao Fang, et al. Fuzzy C-means clustering algorithm based on space distance of adjacent pixels[J]. Computer Engineering and Design, 2013, 34(7): 2476-2482. (in Chinese)
[14]王建存. 基于均值漂移的模糊C均值聚类图像分割方法[J]. 电子技术与软件工程, 2013, 11(21): 111-112.
Wang Jiancun. Fuzzy C-means clustering image segmentation method based on mean shift[J]. Electronic Technology & Software Engineering, 2013, 11(21): 111-112. (in Chinese)
[15]Ambroise C, Govaert G. Convergence of an EM-type algorithm for spatial clustering[J]. Pattern Recognition Letters, 1998, 19(10): 919-927.
[16]杨勇, 郑崇勋, 林盘, 等. 基于改进的模糊C均值聚类图像分割新算法[J]. 光电子·激光, 2005, 16(9): 1118-1122.
Yang Yong, Zheng Chongxun, Lin Pan, et al. A new algorithm for image segmentation based on modified fuzzy C-means clustering[J]. Journal of Optoelectronic·laser, 2005, 16(9): 1118-1122. (in Chinese)
[17]Ayech M W, El Kalti K, El Ayeb B. Image segmentation based on adaptive fuzzy-C-means clustering[C]. Pattern Recognition (ICPR), 2010 20th International Conference, New York: IEEE, 2010: 2306-2309.
[18]Roweis S. EM algorithms for PCA and SPCA[J]. In Advances in Neural Information Processing Systems, 1998, 626-632.
Application of an Improved FCM Clustering Algorithm in Noise Image Segmentation
CUI Liang1, XU Yu-bing2, CHENG Yao-yu2
(1. School of Computer Science and Control Engineering, North University of China, Taiyuan 030051, China;2. School of Information and Communication Engineering, North University of China, Taiyuan 030051, China)
Abstract:For the problem of noise sensitiveness when applying conventional fuzzy c -means (FCM) clustering algorithm to noise image segmentation, an improved FCM algorithm was presented. The algorithm was realized by modifying the objective function of standard FCM algorithm, which took into account the influence of the neighboring pixels on the center pixels according to the neighborhood expectation maximization criteria. The experimental results indicate that the proposed algorithm has better de-noising effects than other derivatives of FCM algorithm and less time consuming. Besides, the proposed algorithm is very robust.
Key words:FCM clustering algorithm; neighborhood expectation maximization; image de-noising; image segmentation; robustness
中图分类号:TP391
文献标识码:A
doi:10.3969/j.issn.1673-3193.2016.01.015
作者简介:崔亮(1990-), 男, 硕士生, 主要从事图像处理, 检测信号的获取与处理研究.
*收稿日期:2015-03-13
文章编号:1673-3193(2016)01-0076-07