汪彦 何建新
摘 要: 传统的基于聚类的图像分割方法大都存在聚类数目难以确定、过度分割等缺点。针对这些问题,提出一种新的彩色图像区域分割算法。首先将彩色图像划分为3×3的图像子块,然后在RGB色彩空间中抽取子块的颜色特征和位置特征共同组成子块的特征向量,最后运用自适应的FCM算法进行聚类,进而分割图像成区域。实验结果表明,这种分割方法具有比较理想的分割效果。
关键词: 自适应; FCM算法; 图像分割; 特征向量
中图分类号:TP317.4 文献标志码:A 文章编号:1006-8228(2015)08-47-02
Region-based color image segmentation algorithm with adaptive FCM clustering
Wang Yan, He Jianxin
(Department of Information Science and Engineering, Hunan City University, Yiyang, Hunan 413000, China)
Abstract: Traditional clustering-based image segmentation methods often have some disadvantages, such as difficult to determine the number of clusters, image over-segmentation etc. To resolve these problems, a new region-based color image segmentation algorithm is introduced in this paper, which divides an image to 3×3 sub-blocks firstly. Then, the color and position features of every sub-block are extracted to form feature vectors. Finally, an adaptive FCM (Fuzzy c-means Clustering Method) algorithm is used to cluster, thus the image is divided into regions. The experimental results show that this segmentation method has an ideal segmentation effect.
Key words: adaptive; FCM algorithm; image segmentation; feature vector
0 引言
图像分割的任务是将图像划分成互不相交的一些连通的区域,每一个区域都满足特定的区域一致性,不同的区域有某种差异性[1]。图像分割是计算机视觉领域颇具挑战性的问题,其应用的领域非常广阔。
本文提出了一种基于自适应FCM聚类的彩色图像分割算法。首先,在RGB空间抽取输入图像各像素的颜色和位置特征;然后,划分图像成图像块,抽取图像子块特征;再利用自适应FCM聚类,将图像块分组;结合图像块邻接关系,划分图像成区域。
1 基本的FCM算法
模糊C均值聚类(FCM)算法是基于C均值(C-means)和模糊集理论的经典的聚类算法[2-3]。
不妨设X={xi|i=1,2,3,…,n}是s维空间中的数据集,n是X中数据的个数,c是数据聚类的类别数,且1⑴
式⑴中的b是一个可以控制聚类结果模糊程度的常数,本文取值b=2。
FCM要求各数据样本对应各个聚类的隶属度函数满足式⑵和式⑶的约束。
⑵
⑶
基本FCM算法是在式⑵和式⑶的约束条件下,使得式⑴给出聚类损失函数的最小值,具体算法步骤如下:
⑴ 给出聚类簇数c、常数b和容许误差参数ε(ε>0);
⑵ 初始化各聚类中心,可得聚类中心矩阵M(0),并令k=0;
⑶ 根据当前的聚类中心按式⑷计算各个数据点的隶属度函数。
⑷
如果存在t,j使得,那么令,并且令;
⑷ 根据当前的隶属度函数按照式⑸计算新的各类中心,从而得到新的聚类中心矩阵M(k+1)。
⑸
⑸ 比较新的聚类中心矩阵M(k+1)与前一次得到的聚类中心矩阵M(k),如果式⑹成立,那么算法终止,否则令k=k+1,并转向第⑶步。
⑹
2 自适应的FCM算法
前述的基本FCM算法需要人为给出聚类的类别数c,这使得算法丧失了自适应性,从而限制了算法的适用场合,因此,不少研究人员纷纷展开深入研究,提出了不少改进方法。下面,简要介绍文献[4]提出的参数c自适应化确定方法。
设数据集X中所有数据样本的中心向量记为,而聚类的类别数c的自适应函数记为Y(c),则与Y(c)可分别由式⑺和式⑻计算。
⑺
⑻
那么,可自动确定聚类数c的自适应FCM聚类算法,步骤描述如下:
⑴ 给出常数b和容许误差参数ε(ε>0),令聚类数c=2,Y(1)=0;
⑵ 同基本FCM算法的第⑵步;
⑶ 同基本FCM算法的第⑶步;
⑷ 同基本FCM算法的第⑷步;
⑸ 同基本FCM算法的第⑸步;
⑹ 根据式⑺和式⑻计算当前类别数c的自适应函数值L(c);
⑺ 在2Y(c-2)且Y(c-1)>Y(c),则算法结束,否则,令c=c+1,转向第⑵步。
自适应的FCM算法结束时,可得到恰当的聚类列别数c、c个类心向量以及数据集X中n个数据样本分别对应c个类别的隶属度函数值。
3 基于自适应FCM聚类的彩色图像分割算法
本文提出的基于自适应FCM聚类的彩色图像分割算法具体步骤如下:
⑴ 输入原始图像;
⑵ 在RGB色彩空间中,分别求取输入图像的各像素点的红色、绿色和蓝色三种颜色分量特征,并进行归一化处理;
⑶ 计算图像所有像素点的行坐标与列坐标作为位置特征,并进行归一化处理;
⑷ 将三种颜色特征与两个位置特征结合起来,将图像的所有像素点表征为5维的特征向量;
⑸ 将图像划分成3×3大小的图像块,以各图像块内所有像素点的特征向量的均值作为各图像块的特征向量;
⑹ 对于原始彩色图像分块所得的所有像素块的特征向量构成的数据集,采用如前所述的自适应FCM算法进行聚类;
⑺ 对自适应FCM聚类的结果进行去模糊化操作,结合各像素在图像上的空间位置关系,将图像划分成区域。
下面简要介绍上述图像分割算法中的像素点特征的提取与归一化处理操作。设原始图像的分辨率为Xdim×Ydim,Pi是原始图像中的第i个像素点,该点的颜色值为(Ri,Gi,Bi),该点位置坐标为(Rowi,Coli),那么该像素点的颜色特征、位置特征分别按式⑼和式⑽进行归一化处理。
Ri=Ri/255
Gi=Gi/255 ⑼
Bi=Bi/255
⑽
经过上述归一化处理,像素点的颜色特征均取值在[0,1]区间,位置特征则取值(0,1]区间,这样使得各分量对于聚类算法中距离计算所产生的影响效果较为一致。
文献[5]提出位置特征在归一化后还应乘以权值,以适当降低位置特征对图像分割结果的影响。考虑到权值的像素点位置特征,可按式⑾计算。
⑾
其中,参数w代表位置特征的权重,文献[5]指出该参数的常用取值区间为(0,1]。我们经验反复实验发现,该参数取值为0.65时,对于我们研究的图像能够取得相对较好的分割效果。
考虑到FCM算法在对大规模数据进行聚类时效率不太高的特点,我们在设计基于FCM聚类的彩色图像分割算法时,注意了如下三点:
⑴ 对于像素点特征,采用尽可能简单的特征抽取方法,以降低耗费的时间;
⑵ 对于像素点,采用尽可能少而精当的图像特征,既使得特征抽取快捷,也降低了FCM聚类过程中涉及数据的特征维数,从而提高效率;
⑶ 采用图像分块的操作,直接减低FCM聚类涉及的数据样本数量,从而减少聚类过程所耗费的时间。
4 图像分割实验结果
我们进行了大量的图像区域分割实验,用以验证本文基于自适应FCM聚类的彩色图像分割算法的有效性。图像分割实验的对象是Corel图像库,该库包含多达1000幅彩图。图像分割程序用Matlab语言实现,部分实验结果如图1所示。