邱 磊,管一弘
(昆明理工大学 理学院,云南 昆明 650093)
图像分割就是将相似属性的像素进行分类的过程,是图像处理的第一步。由于彩色图像比灰度图像具有更多的信息,而且近年来随着计算机处理能力的提高,彩色图像处理得到了人们越来越多的关注。彩色图像处理方法一般是借助于灰度图像的处理方法,因为灰度图像的研究起步较早,算法相对成熟,而对彩色图像的研究则起步晚,仍有很多有待改进的地方,彩色图像的分割算法一直是近年研究的热点[1]。常见的彩色图像分割方法有阈值法、边缘检测法、聚类法、基于区域的方法和神经元网络法等。本文讨论基于HIS颜色空间的模糊聚类法。
最常见的颜色空间是 RGB空间,由于R、G、B三分量相关性非常高,分割时往往不能得到所需要的结果(如亮度不同但颜色相同的区域会被分成不同区域)。而HIS空间是RGB空间的非线性变换,去掉了三分量之间的相关性,而且此空间更符合人眼视觉特点,颜色信息H、S和亮度信息I被分开,如果只需要对色调进行分割时,可以单独使用色调H分量来进行分割。模糊C均值FCM(Fuzzy C-Mean)聚类是一种无监督的分割方法,它不需要训练样本。但传统的模糊聚类由于只考虑了灰度或颜色信息,没考虑空间信息,因此对噪声比较敏感。本文提出了一种结合空间信息和HSI色彩信息的多维模糊C均值聚类方法,此方法对含噪声的图像有较好的去噪效果。
对于彩色图像处理,选择合适的颜色空间是很重要的,常见的颜色模型有RGB、HIS、NTSC、YCbCr、Lab、CIE、YUV、YIQ和HSV等。其中RGB是最基本的颜色模型,其他的都是在它的基础上通过线性或非线性变换得来的。
根据人眼结构,所有颜色都可以看作红(R)、绿(G)和蓝(B)3个基本颜色的不同组合,RGB模型如图1所示。
如图1所示,连接黑色与白色的直线称为灰色线,它是等量三基色混合而成的。位于坐标轴上的三顶点分别为红、绿、蓝三基色,另外三顶点为黄、青及品红。
每一个分量都有0~255共256个等级,也就是8 bit,这样组合在一起共有 256×256×256(约 1 600万)种颜色,具有24 bit深度。RGB适合于颜色显示,但是由于三分量的高相关性,它不适合于彩色图像的分割与分析。
HIS颜色空间[2]是一种符合人眼感知的颜色空间。其中,H称为色调,代表基本颜色,反映颜色的波长;S称为饱和度,反映颜色的深浅程度,表明白光和色调混合的数量;I称为亮度。H和S包含了颜色信息,而I则与彩色信息无关。三分量可以分开处理,而且是独立的。HIS模型如图2所示。
色调H以角度来表示,其取值范围为0~360°。饱和度S是圆心到彩色点的半径长度。强度I用轴线方向上的高度来表示,它描述了灰度级。
HIS颜色空间是由RGB颜色空间通过非线性转换得来的,其转换公式是[3]:
模糊聚类由DUNN J C首先提出[4],并由BEZDEK J C进行推广[5]。FCM是一种比较有效的利用迭代最优化目标函数对数据聚类的方法。该方法的基本原理如下。
将数据集 X=(x1,x2, …,xn)T⊂Rn×p分为 C 类,n为元素个数,p为元素的维数。X中任意样本xk对i类的隶属度为 uik,分类结果用一个模糊隶属度矩阵 μ=[μij]Rc×n表示,并满足以下约束条件:
FCM算法可以表示为最小目标函数Jm的数学问题,即:
其中,m∈[1,∞]为加权系数,Jm是类内误差的加权平方和目标函数,dij是第j个样本到第i类的欧式距离,定义为:
聚类准则是求得适当的模糊划分矩阵μ=[μij]与模糊聚类中心vi,使得目标函数Jm达到极小值。根据拉格朗日乘数法可以得到两个优化迭代公式:
P(x,y)的 4 邻域可以表示为:(x+1,y)、(x-1,y)、(x,y+1)和(x,y-1),如图 3(a)所示。
P(x,y)的 8 邻域可以表示为:(x+1,y)、(x-1,y)、(x,y+1)、(x,y-1)、(x+1,y+1)、(x+1,y-1)、(x-1,y+1)和(x-1,y-1),如图3(b)所示。
本文采用8邻域均值。
传统的模糊C均值由于没有考虑像素的空间信息,因此对噪声比较敏感,只适合处理噪声少的图像。而图像的每个像素点与其邻域相关性很大,往往受其邻域约束,例如图像的马尔科夫性就是描述这种像素与邻域关系的典型代表。本文提出了一种结合邻域均值的在HIS空间聚类的新方法,此方法对抑制噪声有良好的效果。
算法的具体步骤如下:
(1)对图像进行颜色空间的转换,由RGB空间转换到HIS空间,并计算8邻域均值,将处理好的数据进行保存;
(2)按照式(2)初始化隶属度矩阵,设定聚类类别数C、模糊度m和迭代截止误差ε,设定初始迭代次数t=0;
(3)按照式(6)计算聚类中心vi;
(4)按照式(5)更新隶属度矩阵μij;
(5)如果‖vi(t+1)-vi(t)‖≤ε,系统达到一定稳定状态,则终止迭代,否则令t=t+1,转到步骤(3)继续进行;
(6)根据最终的隶属度矩阵来判决每个像素对类的归属。
本文程序采用VC++6.0编程,分割结果以伪彩色来显示,图片采用像素 152 pix×152 pix的 lena彩图,实验结果如图4所示。
图4 实验结果
通过对比两种方法的处理结果可以看出,本文提出的算法在抑制噪声方面明显优于传统方法。对于系数α,可以通过实验确定,不同值的对分割效果有较大的影响,噪声含量大的图片,α值可以相应取大一些。
本文提出的结合邻域空间信息的彩色图像分割方法对含有噪声的图片有较好的噪声抑制效果,为彩色图像分割的应用提供了新的、有效的思路。本文采用了H、S、I 3个分量加上它们的邻域均值共6个维度来进行聚类,由于H、S、I三量的独立性,可以根据需要只用其中某一个分量(如H分量)及它的邻域均值共两个量来进行聚类,这样可以节省处理时间。
[1]王月兰,曾迎生.信息融合技术在彩色图像分割方法中的应用[J].计算机学报,2000,23(17):763-767.
[2]章毓晋.图像处理与分析[M].北京:清华大学出版社,1999.
[3]冈萨雷斯.数字图像处理(第 2版)[M].阮秋琦,阮宇智,译.北京:电子工业出版社,2007.
[4]DUNN J C.A fuzzy relative of the ISODATA process and its use in detecting compact well-separated clusters[J].J Cybemet,1973,8(3):32-57.
[5]BEZDEK J C.Pattern recognition with fuzzy objective function algorithms[M].New York:Plenum Press,1981.