郭晓娟,成继福
(1.河南科技学院 信息工程学院,河南 新乡 453003;2.河南科技学院 图书馆,河南 新乡 453003)
在某一给定的颜色空间中,如何用特定的方法描述图像的颜色特征是图像检索中一个重要的问题,而如何有效地描述图像的特征是CBIR中最为关键的环节。有效的特征应该意义直观,区分能力强,计算相对简单,具有平移、尺度不变性[1]。
颜色特征是在基于内容的图像检索中最早被使用也是被最广泛使用的视觉特征,主要原因在于颜色特征的定义比较明确,特征提取方法比较简单,而且颜色特征能较好地体现图像中所包含的物体或场景。此外,与其他视觉特征相比,颜色特征对图像本身的尺寸、方向、视角的依赖性较小,从而具有较高的鲁棒性。
目前常用的颜色特征提取方法,有颜色直方图、颜色矩以及模糊颜色直方图等。下面对所提到的几种颜色特征提取方法进行详细的介绍。
图像内容的一种直观的表示方式是统计图像的各种颜色的出现次数,进而得到图像的颜色直方图。它反映的是图像中颜色的组成,即各种颜色在图像中出现的频率。颜色直方图描述如下[2]:
设一幅彩色图像包含M个像素,图像的颜色空间被量化为N个不同的颜色,则颜色直方图H定义为
从上述定义可以看出,颜色直方图表现的是图像的一种全局特征,每一幅图像具有唯一的颜色直方图。并且颜色直方图对图像的旋转、平移以及缩放具有很好的不变性。
颜色直方图具有明显的优点,也存在一些缺点。优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。所以,在利用传统的颜色直方图进行检索时容易产生不一致的情况。
在此基础上,又形成了一些改进直方图的方法,如累积颜色直方图等。累积颜色直方图被证明是比颜色直方图更健壮的一种方法[3]。给定一幅图像I的颜色直方图H,对应的累积直方图数学表示如下:
其中 hi=∑Cj≤Cihj,这里 Cj,Ci分别代表颜色直方图第j个和i个索引的颜色值。实验证明,累积颜色直方图比颜色直方图具有更好的检索性能。
Stricker和Orengo基于概率论提出颜色矩(Color Moments)[4],数学基础是图像颜色分布可以由图像像素的各阶中心矩来描述。由于颜色信息集中在图像颜色的低阶矩中,因此只需要对每种颜色分量的一阶(Mean)、二阶(Variance)和三阶矩(Skewness)进行统计。所以,图像的颜色矩一共只需要九个分量,与其他的颜色特征相比较简洁。计算公式如下:
上式中,Pij是第j个像素的i个颜色分量,i∈{1,2,3},在 RGB 颜色空间中分别表示 R、G、B 颜色分量;N是图像中像素数量。其中,一阶矩定义了每个颜色分量的平均强度,二阶矩定义了每个颜色分量的方差,三阶矩定义了每个颜色分量的偏斜度。
在实际应用中,为避免低阶矩较弱的区分能力,颜色矩常和其他特征结合使用,并且起到在使用其他特征前缩小范围的作用。
近年来,将模糊直方图用于图像检索中的方法日益受到关注。韦娜等[5]将模糊C均值聚类方法引入基于颜色特征的图像检索,建立了模糊颜色直方图(Fuzzy Color Histogram,FCH)的方法。实验证明,该方法较传统直方图方法(Conversional Color Histogram,CCH)更具有鲁棒性和高效性。
给定一个包含n个颜色索引的颜色空间,图像I包含N个像素,则模糊颜色直方图的定义如下:
图像 I的模糊颜色直方图 F(I)=[f1,f2,…,fn],
Pj表示从图像I中任选一像素为像素j的概率,μij代表第j个像素对于第i个颜色索引的隶属度函数。
设在量化的颜色空间中有n'个颜色索引,使用模糊C均值算法将其分为n类,n 矩阵中每一个元素mij代表第j个颜色索引被重新分配到第i个颜色索引的颜色隶属度值。这样,以上定义的FCH就可以通过CCH得到。对于给定的 n'维 Hn'×1,对应的 n 维的 FCH,Fn×1可这样计算得到[6]: 这里,隶属度矩阵M只需要计算一次,就可以用来计算数据库中所有图像的模糊颜色直方图。 距离相似性度量方法就是利用相关距离计算函数,计算被检对象和目标对象的特征序列之间的结果,用该计算值来判别对象之间的相似性程度。一般情况下图像都是多维特征矢量表示的,通过计算特征矢量在特征空间的距离,可以得到两个图像的相似度。以下主要针对本次实验中所用到的欧式距离度量算法[7]进行分析。 设 x,y 为图像特征向量,分量分别为 xi,yi,(1≤i≤n)。 这是若干种距离公式的通式表示,当r=1时,为Manhattan距离(又称街区距离): 当r=2时,为欧几里德距离: 欧几里德距离是简单的距离公式,也是在CBIR中应用较广的距离公式。它可以单独用于颜色直方图和纹理特性的匹配。然而欧几里德公式完全不考虑向量各维之间的关系,而且各维必须是同等重要的,这就大大影响了其使用范围和有效性。为解决此问题又引入了加权欧几里德距离。 加权欧几里德距离: 其中wi是各分量的加权系数。加权欧几里德距离考虑不同维之间的不同重要性。由于CBIR系统通常抽取了大量的特征,不同特征的重要性都是不同的,因此加权欧几里德距离在CBIR系统中应用很广,可单独用于颜色直方图、纹理、形状或它们的联合向量。 本实验主要目的是比较不同的颜色特征提取方法,包括颜色直方图、累积直方图、颜色矩和模糊颜色直方图,所采用的相似性度量方法为欧氏距离。实验中,采用的数据为UIUC的数据库中的蝴蝶类,共包含536幅图像,分为5类。所采用的示例图为peacock类(包含134幅图像)中的pea001.jpg。四种方法的实验比较见表1。部分检索结果如图1-图4所示。 表1 不同颜色特征提取方法的检索结果的比较 图1 颜色直方图 图2 累积颜色直方图 图3 颜色矩 图4 模糊颜色直方图 在表1中,相关图像数是测试图库中与示例图像相关的图像数。检索结果总数是执行各种颜色检索方法得到的数目,其中检索的阈值默认为0.4,最大检索值为100,本次实验中设置的阈值为0.3,最大检索值为150。对颜色矩中的三个参数,均值、方差、斜度的权值分别设置为0.1,0.9,0.9;对于模糊颜色直方图,最初的聚类数默认为10,实验中所设置的聚类数目为5。用户可以自己设置这些参数。检索结果相关图像数,是在检索结果集中与示例图像相关的图像数,它同时影响着查准率和查全率;本实验中,随着所选取的颜色检索方法不同、参数不同而得到不同的结果数目;查准率和查全率是一组相互影响的评价标准,两者共同决定了检索效果。 从表1中的数据可以看出,在同样条件下,四种颜色特征提取方法的检索效果有所不同。综合查准率与查全率,颜色矩方法可以得到稍好的效果;在直方图方法中模糊颜色直方图的方法稍好于其他两种方法,累积颜色直方图方法次之。 当然,上述各个方法有各自不同的适用情况。上述的结果也会因示例图像与测试图库的变化而变化。颜色矩的分辨能力较弱,所以适用于图像间有较大差别的图像库;颜色直方图适用于含有较多颜色信息的图像库;累积颜色直方图可以有效地提高计算精度,对图像质量不是很好的图像有较好的检索效果;模糊颜色直方图对图像检索的鲁棒性与有效性有一定的提高。 本文在研究分析了一些颜色特征提取算法(如颜色直方图,累积颜色直方图,颜色矩和模糊颜色直方图等)的基础上,采用欧式距离相似度量算法,利用UIUC图像数据库中的peacock蝴蝶类分别验证,并比较了上述所提到的颜色特征提取算法的有效性,从比较的结果可以看出,采用模糊颜色直方图的检索方法相对其他几种特征提取方法可以得到较好的效果。 [1]J.Barros,et.al.Indexing multispectral images for contentbasedretrieval[J].SPIE,1994,2368:25-36. [2]龚声蓉.基于内容的图像检索方法研究[D].北京:北京航空航天大学,2001. [3]Pass G,Zabih R,Miller J.Comparing images using color coherence vectors[C]//Proc of ACM Intern Conf Multimedia.Boston:MA,1996. [4]M.A.Stricker,M.Orengo.Similarity of color images[C]//Proc of SPIE:Storage and retrieval for Images and Video databasesⅢ.SanJose:CA,1995,2420:381-392. [5]韦娜,耿国华,周明全.一种新的文物图像检索方法[J].计算机应用,2005.25(8):1789-1791. [6]J.Han,K.-K.Ma.Fuzzy Color Histogram and Its Use in Color Image Retrieval[J].IEEE Transactions on Image Processing,2002,11(8):944-952. [7]李瑜,李磊.基于内容的图像检索的方法研究[J].计算机科学,1999,26:8.2 相似性度量算法
3 基于颜色特征检索的实验结果与分析
4 结束语