杨磊,张帆,张广文,张豫
(中国传媒大学信息工程学院,北京 100024)
一种改进的图像检索算法
杨磊,张帆,张广文,张豫
(中国传媒大学信息工程学院,北京 100024)
本文介绍了基于颜色特征的检索的全过程,首先对HSV颜色模型进行简单介绍,接下来本文选用HSV颜色空间来验证其他环节方法的选择;其次对颜色空间进行量化,量化标准可分两种:等间隔量化和非等间隔量化,再次是选取合适的特征提取方法,一般的颜色直方图只能表达图像的全局统计信息,无法表达颜色的空间位置,因此本文采用了局部累积直方图的方法;之后在相似性度量方法上的选择,本文将欧氏距离与加权距离进行了对比,进而得出更有效的检索结果。最后本文通过实验对比,选择了最优图像检索算法:HSV颜色空间-局部累加直方图-欧氏距离-非等间隔量化。
HSV颜色空间;累加直方图;欧式距离;等间隔量化;加权距离。
在图像的形状、颜色、纹理等特征中,颜色特征是最显著、最可靠、最稳定的视觉特征,是人识别图像的主要感知特征。颜色特征具有与生俱来的旋转、平移、尺度变化不变性,甚至各种变形都不敏感,表现出相当强的鲁棒性,而且颜色特征也是人类认知物体的一个主要特征。因此基于颜色特征的检索方法被广泛的用于基于内容的图像检索中。基于颜色特征的图像检索方法,最基本的思想是颜色空间直方图的匹配,对检索图像提取其颜色直方图,计算与存储在图像库中的图像的颜色直方图的距离,距离在一定范围内的图像即为被检索出来的图像。本文对基于颜色特征的图像检索技术的全过程进行了论述,包括每个过程的具体方法的选取,并对每个过程的算法进行相应的改进,并且将每个步骤的不同方法进行了组合,来对图像进行检索,验证各个步骤的不同方法对图像检索产生的影响,最后通过实验选取了最优的改进型图像检索算法。
HSV颜色空间与人眼视觉上的颜色距离相差较小,H定义为颜色的波长,称为色调;S定义为颜色的深浅程度,称为饱和度;V定义为掺入的白光亮,称为亮度。色调、亮度、饱和度这三个量化特征称为人眼识别一个颜色的三个基本属性。其中色调和饱和度统称为色度,它说明了彩色的波长成分的分布情况,同时又说明这种彩色的深浅浓淡。
在HSV模型中,参数H表示色彩信息,也就是所处的光谱颜色的位置,色调是由物体反射光线中占优势的波长来决定的,不同的波长产生不同的颜色感知,如红、橙、黄、绿、青、蓝、紫等色调是彩色的最重要的属性,是决定颜色本质的基本特性。颜色的饱和度S是指一个颜色的鲜明程度,它的范围从0到1,表示所选颜色的纯度和该颜色最大的纯度之间的比率。亮度是光波作用于感受器所发生的效应,其大小由物体反射系数决定,在HSV颜色模型中,V表示色彩的明亮程度,范围也是从0到1。HSV颜色模型如图1所示。
在确定了所选取的颜色空间之后,需要对图像进行特征提取,目前基于颜色特征的提取方式有很多,最常见的有以下几种:颜色直方图、累积颜色直方图、颜色矩、颜色聚合向量和颜色相关图。本文采取三种方法,并分别对一般颜色直方图、累加直方图和颜色矩三种特征提取方式进行了比较。以下分别详细介绍这三种颜色特征提取方法。
图1 HSV颜色模型
在CBIR系统中,最常用的、也是使用范围最广的一种颜色特征提取方式就是颜色直方图。它的定义如下:一幅图像中,不同的色彩的像素个数在整幅图像中所占的比例。具体实现过程是:以一幅数字图像为例,在确定颜色空间的基础上,统计每一种颜色在该图像中出现的像素点数,然后以颜色值作为横坐标,对应颜色出现的像素点数作为纵坐标,按此绘出的图形就称为该图像的颜色直方图。
颜色直方图的优点:相对于图像的以观察轴为轴心的旋转以及幅度不大的平移和缩放等集合变换不敏感,所以适合于描述那些难以进行自动分割的图像和不需要考虑物体空间位置信息的图像。另外颜色直方图对于图像质量的变化(如模糊)也不甚敏感。因此比较适用于检索图像的全局颜色相似性大的场合,即通过比较颜色直方图的差以来衡量两幅图像在颜色全局分布上的差异。
颜色直方图的缺点:如上所述,这种方法只能展示图像颜色的全局分布,不能表达颜色在空间上的布局,每一幅图像具有唯一的颜色直方图,但是不同的图像可能具有相同的颜色直方图。
颜色直方图的具体算法如下:
其中,K代表图像的特征取值,L是可取特征值的个数,nk是图像中具有特征值为K的像素个数,N是一幅图像的像素总数。
在对颜色特征提取的过程中,首先提取颜色直方图,然后对直方图进行量化,因为一般的颜色直方图没有办法表征颜色的空间分布信息,对检索可能造成误差,再者,在对直方图量化的过程中,量化间隔也会对检索产生很重要的影响,也会出现某些特征值像素个数为0的情况。例如以H分量为例,对于两个相近的颜色,量化后可能拉近它们之间的距离,也可能拉大它们之间的距离。另外,对于HSV颜色空间,人眼视觉对色调的敏感度较高,并且色调特征相似性分布并非均匀分布,红色与黄色的间隔为60°,红色与品红的间隔也为60°,但人眼判断后者比较接近,简单的等间隔量化不能正确反映图像之间的色调差别,在此基础上产生了累加颜色直方图,累加直方图有两种方法,即全局累加直方图法和局部累加直方图法。
全局累加直方图:
其中,K代表图像的特征取值,L是可取特征值的个数,nk是图像中具有特征值为K的像素个数,N是一幅图像的像素总数。
由公式(2)我们可以看出,在全局累加直方图中,相邻特征值颜色的频数是相关联的,跟一般直方图相比,它的存储量和计算量有所增加,但是这种方法弥补了一般直方图常见的零值分布以及一般直方图量化过细或者过粗使得检索效果下降的缺陷。
局部累加直方图是相对于HSV空间而言,将色度沿分步骤划分为若干个局部区间的方法。局部累加直方图就是把色度沿分步轴分成若干个局部区间而在各局部区间内分别应用累加直方图的方法。色彩分别受到色度、饱和度和亮度综合作用的影响,所以它的划分要考虑三种因素的影响。如果固定S的值,根据数学特性,得到一个色调—饱和度的二维分布图。然后对色调空间进行划分,先以60°为间隔单位,将H轴划分为6个互不重叠的局部区间,[60K,60(K+1)],K=0,1,...,5,计算出每个局部区间的累加直方图,但是在量化过程中会出现各局部区间分界处附近忽视颜色的相似连续性的情况,造成与量化间隔过大而产生的相同问题。因此我们可以再改变区间划分进行一次计算,[30+60K,(30+60(K+1))mod360],K=0,1,...,5,计算出这时每个局部区间的累加直方图,最后将这两次计算的累加直方图逐项相加取平均,作为最终的特征直方图用于检索,这样更能体现色度信号在分布轴上各抽样点间的相关性,从而提高直方图反映图像颜色特征的准确性。
颜色矩的方法最早是由Stricker和Orengo提出来的,它是一种非常简单而有效的颜色特征提取法。这种方法认为颜色信息集中在图像颜色的低阶矩中,只要对每种颜色分量的一阶、二阶和三阶矩进行统计。跟颜色直方图相比,该方法的优点就是不需要对颜色进行量化处理。颜色的三个低阶矩计算公式为:
其中Pij表示图像的第i个通道的第j个像素出现的概率,N为总的像素数目。因此,在RGB颜色空间,图像的颜色矩一共只需要9个分量就可以了(三个颜色通道,每个颜色通道上三个低阶矩),和其他颜色特征提取方式相比,这种方法较简单计算量低,但是分辨效果不是特别理想。
图像中包含的颜色很多,一个真实的颜色系统大约有224种颜色,但是如果在实际当中我们使用这种颜色统计方法,显然会直接影响到检索的效率和速度,而且人眼只能识别出有限的颜色,在检索系统当中比较人眼不能区分的颜色是没有意义的。因此在图像处理前,首先要对颜色空间进行量化。颜色的量化分为两种,等间距量化和非等间距量化。
(1)等间距量化
等间距量化就是对颜色空间进行均匀划分,例如RGB空间,将三个颜色通道分别等分为l,m,n份,得到l×m×n种颜色。根据不同颜色空间的特性,各通道对人眼视觉的重要程度不同,可以对不同的颜色通道给予不同的量化级数。例如在HSV颜色空间中,由于色调比亮度和饱和度对人的视觉感知更重要一些,可以给H通道更多的量化级数。
对颜色空间采取等间距量化,量化后的颜色空间,信息可能会集中于少数颜色中,还可能导致相同的颜色中包含完全不同的信息,这一缺点毫无疑问影响了颜色检索的准确性,因此,等间距量化的方法一般用于颜色直方图量化的初选。
(2)非等间距量化
非等间隔量化就是对颜色空间每一道通道的划分不采用等分的方法,而是人为决定划分的大小,这一方法首先需要对颜色空间模型进行大量的分析,在很大程度上取决于实际应用中对图像颜色感知特性的分析和理解程度。
对图像进行适当的量化可以减少存储空间和计算量,人眼的视觉特性决定了它无法分辨差别较小的颜色,所以可以对颜色进行一定的量化,将较大的颜色集合划分为小集合,每个集合内部的颜色都是相似的。因为HSV颜色空间对颜色的度量方式最为符合人眼对颜色的认知和判断,所以在这里我们就以HSV空间为例进行量化。
首先介绍等间隔量化,在等间隔量化中,本文采用的量化比例是12∶12∶12,即分别将三个颜色空间按照等量的距离划分。
其次是非等间隔量化,本文采用的方法是把HSV颜色空间的色度分量H沿分布轴分为8个空间,把饱和度S分为3个空间,亮度分量V分为3个空间,即划分比例为H∶S∶V=8∶3∶3。具体的划分方法是:
按照式(3.11)(3.12)(3.13)对HSV空间进行量化后,得到72个颜色区间。这样划分出来的每个区间内的颜色是相似的,所以我们可以对H、S、V三个特征向量取不同的权值组合成一维特征向量,在这三个矢量中,我们知道人眼对色调的敏感程度较大,其次是饱和度,最后才是亮度,同时根据H、S、V的量化级别和其频带宽度可以组合成如下所示的一维矢量L:
Qs和Qv分别是饱和度和亮度的量化级数,如果按照H∶S∶V=8∶3∶3的量化比例,则 L=9H+3S+V,这样增大了色调的权值,可以减轻图像亮度V和饱和度S对检索结果的影响,使得检索结果更满足人眼的视觉效果。
图像的匹配,是依据一定的关联规则将图像的信息用数学特征来表示,然后将图片库中的备选图像的特征向量与查询图像的特征向量进行对比,最后归为计算两幅图像某种特性的距离问题。计算距离的函数有很多种,需要结合具体情况选用,但是距离函数都符合以下几个条件:
其中,(x,y)分别是两个特征向量,f(x,y)表示这两个向量的距离。不同的距离度量方法适合于不同的特征提取模型。所以本文分别对适用于颜色特征的三种方法做了对比,分别是欧氏距离、加权距离和相交法。
(1)欧氏距离
xi1表示第一个点的第i维坐标,xi2表示第二个点的第i维坐标。n维欧式空间是一个点集,它的每个点可以表示为(x(1),x(2),...,x(n)),其中 x(i)(i=1,2,...,n)是实数,称为 x 的第 i个坐标,两个点之间的距离d(x,y)定义为公式(5.1)。若样本x,y位于同一类型区域里,欧氏距离是比较小的;若是位于不同的类型区域里,欧氏距离则比较大。最后计算出结果,然后设置一个阈值,从而来判定两幅图像是否匹配。
(2)加权欧氏距离
在上述公式基础上衍生出加权欧氏距离:
加权欧氏距离的应用十分广泛,不仅适用于颜色直方图,还适用于纹理、形状以及综合特征向量。
(3)直方图相交法
该距离公式只能用于直方图的匹配,它指的是两个直方图在每个bin中共有的像素个数。
本文首先将基于颜色特征的图像检索技术的全过程进行拆分,并对每个过程的具体算法进行比较,然后对各个进行相应的改进,再将每个步骤的不同方法进行组合对目标图像进行检索,验证各个步骤的不同方法对图像检索产生的影响,最后通过实验对比,选取了最优的改进型图像检索算法:HSV颜色空间-局部累加直方图-欧氏距离-非等间隔量化。
基于颜色特征的图像检索技术的全过程,如图2所示。
算法流程:
(1)确定颜色空间,根据人眼视觉上的颜色距离误差,选择HSV空间。
(2)非等间隔量化,把HSV颜色空间的色度分量H沿分布轴分为8个空间,把饱和度S分为3个空间,亮度分量V分为3个空间,即划分比例为H∶S∶V=8∶3∶3。参见公式(6),(7),(8)。
图2 颜色特征提取算法流程图
(3)选用局部累加直方图,根据公式
[30+60K,(30+60(K+1))mod360],K=0,1,...,5
计算出这时每个局部区间的累加直方图,最后将这两次计算的累加直方图逐项相加取平均,作为最终的特征直方图用于检索。
(4)相似度计算,选用欧式距离,根据公式5.1计算图片库中的备选图像与查询图像相同特性的距离。
(5)根据此距离判断图像的相似度进行排序,得到最终的匹配结果。
本文对整个算法流程各个环节的不同方法进行比较,并且将视觉特征的相似性转化为可以进行具体比较的数据,选用两个常用的性能指标:查全率和查准率。
为了全面验证系统的准确性和可行性,我们需要设置几组不同类型的图片库,本文采用的图片库中包含了4种类型的图片,分别是:花朵、天安门、树叶和风景。
(1)RGB和HSV两个不同的颜色空间的比较
方法一:RGB颜色空间,一般直方图,欧氏距离,等间隔量化
方法二:HSV颜色空间,一般直方图,欧式距离,等间隔量化
表1
表2 两种颜色空间查全率和查准率的比较
对比结果:HSV颜色空间更适合人眼视觉效果,检索结果比RGB颜色空间效果好。
(2)两种距离测算相似度的比较:欧氏距离、加权欧氏距离。
方法一:HSV颜色空间,一般直方图,欧氏距离,等间隔量化
方法二:HSV颜色空间,一般直方图,加权欧氏距离,等间隔量化
表3
表4
本次实验结果表明欧氏距离优于加权欧氏距离。
(3)两种颜色特征提取方式的比较:颜色直方图、累加直方图。
用一般颜色直方图检索的方式得出的结果,如图3所示。
用累加直方图的方式的出的检索结果,如图4所示。
图3 HSV颜色空间-一般直方图-欧氏距离-等间隔量化
图4 HSV颜色空间-局部累加直方图-欧氏距离-非等间隔量化
结果显示:局部累积颜色直方图的检索效果明显优于一般颜色直方图。
因此通过上述实验结果及分析,本文选取了基于颜色特征的图像检索算法的最优组合:HSV颜色空间-局部累加直方图-欧氏距离-非等间隔量化。
图像检索的方法已有上千种,每年还有许多新方法出现,但尚无通用的检索理论,目前提出的图像检索算法大都是针对具体问题的。本文所提出的基于HSV颜色空间-局部累加直方图-欧氏距离-等间隔量化的检索算法,是将图像检索全过程进行最优化组合后的新方法。此算法首先融入了颜色直方图的优点,相对于图像的以观察轴为轴心的旋转以及幅度不大的平移和缩放等集合变换不敏感,所以适合于描述那些难以进行自动分割的图像和不需要考虑物体空间位置信息的图像;其次,本文采用非等间隔量化,可以减轻图像亮度V和饱和度S对检索结果的影响,使得检索结果更满足人眼的视觉效果;最后,采用常用的欧氏距离进行颜色特征的相似度计算。经过大量的实验证明,本文采用的新型组合的算法在图像检索方面效果较好。但是在处理一些复杂度较高的图片时,其检索和匹配效果还有待提高,这也是未来算法改进的重点。
[1]Wang Q,Feng D,Chi Z.B-spline Over-complete WaveletBased FractalSignature Analysis for Texture Image Retrieval[J].2004 International Symposium on Intelligent Multimedia,Video and SpeechProcessing(ISIMP2004),HongKong,China,2004:230-242.
[2]M Stricker,M Orengo.Similarity of color images[J].SPIE Storage and Retrieval for Image and Video Databases III,1995:381-392.
[3]丁宏波.基于颜色和纹理的图像检索系统的研究与实现[C].2008.
[4]J R Bach,C Fuller,A Gupta.Virage Image Search Engine-An Open Frame Work for Image Management[J].In SPIE Conference on Storage and Retrieval[5]for Image and Video DataBase,San Jose.CA,1996:76-87.
[5]李有锋.基于颜色和纹理特征的图像检索相关算法研究[J].电子科技大学,2009.
[6]赵麟.基于颜色不变性的图像检索算法研究[J].北京交通大学.计算机科学与技术.2009.
[7]付丽.基于纹理特征的图像检索技术研究[J].长春理工大学,2008.
[8]王炳忠.组合颜色和纹理特征的图像检索方法研究与实现[J].计算机技术,2009.
[9]H Tamura,S Mori,T Yamawaki.Textual features corresponding to visual perception Systems[J],Man and Cybernetics,1978,8(6):460-473.
[10]Malki J,Boujemaa N,Nastar C,Winter A.Region queries without segmentation for image retrieval by content[A].Proc.Of Visual Information and Information Systems[C].London,UK:Springer-Verlag,1999:115-122.
[11]Fauqueur J,Boujemaa N.Image retrieval by regions:coarse segmentation and finecolor description[A]. Proc of International Conference on Visual Information System.
An Improved Image Retrieval Algorithm
YANG Lei,ZHANG Fan,ZHANG Guang-wen,ZHANG Yu
(Information Engineering School,Communication University of China,Beijing 100024,China)
This paper introduces the whole process of retrieval based on color characteristics.First of all,this article presents the HSV color model in brief,then HSV color model is selected to verify other links to the choice of methods.Next,the color space is quantized and the quantization standard can be divided into two kinds:equidistant quantification and non-equidistant quantification.Then it is choosing proper feature extraction method.General color histogram can only express the global statistical information of the image without the color space,so this article adopts the method of local cumulative histogram,and in the choice of similarity measure,this paper compares Euclidean distance and the weighted distance,and then concludes the more effective retrieval results.Finally,through the contrast,this paper chooses the optimal image retrieval algorithm:HSV color model-Local accumulate histogram-Euclidean distance-Equidistant quantification.
HSV color model;local accumulate histogram;euclidean distance;equidistant quantification;weighted distance.
TN391.41
A
1673-4793(2011)04-0059-08
2011-07-04
中国传媒大学211重点学科建设项目,项目号(21103050102)
杨磊(1960-),男(汉族),北京人,中国传媒大学信息工程学院教授.E-mail:yanglei@cuc.edu.cn
(责任编辑
:龙学锋)