周美丽
(延安大学,陕西延安,716000)
随着Internet的发展,网络的应用和发展对社会各个领域产生了巨大影响,特别是WEB的兴起,网络上传输的信息正以指数级增长。作为一种全新的媒体和公共资源,越来越多的图像信息出现在Web站点上,但是它们都是无序、无索引的,在这样的环境下寻找感兴趣的资料是非常耗时的。因此,人们对信息检索工具和系统的依赖将会日益增加。
图像检索系统的关键技术在于图像特征的提取与表达是基于内容的图像检索技术的基础。颜色特征是在图像检索中应用最为广泛的视觉特征,也是人识别图像的主要感知特征。对于通用的静止图像检索,用于检索的特征主要有颜色(Color)、纹理(Texture)、形状(Shape)等,其中颜色、纹理、形状应用尤为普遍。本文设计系统属于颜色特征的提取范畴,其图像检索关键技术路径:颜色空间,特征空间,相似度量。
颜色特征在图像检索中是应用最为广泛的视觉特征,也是人识别图像的主要感知特征。主要原因在于,颜色往往和图像中所包含的物体和场景十分相关。在自然界中,同一类物体通常有相同或相近的颜色特征,不同类的物体则可能表现为不同的颜色特征,所以,颜色可以作为区分不同物种最为简单有效的一种手段。与其他的视觉特征相比,颜色特征对图像本身的尺寸,方向,视角的依赖性较小,具有较高的鲁棒性。因此,大多数图像检索系统都将颜色特征作为图像检索的主要手段。全局直方图是一种经常被采用的颜色特征,已在很多图像检索系统中得到应用。设C(x,y)为RGB空间一幅彩色图像,其颜色直方图的定义为(1)式:
其中,M、N为图像C(x,y)垂直和水平方向上的像素数目,并简称为图像的高和宽;而k为变换空间的颜色数。
图像特征的相似匹配方法中,对于基于文本的检索方法中采用的是文本的精确匹配,而基于内容的图像检索则是通过计算查询图像和图像库中候选图像之间在视觉特征上的相似度匹配进行。因此,定义一个合适的视觉特征相似度度量方法对检索的效果有很大的影响。视觉特征可以表示成向量的形式,常用的相似度方法也是向量空间模型,通过计算两个点的接近程度来衡量图像特征间的相似度。常见的方法有:直方图相交法、直方图欧氏距离、二值集hammimg距离等,本文用欧氏距离来计算二者的相似度,对于两个 N维直方图x,y,两者的欧氏距离可以表示为(2)式:
基于三种颜色分量的归一化累积直方图无需将彩色图像转换为灰度图像,而是直接对彩色图像进行处理,分别求出检索图像中三种颜色分量的归一化累积直方图,再计算检索图像与图像库中图像三种颜色分量归一化累积直方图的欧氏距离,然后对三者取平均。这样对一幅彩色图像的三种颜色有一个比较综合对比,不会单一对某种颜色分量特别敏感,从而可以相对全面的检索彩色图像。
图1 设计流程图
对检索效果的评价在于检索结果的正确与否,主要使用的是查准率和查全率两个指标。查准率的含义是在一次查询过程中,系统返回查询结果中相关图像的数目占所有返回数目的比例;查全率则指系统返回查询结果中相关图像的数目占图像库中所有相关图像数目的比例。用户在评价查询结果时,可以预先确定某些图像作为查询的相关图像,然后根据系统返回的结果来计算查准率和查全率。这两个指标的值越高说明检索方法的效果越好。
本文采用了微软商品图像库,其中存入了5000幅商品图像,取出500张作为检索图片,分成了4类,每类50张图片,检索图片如下:
图2 检索图库示例
通过本文设计系统检索结果如下图所示:
图3 望远镜检索结果
图4 椅子检索结果
图5 自行车车检索结果
图6 鞋检图索结果
由上述仿真实验可知,显示图像均为100幅,图(3)望远镜的图像为29幅,查全率为29/50,查准率为29/100;图(4)椅子的图像为28幅,查全率为28/50,查准率为28/100;图(5)自行车的图像为46幅,查全率为46/50,查准率为46/100;图(6)鞋子的图像为22幅,查全率为22/50,查准率为22/100。由此可见,查全率反映检索的全面性,而查准率则反映检索的准确性,因此可以用查全率和查准率来评价系统的有效性。通过对实验结果分析可得出基于三种颜色分量的归一化累积直方图的图像检索方法对颜色的检索效果比较理想。
[1]白雪生,徐光佑,Jin J S.基于内容的图象检索及其相关技术的究.机器人,1997(5).
[2]章毓晋.基于内容的视觉信息检索[M].北京:科学出版社,2003
[3]冯玉才,宋恩民.彩色地图图象的聚色算法研究.软件学报,1996,7(8).
[4]曹莉华,李国辉,胡晓峰.基于相关度和注意力聚焦的图象内容索引.国防科技大学学报,1997,(2).
[5]刘忠伟,章毓晋.十种基于颜色特征的图像检索算法的比较和分析[J].信号处理,