王海峰
青岛科技大学,山东青岛 266000
计算机图像数码技术与互联网技术飞速发展的结合,使人们越来越多的接触到大量的图像信息。如何从浩瀚的图像数据库中快速、准确的找出自己所需要的图像,已经成为一个受到广泛关注的研究课题,并成为数字化图书馆等重大研究项目中的关键。目前,已经有不少的搜索引擎提供网络图像的检索服务,如Google、Ditto、Ixquick、Mamma、百度等。
从20世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR),利用文本描述的方式描述图像的特征,如绘画作品的作者、年代、流派、尺寸等。到90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检索技术(Content-based Image Retrieval,简称CBIR)。CBIR属于基于内容检索(Content-based Retrieval,简称CBR)的一种,CBR中还包括对动态视频、音频等其它形式多媒体信息的检索技术。
在检索原理上,无论是基于文本的图像检索还是基于内容的图像检索,主要包括3三方面:一方面对用户需求的分析和转化,形成可以检索索引数据库的提问;另一方面,收集和加工图像资源,提取特征,分析并进行标引,建立图像的索引数据库;还有一方面是根据相似度算法,计算用户提问与索引数据库中记录的相似度大小,提取出满足阈值的记录作为结果,按照相似度降序的方式输出。
为了进一步提高检索的准确性,许多系统结合相关反馈技术来收集用户对检索结果的反馈信息,这在CBIR中显得更为突出,因为CBIR实现的是逐步求精的图像检索过程,在同一次检索过程中需要不断地与用户进行交互。而本文中对相关反馈技术没有深入研究。
图像检索的目的就是为了解决图像数据库与用户需求的匹配和选择问题,网络环境下的图像检索无疑也是如此。在此,主要介绍网络环境中的图像资源的检索问题,区别于基于现成的特定图像库检索的软件和系统,网络图像检索问题将相对稳定的图像数据库拓展为动态变化的网络图像库。
基于内容的图像检索技术作为一种新的检索方法,目前已成为研究的热点。它和基于文本的图像检索不同,主要是根据图像的颜色、纹理、形状及它们的空间关系等内容特征作为图像的索引,通过加算计查询图像和目标图像的相似距离,按相似度进行检索。
在图像的形状、颜色、纹理等特征中,颜色特征是最显著、最可靠、最稳定的视觉特征,是人识别图像的主要感知特征。对于基于颜色特征的图像检索,科学工作者们提出了多种方案。譬如颜色直方图、主色调、颜色矩(Color Moments),颜色集(Color sets)、聚类、扫描线投影等检索算法,颜色直方图是目前较常使用的检索方法。
颜色直方图法具有运算速度快、存储空间要求低的特点,并且对图像的尺度及旋转变化不敏感,因此得到了广泛的关注。目前基于颜色特征的检索已经成为检索的一个重要手段,并提出了许多改进方法。总体来说,主要分为两类:全局颜色特征检索和局部颜色特征检索。按照全局颜色分布来索引图像可以通过计算每种颜色的像素个数并构造图像是一个很好的途径,局部颜色信息是指局部相似的颜色区域,它考虑了颜色的分类与一些初级的几何特征。本文所采取的是全局颜色特征检索。
本文主要对基于颜色分布的各种图像检索方法进行研究,在得到图像的颜色直方图的基础上,通过计算图像直方图之间的相似性来进行图像检索是该方法的基本思想,而图像之间相似性的度量方法有多种,本文主要应用适量距离法,另外提出其它4种方法同矢量距离法惊进行比较,从而得到寻找出一种更为精确的方法进行图像检索。在进行相似性测量之前建立图像库的颜色直方图。
基于颜色直方图的检索方法一般是:首先,要选择某个合适的颜色空间,然后,需要对颜色空间量化即颜色量化,从而得到颜色直方图,通过对颜色直方图的匹配来进行检索。颜色空间的选择是图像检索的准备工作。国际标准的MPEG-7定义了6种颜色空间:RGB、YCrCb、HSV、HMMD、RGB的任一线性变换和单色。在这些颜色空间中,HSV颜色空间更适合于图像检索的应用。HSV颜色空间的优点在于一方面去除了亮度成分在图像中与颜色信息的联系,另一方面,饱和度成分与人们获得颜色的方式密切相关,而且,它还具有线性伸缩性,可感知的颜色差与颜色分量的相应值的欧几里德距离成比例,因此,非常适合基于颜色的图像相似性比较。基于以上原因,本文采用HSV颜色空间,在此基础上得到图像的颜色直方图。
1)单幅图像颜色直方图的实现算法描述
(1)读取该图像的RGB数据;
(2)将图像的RGB转换成HSV;
(3)根据颜色分布矩阵得到该图像的大小;
(4)计算目标图片的直方图。
2)图像数据库中颜色直方图的实现算法描述
(1)根据图像库文件夹的目录读取文件;
(2)利用1.1中的算法计算文件夹中所有目标图片的直方图;
(3)将得到的直方图存入MAT文件中,使用前转载MAT文件。
矢量距离法:
1)计算出待检索图像的三维颜色直方图,然后采用插值法在每一个方向增加柄的数量;
2)对数据库中的每一幅图像I,装载其直方图并对其进行插值,使得图像矩阵间的柄数相同,便于进行图像矩阵间的四则运算;
3)计算出待检索图像与图像I直方图每一柄上的距离D;
4)在进行相似性度量之前定义两个阈值T1,T2;
5)计算出两图像直方图之间的欧几里德距离,保留其中大于T1距离值D1,和小于T2的距离值D2。相似性度量的计算式为:S=LENGTH(D1)*MEAN(D2)/LENGTH(D2);
6)根据上式计算两幅图像的各对应子块的相似度;
7)将N幅被比较的图像与用户输入的源图像的最后计算出来的相似度结果记录放入数组中;
8)将N个相似度从大到小排列;
9)根据相似度的排列显示检索到的图像。