孙晋
(辽宁师范大学 计算机与信息技术学院,辽宁 大连 116029)
随着多媒体技术的发展及互联网的不断普及,数字图像作为一种内容丰富、表现力强的信息储存形式被大量应用,而海量的数字图像也因此产生。如何快速准确地从数据库中找到用户所需要的图像逐渐成为一个难题并被研究者重视。传统的基于文本的图像检索技术主要依靠人工标记,在大量消耗人力资源的同时,还存在用户对图像内容的理解不同,标记的信息不全面等问题。因此,基于内容的图像检索技术随之产生。该方法利用图像的视觉特征(如颜色、纹理等底层特征)进行检索[1],通过计算这些底层特征之间的相似度作为图像间的相似性,得到检索结果。相对于人工标记,这种方法所提取的特征更具有通用性,从而有效解决了基于文本的图像检索技术的不足。
在基于内容的图像检索技术中,颜色作为图像最直观的特征之一,多年以来被许多专家学者所重视,并提出了很多基于颜色特征的图像检索方法,如:SWAIN M等[2]提出的颜色直方图检索算法,依据整幅图像的颜色直方图进行检索,但存在着丢失颜色分布信息等问题;LIN C H等[3]提出了基于K均值聚类算法的检索方法;Tang Zhenjun等[4]利用了图像哈希函数提取颜色特征;Xia Shixiong等[5]提出描述在每一环形子集中相似的散布信息的差异,利用这些环形子集的差异建立差异颜色直方图;YAP P J[6]等利用Legendre矩提取图像的彩色信息并进行检索,但Legendre矩的图像描述能力不强,实际检索效果不够理想。
本文以圆谐-傅里叶矩理论为基础,提出一种基于对立颜色空间和圆谐-傅里叶矩的图像检索算法。首先将彩色图像由RGB颜色空间转换到对立颜色空间,然后在此基础上计算图像函数的圆谐-傅里叶矩,并将其作为图像颜色特征进行检索。
RGB颜色空间是图像处理中最常见的颜色空间,但RGB颜色空间在反映颜色色度的同时,也反映出了亮度。显然,对于彩色图像的检索,应当尽量关注颜色本身的色度信息,不希望光照强度等因素对颜色产生影响,所以,只需要考虑R、G、B三者之间的比例关系[6]:
则b=1-r-g。因此,描述图像的色彩信息仅需(r,g)即可满足。由“对立颜色理论”[7]可知:颜色空间是一种三维空间,由黑-白、红-绿和黄-蓝 3个双极坐标轴表示,与RGB颜色空间相比,对立颜色空间的色彩编码更均匀。对此,本文将RGB颜色空间转换为二维对立颜色空间:
其中,-1≤rg≤1,-1≤yb≤1。
圆谐-傅里叶矩[8]不仅对图像描述能力强,多项式简单,计算方便,而且具有良好的旋转、缩放等几何不变性。圆谐-傅里叶矩算法具体描述如下。在极坐标系(r,θ)中,定义函数系:
其中,*表示共轭,δnmkl是 Kronecker符号,c为常数。极坐标系中,图像 f(r,θ)按函数 Pnm(r,θ)做正交分解:
其中,
定义 Φnm为图像 f(r,θ)的圆谐-傅里叶矩。
对于一幅M×N的彩色图像I,在RGB颜色空间中表示为:
其中,i、j为每个像素点的坐标,i=0,1,2,…,M-1;j=0,1,2,…,N-1。将其转换到对立颜色空间,可表示为:
其中,i=0,1,2,…,M-1;j=0,1,2,…,N-1。 以极坐标表示:
代入式(6),即可求得图像I在对立颜色空间中的圆谐-傅里叶矩。由于低阶圆谐-傅里叶矩包含图像的主要信息[9],同时考虑到图像检索方法在实际应用中对时间复杂度的要求,本文算法选取了5个低阶矩作为图像的颜色特征进行检索。
假设图像库中的图像为P,被检索图像为Q,图像P颜色特征为CP=(,,,,),图像 Q的颜色特征为 CQ=(,,,,),则图像 P、Q间的相似度为:
为验证本文算法的有效性,进行仿真检索实验。实验过程中采用的软硬件环境为:Intel Xeon E5-1603 2.8 GHz处理器,4 GB内存,Windows 7 64位操作系统和 MATLAB 2011b。实验选用了Corel图像库,该图像数据库包括人物、建筑、公交车、鲜花、马、恐龙等各类图片 3 000张(包含30个种类,每个种类包含100幅相关图片)。图1给出了全局颜色直方图算法[2]、参考文献[6]方法以及本文算法的检索结果,其中第1幅图像为待检图像,分别计算待检图像与图像库中图像的相似度,并输出相似程度最高的前20幅图。
图1 仿真结果
表1 3种检索方法平均查全率对比
表2 3种检索方法平均查准率对比
为进一步验证算法的有效性,还计算了全局颜色直方图算法、参考文献[6]方法以及本文算法的查全率和查准率。表1和表2分别给出了3种方法的仿真实验结果。实验中,在Corel图像库中选取10类图像,每类随机抽取10幅作为示例图像,共构成100次查询,每次查询选取前20幅最相似的图像作为检索结果。对每类图像计算其查询结果的查准率平均值、查全率平均值。基于内容的图像检索是正处于发展过程中的一门全新、跨学科、综合性高的新技术,其研究与发展涉及众多学科分支。本文以圆谐-傅里叶矩理论为基础,在对立颜色空间中提取图像的颜色特征,通过比较图像之间的相似度进行检索。仿真实验表明,该方法能够准确和高效地查找出用户所需内容的彩色图像,在图像检索领域有较广阔的应用前景。下一步的工作将在此基础上结合图像的纹理、形状等信息,更进一步提高检索精度,得到更加理想的检索结果。
[1]REDDY P V N,SATYA PRASAD K.Color and texture features for content based image retrieval[J].International Journal of Computer Technology and Applications, 2011,2(4):1016-1020.
[2]SWAIN M J, BALLARD D H.Colorindexing[J].International Journal of Computer Vision,1991,7(1):11-32.
[3]LIN C H, HUANG D C, CHAN Y K.Fast color-spatial feature based image retrieval methods[J].Expert System with Applications:An International Journal, 2011,38 (9):11412-11420.
[4]Tang Zhenjun, Zhang Xianquan, Dai Xuan, et al.Robust image hash function using local color features[J].AEUInternationalJournalofElectronicsand Communications,2013,67:717-722.
[5]Xia Shixiong, Zhou Hongbin, Zhou Yong.Divergence color histogram forcontent-based image retrieval[C].Applied Mechanics and Materials, 2011, 50: 639-643.
[6]YAP P T,PARAMESRAN R.Content-based image retrieval using Legendre chromaticity distribution moments[J].IEEE Proceedings-Vision, Image and Signal Processing, 2006,153(1):17-24.
[7]BERENS J, FINLAYSON G D, HUBEL P M.A statistical image of color space[C].Proceedings of International Conference on Image Processing and Its Application,1999,1:348-352.
[8]Ren Haiping, Ping Ziliang, Bo Wurigen, et al.Multidistortion invariant image recognition with the radial harmonic Fourier moments[J].Journal of the Optical Society of America A-optics Image Science and Vision, 2003,20(4):63l-637.
[9]秦娟,李峰,向凌云,等.采用圆谐-傅里叶矩的图像区域复制粘贴篡改检测[J].中国图象图形学报,2013,18(8):919-923.