基于颜色特征和不变矩的图像检索

2018-12-18 01:08和文辉李易吴志庆窦昊陆冠严
电脑知识与技术 2018年27期

和文辉 李易 吴志庆 窦昊 陆冠严

摘要:需要一种图像检索方法对图像进行快速、有效的检索,从而在图像库中找出与给定目标图像相似的图像集。提出一种方法,该方法基于RGB颜色模型的统计直方图和不变矩形状特征。颜色特征和形状特征是图像中最重要的两个图形特征。颜色特征计算简单,鲁棒性强。形状特征可以不受图形的平移、旋转和尺度变化的干扰。可以利用加权求和的方式结合两者特点从而得出图像间的相似度,通过大量实验得出效果最佳的权值比。

关键词:图像检索;RGB颜色空间;不变矩;CIBR技术

中图分类号:TP317.4 文献标识码:A 文章编号:1009-3044(2018)27-0173-03

Image Retrieval Based on Color Feature and Moment Invariants

HE Wen-hui, LI Yi, WU Zhi-qing, DOU Hao, LU Guan-yan

(College of Computer, North China University of Technology, Beijing 100144, China)

Abstract: An image retrieval method is needed which can perform a fast and efficient retrieval of an image. Thereby to find a series similar images in the image database similar with the target image. Proposed a method Based on the feature histogram of the RGB color model and the moment invariants shape feature. Color and shape features are the two most significant graphical features in an image. Color features are simple to calculate and robust. Shape features can be undisturbed by the translation, rotation, and scale variations of the graphics. The weighted summation can be used to combine the characteristics of the two to obtain the similarity between images. Through a large number of experiments, the best weight ratio is obtained.

Key words: image retrieval; RGB color space; moment invariants; CIBR technique

1 概述

如今信息的爆炸性增长和快速的生活节奏,使得人们更倾向于信息获得更快,冲击性更大的图像信息。用户对多媒体信息的需求量大大增加,一般的文字搜索引擎已经不能满足用户需求。同时为了使管理和检索个人的图像信息更加方便快捷,这使得研究一种快速高效的图像检索系统迫在眉睫。

视觉是人类的高级感知,所以,图像在人类感知中扮演着重要角色。图像处理的重要性来自两个主要的领域:改善图像信息以便人们解释;为储存传输和表示而对图像信息进行处理,以便机器自动解释。

基于内容的图像检索(CBIR)通过提取图像本身的内在客观性特征如颜色、紋理、形状、图像中元素的空间、区域空间关系等,并比较这些视觉特征间的相似性和一致性,从而自动搜索出符合用户要求的图像集合。该方法根据图像自身具有的各类型特点,只需少量的人工干预就可以得到预期结果,也因此成了目前的主流图像检索技术。与图像检索概念提出初期的基于文本的图像检索相比,该方法更加便利高效能满足用户需求。[1]

2 RGB颜色空间

颜色空间即色彩模型(又称为彩色空间或彩色系统),颜色空间通常由三独立的属性进行描述,三个独立属性构成三个变量,自然就形成了一个三维空间,这便是颜色空间。颜色空间的每一维代表一个颜色分量或一个颜色通道。[2]

2.1 颜色直方图概述

颜色直方图是重要的颜色特征,广泛用于图像检索领域。颜色直方图统计了整张图像中的各种颜色所占的比例,描述了该图像中关于颜色的数量特征。利用颜色直方图能有效地进行图像检索。

通过标记帧与帧之间显著的边缘和颜色的统计变化,来检测视频中场景的变化。在每个兴趣点设置一个有相近特征的直方图所构成“标签”,用以确定图像中的兴趣点。边缘、色彩、角度等直方图构成了可以被传递给目标识别分类器的一个通用特征类型。

总的来说,直方图就是对数据进行统计的一种方法,并将统计值汇总起来,存储到事先定义好的位置中。一般,我们习惯将其名称定义为bin,这是一个经常用到的概念。

RGB颜色指色彩中不能再分解的三种基本颜色,我们通常说的三原色。因为这种颜色空间对应于人眼的三种感光细胞,因此效果很好被广泛使用。

2.2 颜色直方图算法

在确定颜色空间的基础上,对一幅数字图像,统计每一种颜色出现的像素点数,然后把颜色值作为横坐标,颜色出现的像素点数作为纵坐标。以此绘出的图形就是该图像的颜色直方图。它所描述的是不同色彩在整幅图像中所占的比例,并不关心每种色彩所处的空间位置,即无法描述图像中的对象或物体。直方图计算简单,易于实现,使用归一化后对缩放具有不变性。[3]

3 基于形状的图像检索

3.1 形狀分析

3.1.1 形状特征

本系统是采用基于轮廓的方法,现在常用的基于轮廓的形状特征有周长,边缘夹角,傅立叶变换,曲率尺度空间等。

3.1.2 特征选取

当前对形状特征的描述可以分为基于轮廓形状与基于区域形状两类,这两者的区别在于它们是从整个图像轮廓中提取元素还是从图像的区域内提取,基于轮廓与基于区域这两种被更多采用的是前者,因为基于轮廓更能符合我们对物体的区分,并且基于轮廓形状用到的元素较少,在处理一些复杂的计算机图像时,可以减少计算。基于轮廓计算也会有一些缺点,轮廓特征对于噪声和形变比较敏感,并且有些形状应用中无法提取轮廓特征。

3.2 基于形状的特征算法

3.2.1 算法概述

基于形状的检索,由于许多图像比较复杂,需要考虑的因素比较多,因此基于形状的难点在于检索出与大小,形状以及扭曲伸缩无关的东西,由于不变矩具有旋转,平移和尺度等不变的特性,在图像处理中,几何不变矩可以作为一个重要的特征来进行图像检索,使用一维几何矩,可以对几何矩进行排序,建立索引,然后选出与目标图的几何矩最近图像,虽然几何矩不太能选出最像的,但是能快速排除不像的,以提高搜索效率。[4]

3.3 不变矩概述

几何不变矩是基于代数不变量的矩不变量,由于其具有平移,旋转,尺度等特性的不变特征,在图像检索过程中,可以作为一个重要的特征来对图像进行区分,矩在统计学中常用作随机量的分布情况,如果在力学中,常用来标注空间物体的质量分布,同样,如果把图像的灰度值看作是一个二维或者三维的密度分布函数,那么矩方法便可以很好地运用于图像检索中,并且做图像特征的提取。

4 基于颜色特征和不变矩的图像检索

4.1 单独使用基于RGB颜色空间的检索方法

4.1.1 直方图处理

直方图是多种空间域处理技术的基础。直方图操作可用于图像增强,其在软件中计算简单方便,而且有助于商用的软件实现。如今,直方图越来越流行,是一种非常实用的实时图像处理工具。

由于图像库中的图像在不增删的情况下是固定的。系统每一次运行时,如果都对图像库中所有的图像重新计算RGB颜色空间直方图分布的值,这无疑是对计算机算力的浪费也会造成系统运行效率的降低。因此,研究者为了提高系统的运行效率采取了牺牲空间换取时间的方法。提前将图像库中的所有图像的RGB颜色空间直方图数据计算出来并存储,待系统运行时将数据读出再与待比较图像的数据进行颜色相似度计算。经过比较,该方法的速度明显快于实时计算的速度。

然而,在计算机存储中,RGB三种颜色各占8位,共计3*8=24位。8位二进制可以表示的数字是0~255,即理论上RGB颜色空间可以表示256*256*256=16777216种颜色。但是仅从人眼所能够分辨的颜色的角度来看,如此之多的颜色显然太多以至于冗余了。而且,仅一张图像就会产生如此多的数据,无意是给计算机存储能力和读取能力徒增负担。因此,如果想要兼顾运行速度和运行效果,首先要解决图像库中的图像的直方图信息存储的问题。

经过大量实验对比得出,当bin设置为12时效果就已经十分理想,继续增大bin的值意义不大。首先过大的bin值会影响计算速度,其次,虽然在理论上是对颜色分类得更加具体,但是却不满足人眼的接受能力,人眼无法分辨过于具体的颜色所以设置过大的bin值意义并不大。

4.2 单独使用基于不变矩检索方法

矩是描述图像特征的算子,在图像识别和模式匹配中具有非常重要的作用,几何矩是最早提出并且容易实现的一种方法,所以说现在对它的研究比较透彻,几何矩对于简单的图像有描述能力,但是在区分度上却不如其它的几种矩的效果,与几种算子比起来,它相对于比较简单,很容易实现,一般只需一个数字就可以表达,所以我们常用来区分相对于简单而容易区分的图像,用来过滤显然看起来不像的文档或者图片。

物体的零阶矩就可以认为表示了图像的“质量”,[Moo=f(x,y )dxdy] ,在此式中,一阶矩(M01,M10)确定图像的质心(Xc,Yc),其中[Xc=M01/M00,Yc=M10/M00].如果将图像原点移至(Xc,Yc)处,就得到了图形位移不变的中心矩, [Upq =[(x-Xc)^p]*[(y-Yc)^q]f(x,y)dxdy]。Hu包含七个几何矩的不变量,这些不变量运用于图像的伸缩,平移,旋转不变。[5]

4.3 基于颜色特征和不变矩的图像检索

为了结合两种方法,研究者通过大量的实验,对比实验效果决定:将图像检索的重点放在颜色直方图中。首先利用基于RGB颜色空间的图像检索方法在图像库中检索,利用OpenCV中的 compareHist函数。相似度由高到低排列出一个相似图像集。再把该相似图像集作为图像库,利用基于不变矩的图像检索方法重新将图像集排列。由此得出的便是最后的新相似图像集。(其中,两个相似图像集中的图像元素并没有改变,变的只是它们的排列顺序)图像排序依据于图像的权值value,由第一次基于颜色的图像检索所产生的图像权值value1和第二次基于不变矩的图像检索产生的图像权值value2,value通过[value=α*value1+β*value2]进行赋值。实验中,将α设置为1,β设置为0.2,即权值比α/β=5时可以得到满意的效果。

5 总结

本文提出的图片检索系统采用C++,利用OpenCV库进行开发。从不同角度考虑图像特征,系统的实现基于颜色直方图和不变矩对图形进行相似度计算,可以解决一定的实际应用的问题。

本项目受北京市大学生科学研究与创业行动计划资助。

参考文献:

[1] 亢院兵.图像检索技术的历史、现状与研究进展[J].内江科技,2008(2):60,99.

[2] 窦建军,文俊,刘重庆.基于颜色直方图的图像检索技术[J].红外与激光工程,2005(1):84-88.

[3] 叶志伟,夏彬,周欣,张彦超.一种改进的基于颜色直方图的图像检索算法[J].吉首大学学报:自然科学版,2009,30(5):45-48.

[4] 史延新.基于形状特征的图像检索算法研究[J].电子科技. 2008(12);69-71.

[5] 薛鸿民,刘志镜,刘利,等.基于形状的图像检索的关键技术研究[J].计算机应用研究,2002(11);63-64.

[通联编辑:梁书]