基于颜色自相关和颜色空间分布熵的图像检索方法

2018-05-30 09:16杨得国胡少一
关键词:直方图矢量检索

杨得国,胡少一,冷 齐

(西北师范大学 计算机科学与工程学院,甘肃 兰州 730070)

随着多媒体技术的发展,数字化图书馆,多媒体数据库的迅速增加,各种各样的图像数据库也日益强大,如何有效地组织、管理和检索大规模的图像数据库已成为当前国内外计算机领域研究的热点.自20世纪90年代以来,基于内容的图像检索(CBIR)得到了广泛的应用,至今已有的图像检索系统有QBC,MARS,ACCC,ACMI,BMCCM和FIDS等,这些检索系统主要是利用图像的视觉特征如颜色、纹理、形状轮廓及空间关系等来提取图像的内容特征,进而建立图像的特征矢量来进行图像检索.颜色特征是基于内容的图像检索中最广泛应用的视觉特征,颜色直方图是一种起先用来描述图像颜色特征的方法.该方法具有对视觉周围目标物体旋转的改变,距离的改变以及视觉遮挡具有一定的不变性.但是,颜色直方图仅能描述出图像中颜色的整体分布情况,而无法描述出图像颜色之间的空间分布情况[1].为了改善颜色直方图无法描述图像颜色之间的空间分布情况,Huang提出了颜色相关图(Color correlogram,CC)算法[2],该算法反映了不同颜色对之间的空间相关性.经试验表明,颜色相关图的检索效率远高于颜色直方图的检索效率.但是对于该算法来说,如果颜色的种类越多,则该算法的空间复杂度就越复杂,因此在一定程度上该算法的应用范围受到了限制.后来在此基础上提出了颜色自相关图(Color autocorrelogram),它考虑的只是相同颜色的像素之间的空间关系,是颜色相关图的一种简化,它降低了空间复杂度,但检索效率也有所降低.针对上述利用颜色直方图检索图像所存在的缺陷,本文提出了基于颜色直方图改进的图像检索算法,文中采用RGB颜色空间模型,根据64中心色量化规则对颜色进行量化,最终将所有的颜色种类归为64种,然后利用颜色相关图表示出64种颜色的空间关系.为了得到更加精准的检索结果,本文还与空间分布熵结合,最终得出一种快速图像检索算法,该算法弥补了颜色相关图算法的不足,同时也减少了特征矢量维数,提高了检索效率.

1 颜色空间的量化

1.1 RGB空间下的颜色量化

8中心量化方法如下:将RGB颜色空间立方体的8个顶点作为8种颜色的中心色,然后根据与中心色的相似程度进行聚簇,最终得到K(K=8)个颜色空间的划分[3].2种颜色的相似度可用彩色距离来表示,在RGB颜色空间中(R1,G1,B1)和(R2,G2,B2)的彩色距离ΔC可表示为

ΔC=(R1-R2)2+(G1-G2)2+(B1-B2)2.

(1)

为了满足视觉一致性,可以给各颜色分量的增量加上一定的权值,即

ΔC=3(R1-R2)2+4(G1-G2)2+2(B1-B2)2.

(2)

假设给定图像I的任意一像素点Pij,其颜色为(rij,gij,bij),用ΔCk表示该像素点颜色同第k类颜色的中心色距离,根据以上公式可得pij的颜色归类规则为

采用8中心色量化虽然计算量小操作简单,但是有可能很难区分视觉上不相似的颜色,将不相似的颜色划分到一类中,因此为了增强颜色的表示精度,减少结果集中不相似图像的数量,可以对RGB颜色空间进行更加细致的划分,从而提高最终图像检索的精度.我们可以对RGB颜色空间的每一个颜色通道采用0,85,170,255这个4个数值进行组合,得到64种中心色.采用与八中心色相同的划分方法将RGB颜色空间划分为64个类,即获得64中心色颜色空间量化方法.

1.2 颜色特征的表示

由于颜色直方图直观的描述了图像颜色的统计分布特征,并具有平移、尺度和旋转不变性,因此被广泛应用在图像检索中.

颜色直方图定义为:假设图像I表示一幅像素为M×N的图像,将图像I可以根据颜色空间划分为K类,每个类构成图像I的一划分,记为hk.颜色直方图可表示为

H=(|h0|,|h1|,…,|hi|,|hk-1|),

(3)

其中每个|hi|成为一个色柄,用H(k)表示,即

文中采用直方图相交法来进行相似度量:

(4)

其中H(k)和H′(k)分别为2幅查询图像的颜色特征直方图中的第i个色柄值.

2 颜色相关图

假设图像I表示一副像素为M×N的图像,I中包含x种颜色,将x种颜色按上述64中心色颜色空间量化方法获得64类颜色,即C={c1,c2,…,c64}.设像素p1=(x1,y1)⊂I∈C,p2=(x2,y2)∈I⊂C,则像素间的空间距离为|p1-p2|=max{|x1-x2|,|y1-y2|},将距离结果集用[n]表示.

对于i∈{1,2,…,64},图像I的颜色直方图可定义为

(5)

对于任意像素p∈ci,则|hi|(I)/(M×N)表示该像素颜色值为ci的概率.

图像I的颜色相关图可表示为

(6)

参考共生矩阵定义[2]可得

(7)

它表示2个固定颜色p1,p2在相距K时同时出现的总次数,颜色相关图可由以下公式得出:

(8)

其中,i,j∈{1,2,…,64};分母为离颜色值为ci的像素距离为k的像素总数.提取颜色相关图中主对角线方向的数据作为颜色自相关图的特征矢量,即

因此当像素距离为k时可得到一条64×1的1维特征向量.由于最终要用到两个特征矢量,因此需要对其进行归一化处理,将其归一化到[0,1]的范围内,方便使用此特征矢量.

3 颜色空间分布熵

对于图像I,像素间的距离满足0≤|p1-p2|≤max{|M-N|}-1,图像I被划分为不相同的矩形区间,为了保持图像的尺度不变性,需要进行归一化处理,即

(9)

利用熵的特性,设计采用颜色空间分布熵来描述颜色的空间分布特性.颜色ci的空间分布熵表示为

(10)

其中,pij∈ci,i∈{1,2,…,64}.该颜色空间分布熵反映了某个中心色在图像空间的平均分散程度,颜色空间分布熵越大表明该中心色分布越分散,反之则越集中[5].

(11)

由上式可以度量颜色i类的空间分布上的相似性,因此我们可以得到一条64×1的1维颜色空间分布熵特征向量.由于(11)式的结果是一个比例系数,因此该方法不需要进行归一化处理.

4 相似性度量

对于2幅图像I和I′之间的相似度可以采用特征矢量之间的比例系数进行度量.文中采用比例系数法对特征矢量进行相似性度量,令F1为自相关特征矢量,F2表示颜色空间分布熵特征矢量,在像素距离为k下2幅图像的相似性可表示为

(12)

当D(I,I′)的值越趋近于1时2幅图像越相似.

5 实验分析

本实验使用Corel图库中的像素为128×85及128×96的9 908幅图片,以此来作为实验素材.图库中的图片包括动物,植物、人类、风景、汽车和建筑等.

本实验从图库中选取200张图片进行实验,包括5种类型图片.将每张图片按照上文给出的RGB颜色量化规则将其分成64类颜色,采用2,4,6,8,10这五个距离作为算法中的像素空间距离,每一像素空间距离下提取64×1维颜色自相关特征矢量和64×1维颜色空间分布熵特征矢量,分别对其进行归一化处理后得到2幅图像的相似度D的值,D值越小两幅图像越相似.

5.1 查全率和查准率对比

为了更好地突出本文算法,文中还用了传统的RGB空间直方图算法,HSV空间直方图算法,RGB八相关颜色直方图方法以及HSV八相关颜色直方图方法.为了实验方便进行,从图库中选定了与之相似的图像进行查全率和查准率分析[6],结果如表1-2所示.

表1 5种算法的查全率对比

表2 5种算法的查准率对比

从表1和2可以看出,不论是查全率还是查准率,在大多数情况下,不管是在RGB空间下还是在HSV空间下,采用颜色直方图方法比其他方法的检索效果都要好.通过对比RGB空间和HSV空间下颜色直方图方法,可以得出HSV空间下的方法不如RGB空间下的方法效果好,由此可以发现RGB空间量化把整个空间都均匀的分割,使得颜色划分更加精确,更加容易产生相关颜色的模式,最终得到的颜色相关直方图可靠性更强,所以检索效果越佳.

5.2 查全率-查准率

为了得到较准确地实验结果,对5种算法的查全率和查准率进行了分析,如图1所示.

图1 查全率-查准率趋势图

从图1中可以看出,由于使用的RGB空间量化方法将像素颜色分为64类,使得检索更精确,同时颜色自相关和颜色空间分布熵方法弥补了像素颜色在空间关系及分布情况上的不足,故本文算法较其他算法相比检索效果更好.

6 结束语

文中提出了基于颜色自相关图和颜色空间分布熵的算法.降低了空间复杂度,算法更简便.颜色空间分布熵弥补了颜色相关图的颜色在空间分散情况的不足,基于颜色自相关图和颜色空间分布熵的图像检索算法,不仅可以反映图像中一种颜色像素所占的比例,而且还能反映各个颜色像素之间的空间关系和颜色像素在图像中的分散情况,相对于其他图像检索算法来说得到了较大的改善.

:

[1] 黄仁,胡敏.综合颜色空间特征和纹理特征的图像检索[J].计算机科学,2014,41(6A):37.

[2] 陈刚,岳晓冬,陈宇飞.基于稀疏低秩描述的图像检索方法[J].计算机科学,2014,40(2):55.

[3] 沈新宇,王小龙,杜建洪.基于颜色自相关图和互信息的图像检索算法[J].计算机工程,2014,40(2):261.

[4] 史婷婷,吴明珠,陈勇.基于二进制颜色相关矩阵的图像检索方法[J].计算机工程,2011,37(1):208.

[5] 吴会宁,胡学龙,陆慧敏,等.基于信息熵和分块颜色矩的图像检索[J].扬州大学学报(自然科学版),2014,17(3):26.

[6] 姚玉阁,于艳东.基于兴趣点特征的图像检索方法[J].吉林大学学报(理学版),2016,54(2):76.

猜你喜欢
直方图矢量检索
符合差分隐私的流数据统计直方图发布
一种适用于高轨空间的GNSS矢量跟踪方案设计
矢量三角形法的应用
基于FPGA的直方图均衡图像增强算法设计及实现
用直方图控制画面影调
中考频数分布直方图题型展示
基于矢量最优估计的稳健测向方法
专利检索中“语义”的表现
三角形法则在动态平衡问题中的应用
国际标准检索