潘红艳
(浙江工商职业技术学院,浙江 宁波 315012)
图像是一种直观表达信息的媒介。随着互联网技术的发展和各种购物平台的兴起,网络数据库中的图像数据量呈指数级增长。面对繁杂的海量图像数据,高效的图像检索系统应运而生。利用该系统,人们可以快速地在海量图像数据中找到与自己需求相匹配的图像。
在图像检索中,最常用的是基于内容的图像检索。基于内容的图像检索是基于图像底层特征进行的检索。图像的底层特征有颜色特征、纹理特征和形状特征。由于图像本身的复杂性,很难用一种特征去描述千差万别的图像[2]。基于单一图像特征的检索系统,检索准确率普遍不高。越来越多的研究者尝试将多种图像特征采用一定的融合策略进行图像检索,以提高检索系统的查全率和查准率。
角点指的是图像中灰度值在水平和垂直方向变化都显著的一类点,是图像的局部特征。将角点进一步处理,可以形成图像的兴趣区域。常用的角点检测算法有Harris算法、Susan算法等[1]。本文采用Harris算法获取图像的兴趣区域。数学模型如下:
w(x,y)为窗口函数,(u,v)是窗口偏移量,(x, y)为窗口内所对应的图像像素的位置。
当水平方向和垂直方向变化不明显时,R(u,v)≈0,此时该点不是角点(兴趣点),否则为角点。角点获取后,根据所有角点的位置,确定一个能包含所有角点的最小矩形,即兴趣区域。角点检测结果如图1所示(白色点为检测出的角点)。
颜色特征是图像检索系统中最常用的一个特征,是一个全局特征,鲁棒性较好。常用的颜色特征有颜色直方图、颜色相关图、颜色矩等。
图1 角点检测
(1)灰度化图像。利用公式I(i,j)=(R+G+B)/3,求出像素点I(i,j)的灰度值,从而将彩色图像灰度化。
(2)对像素值进行聚类。图像的颜色特征比较复杂,如果直接获取图像的直方图,会导致形成的特征向量维度太大,影响计算速度。为了降低特征向量的维度,利用K-means算法对兴趣区域内的灰度像素值进行聚类。
(3)提取灰度累积直方图。颜色直方图表示的是图像灰度值的一种统计信息,具有旋转不变、缩放不变等稳定特征。为了避免颜色直方图的零值问题,本文采用灰度累积直方图获取图像的颜色特征。
L为图像的灰度级数,ni为图像中灰度级为i的像素个数。
纹理特征反映的是图像内容或颜色的某种变化,是一种统计特征,所以抗噪能力比较强。常用的纹理特征提取方法有灰度共生矩阵、傅里叶变换等。灰度共生矩阵由于实现简单、特征提取速度快等优点,成为纹理特征提取中经常被采用的方法。
本文采用灰度共生矩阵的方法提取图像的纹理特征,计算时灰度级取16级,在4个方向上(0°,45°,90°,135°)分别计算能量、熵、惯性矩、相关度4个纹理特征,然后分别计算4个方向上的均值μ和标准差σ,将其重新组合,得到8维纹理特征向量T=[μ1,μ2,μ3,μ4,σ1,σ2,σ3,σ4]。
为了减少不同特征分量对检索结果的影响,在进行相似度计算之前对特征分量进行归一化处理。假设图像数据库中有M幅图像,提取的特征向量有N维,形成M×N的特征矩阵VM×N。对特征矩阵中的每一个元素vi,j(表示第i个图像的第j个特征),利用0均值标准化方法进行归一化处理,如式3所示。
在提取兴趣区域中的颜色特征和纹理特征,并进行归一化处理后,形成颜色特征矩阵CM×N和纹理特征矩阵TM×N。
(1)将待检索图像的颜色特征向量与CM×N中的向量进行相似度计算(利用Euclidean距离),得到相似度为Ci(i=1……M)[3]。
(2)将待检索图像的纹理特征向量与TM×N中的向量进行相似度计算(利用Euclidean距离),得到相似度为Ti(i=1……M)。
(3)将Ci和Ti利用公式Sim(Q,Pi)=WcCi+WTTiα+β=1进行融合。
α和β的取值大小对结果有着至关重要的影响。图像是千差万别的,如果把α和β值固定,也就是对所有图像都应用相同的权值,是不符合实际情况的。本文在确定α和β值时,基于这样的假设:如果待检索图像与图像数据库中的每一幅图像之间的距离都相似,说明图像对这类特征不敏感,应赋予较低的权值。
为了验证本文提出的基于角点的动态加权融合检索技术[4]的有效性,自建小型图像数据库,数据库中包括自然风光、昆虫、鱼、建筑、鲜花、汽车6类图像,每类图像200幅,共有图像1 200幅。实验环境为Matlab2016b,Win7操作系统。
本文提出的图像检索方法查准率和查全率如图2—3所示。
图2 图像检索查准率
图3 图像检索查全率
多特征融合的图像检索方法得到越来越多研究者的重视。利用哪些图像特征进行融合,以及采用什么样的融合策略是提高检索系统效率的关键。本文提出的基于角点的动态加权融合方法,一定程度上解决了融合时固定权重带来的问题。在进行特征提取之前,先利用Harris算法检测角点,确定图像的主体兴趣区域,减少了图像中背景信息对检索结果的干扰,提高了检索系统的查全率和查准率。