王心一 刘智
【摘要】 针对单色并且无纹理的二值商标图像检索,本文采用基于势函数的高斯描绘子和边界方向直方图算法描述形状,通过采用加权融合两种不同算法的形状特征后,实现基于形状商标图像检索;最后本文选取查全率-查准率对比图作为本文检索的性能评判指标,实验数据表明,文中采用的算法能够精确有效实现商标图像检索。
【关键词】 高斯描绘子 商标图像 检索 边界直方图
一、引言
随着经济快速的发展,商标注册需求越来越大,检索成为一个突出问题,为防止仿冒注册商标事件,建立数据库管理系统十分必要。本文研究方向着重于小尺度范围内观测到的局部特性,采用高斯描绘子及边界方向直方图的算法提取出图像形状特征,通过加权融合的方法把两种算法提取出的形状特征作为商标图像底层特征,使用欧式距离公式计算出特征向量间的相似距离进行相似度的匹配,从而建立基于两种形状特征融合的商标图像检索方法。
二、商标形状特征提取
2.1 基于高斯描绘子的形状特征提取
高斯描绘子的特点有:适用的范围很广;对于图像旋转、平移、反射具有不变性;计算难度低,识别的精度很高;可以承受一定噪声干扰及边缘的变动等[2]。假设曲线 为检测物 的轮廓曲线。曲线 可以表示为:
■ (1)
曲线C的质心坐标为
■ (2)
方差σ2表示曲线上所有点的分散度
■
(3)
参数r表示曲线L上面所有点与质心间距离:
■ (4)
对于任意的λ∈(0,∞),落在圆心为(x,y)半径为rλ的圆内部分的物体轮廓曲线如下式所示:
■■ (5)
对于任意的θ∈[0,2π], λ∈(0,∞),设P=(x+ λrcosθ,y+λrsinθ)定义如下函数:
■
(6)
(xk,yk)∈L(λ),Δsk表示曲线相邻像素之间的距离。f(θ,λ)表示高斯势函数[4]。
θ∈[0,2π]分成N等分,高斯描绘子pe(λ)可表示为:
■ (7)
2.2 基于边界方向直方图的形状特征提取
对边界图像中各点计算出切线的方向,得到物体的边界轮廓上每个点的边界方向角,建立起直方图,统计出边界直方图每级个数最终表征物体的形状。
对边界切线方向进行划分,以5度为范围划分形成一个72级方向直方图H[i]。i表示划分后的每级数,范围是0~71;相对应H[i]的值代表在这一级数下点的个数。为保证尺度不变性,将边界直方图归一化:
H[i]=H[i]/S (8)
其中H[i]为边界方向直方图,S为图像的面积。
为避免图像旋转影响到边界直方图,对直方图进行平滑处理,使其具有一定旋转特性。
■ (9)
Dr是A[i,j]与B[i,j]的距离
■ (10)
三、图像特征的融合
商标图像的相似性度量表示的是图像特征之间的相似性,一般使用特征向量间的距离函数来度量[5]。对提取到的特征向量进行归一化计算,特征内部的归一化:
V的均值和方差分别为mV和σV, V为归一化处理结果:
V=■ (11)
计算示例图像与图像库中图像的相似度步骤如下:
(1)将输入商标图像库的图像进行预先处理,距离dGauss,dHistogram。
d(x,y)=■X■-Y■■■ (12)
Euclidean距离表示两个点之间真实的距离,与参考系旋转不变量相关,是一个常用的度量距离的方法。
(2)计算(1)中距离相对应的均值μGauss,μHistogram及标准差σGauss,σHistogram。
(3)按照上文高斯描绘子及边界直方图算法提取被检商标的特征向量,将每一组特征向量利用(13)式进行归一化处理。
(4)将(3)中计算得出的归一化特征向量与数据库中相应商标的特征向量分别计算出欧式距离dGauss(x,y),dHistogram(x,y)。
(5)将(4)中每组特征向量的相似距离进行距离归一化,公式如下
d'=■1+■ (13)
(6)将归一化后的距离进行加权融合,得到商标间最终相似度的距离
d=w1d'Gauss+w2d'Histogram (14)
其中w1+w2=1,d'Gauss,d'Histogram分别为采用二种特征提取得到的相似距离进行归一化后的结果。
根据多次实验情况下比较设定两个权值分别为w1= 0.65,w2=0.35。实验证明,在该权值下可得到较精确的结果。
四、实验结果
在二值商标图像库中进行实验,采用查全率-查准率为性能评判指标。查全率Pk指的是检索的结果中达标图像数目和图像数据库中全部符合要求的图像数目之比。查准率Rk表示检索的结果里达标图像数目和检索返回图像总数的比值。公式如下:
Pk=Nk/M (15)
Rk=Nk/Tk (16)
Nk表示达标图像数目, Tk表示检索返回图像总数,M 表示符合要求图像总数。
实验1比较了本文算法与单独采用不变距、傅里叶描绘子算法的检索性能,其结果如图1所示。
由仿真结果可见,本文的特征提取方法能够在图像库高效检索到与待检测图像相似图像。相同的检索查全率下,多特征融合算法比单一特征提取算法精度要高。由此可得研究更为精确的形状描述特征,采用多种特征融合的方式就能够提高检索的精度,或者加入纹理、颜色、关键字词分类检索等特征也可以达到提高精确度的目的。
五、结论
本文研究内容为基于形状的二值商标图像的检索,采用的图像特征检索方法使用了高斯描绘子及边界直方图算法,分别提取出商标的形状特征,再把两种特征进行加权融合,从而得到商标图像最终的检索特征。实验的结果表明该方法能够达到较高的查全率-查准率。