基于Surf和改进颜色矩的服装图像检索算法研究

2021-09-25 10:05施怡澄刘洞波陈玉婷
关键词:欧氏检索服装

施怡澄,刘洞波,陈玉婷

(湖南工程学院 计算机与通信学院,湘潭411104)

0 引言

互联网时代数据繁杂,快速准确检索到期望的服装图像成为亟待解决的难题.基于现有图像匹配算法的主要衡量指标是匹配速度、匹配概率、匹配算法的鲁棒性和并行处理能力.许多学者对此做了大量的研究,Tanimoto[1]提出利用图像金字塔的分层匹配策略提高匹配速度;Chang和Cheng[2]利用图像的平移、旋转和尺度不变特征提出了点模式匹配的快速算法,提高了算法的运算速度;Jane[3]提出了基于小波的图像尺度由粗到精的图像匹配方案,算法的局限性在于要求图像间要有较高的相似度;Borgefors[4]提出基于分布式系统的分层倒角匹配算法,不足之处是需要考虑节点下限的问题,增加了算法的复杂性.薛利军等[5]提出了一种减少检索分支的快速匹配算法,孙远[6]提出了基于投影的一种新式快速模板匹配算法,陈凯迪与陈鹏[7]提出了一种基于分块颜色直方图的快速图像检索,翟铭晗和高玲[8]提出了一种基于颜色和纹理特征的图像检索算法,Herbert Bay等[9]提出了一种基于Sift的Surf特征提取方法.

针对,单一匹配算法会导致检索效率不高和精度较低等问题出现,本文提出一种基于Surf和改进颜色矩的服装图像检索算法,首先采用改进的颜色矩进行特征筛选,获得新的目标图像数据库,减小检索范围;再利用Surf算法进行图像匹配检索得到目标图像,从而提高了算法的准确性和检索效率.

1 系统总体方案原理

颜色特征是图像的一种底层特征,包含了图像的目标内容和应用场景内容.颜色特征与Surf特征在检索中可以互相弥补各自的缺点,同时使用两种特征可以在提取图像色彩信息的同时,可识别图像的旋转、平移和尺度变换特征.因此,本文将颜色特征与Surf特征结合,提出一种新的图像匹配算法CM(Color Moment)-Surf算法,以此实现服装图像的快速检索.首先,提取目标图像在HSV颜色空间的颜色矩特征,利用欧氏距离筛选出目标区域;然后,使用Surf特征匹配算法在已筛选出的区域提取特征点;最后,通过目标图像和源图像特征点欧氏距离的相似性度量匹配出源图像.

图1 CM-Surf算法流程图

2 CM-Surf算法分析

2.1 图像的非均匀量化

颜色空间的转换是分别对H、S、V三个分量进行非均匀量化,达到减小计算量的目的,即把色调、饱和度、亮度分别分为16份、4份、4份.再将三维H、S、V转化为一维分量,含参公式为:L=H*Qs*Qv+S*Qv+v,用公式表示为L=16H+4S+I.

由于HSV颜色空间的色调、饱和度、明度与人眼对颜色的主观认识相对比较符合,与其他颜色空间相比HSV空间能更好地反映人类对颜色的感知,所以本算法采用HSV颜色空间下的颜色矩作为颜色特征.

表1 RGB转HSV颜色空间参数设定

色调H(Hue)每隔60°表示一种基本颜色,转换颜色空间后的H值由R、G、B与其他常数计算得到,见式(1);饱和度S(Saturation)由R、G、B值和其他常数计算得到,见式(2);明度V(Value)由R、G、B值和其他常数计算得到,见式(3).

为色调、饱和度、亮度参数进行赋值,不同的赋值突出不同的特点,设置16、4、1则突出了人类视觉对色调敏感的特点,减小了图像亮度和饱和度对检索结果的影响[10].

2.2 颜色矩特征提取

颜色矩的一阶矩用图像的像素总数N和某点像素值P ij来计算,二阶矩在前者基础上加入了所有像素第i个颜色通道的颜色均值E ij,而三阶矩综合了前两者的内容,其中i为颜色通道数,s i具有的几何意义是:当s i=0时,图像的颜色分布是对称的,否则不对称[11].颜色矩是多阶矩,一、二、三阶均可以描述图像的颜色分布,则说明颜色分布一般集中在低阶矩,一、二、三阶中心矩分别表示图像或子区域图像的均色、标准差和三次根非对称性[10].

2.3 相似性度量计算

利用改进的颜色矩计算出数据库中所有图片的三阶颜色矩,对各阶颜色矩进行加权,然后与目标图像的颜色矩进行欧氏距离相似性度量,更高效准确地获得场景信息,全面呈现图像的颜色分布特征.

相似性度量方法有欧式距离、曼哈顿距离、马氏距离等,本文采用欧式距离对颜色矩进行相似性度量,欧氏距离可以克服变量之间的相关性干扰,且计算速度较快.若将源图像I和目标图像M的颜色通道数定义时,源图像I的颜色矩分别为E i、σi、S i,目标图像M的三阶颜色矩分别为D i、τi、R i.两图像间的欧氏距离相似度定义如式(7)所示:

其中ωi是权重系数向量.

通过对两图像的欧式距离进行计算,得出两个图像特征点的实际距离,从而得到两幅图像的相似度,以此来判断两幅图像是否包含同一物体或同一图像.

2.4 构建新数据库

传统的RGB颜色矩特征在提取后,对9个通道的颜色矩进行处理,本文采用HSV颜色空间的颜色矩特征,更能体现服装的颜色和亮度,从而达到提高检索准确度的目的,在进行两个图像欧氏距离的计算时,不再进行权重系数设定,以初始颜色矩的欧氏距离进行运算,通过对比筛选出相关图像,为Surf特征匹配做准备.

2.5 颜色矩匹配

通过颜色矩来对新数据库中相似性较高的图像进行Surf特征提取,特征点提取的前提是要在图像上检测到特征点,而特征点的检测则基于尺度空间理论,即先将此图像与高斯核函数做卷积运算,得到该图像的尺度空间,且尺度空间各不相同.构建尺度空间的预先步骤是构造Hessian矩阵,好的Hessian矩阵可以为特征提取建立更好的基础.Surf尺度空间是由X组Y层组成的,与Sift的区别在于后者的尺度空间内图像尺寸是逐组减半的,在同组中拥有同样的尺寸;而前者的不同组间图像的尺寸也是一致的,仅改变了高斯模糊模板的尺寸以及尺度的值.因Surf算法无须在不同组间进行尺寸缩小,因此该阶段的处理速度更快.

2.6 计算Hessian矩阵

在待求图像中,每一个像素点都可以求得一个Hessian矩阵,通过特定核间的卷积计算二阶偏导数,计算出Hessian矩阵的三个矩阵元素L x x、L yy、L xy从而得到Hessian矩阵的定义式如式(8)所示.

每个像素的Hessian矩阵行列式的近似值如式(9)所示:

Hessian矩阵判别式中的f( )x,y是原始图像的高斯卷积,Surf和Sift有一个显著不同在于,前者使用了盒式滤波器来代替了后者中的高斯滤波器,从而提高了运算速度,加权系数ω平衡了使用滤波器近似所带来的误差造成的影响.

构造完毕Hessian矩阵后,将经过Hessian矩阵处理过的每个像素点与其相邻2个空间的8邻域点包括该点在其他空间的位置共9个点,以及该点在该空间的8邻域点共26个点进行大小比较,如果该点是这26个点中的最大值或者最小值,则作为初步特征点进行保留.然后通过阈值筛选以及增加极值使检测得到的特征点减少,得到特征最明显的点.

2.7 确定主方向

与Sift不同的是,Surf采用统计特征点圆形领域内的harr小波特征.在该点的圆形邻域内,统计60°扇形内所有点的水平、垂直harr小波特征总和,然后扇形以一定间隔进行旋转并再次统计该区域内harr小波特征值,最后将值最大的扇形方向作为该特征点的主方向.确定主方向后,在特征点周围取一个4×4的矩形区域块,所取矩形区域块方向即特征点主方向.然后对该矩形区域块的每个子区域内的harr小波特征点进行统计,每个像素点相邻2个空间的8邻域点包括该点在其他空间的位置共9个点,以及该点在该空间的8邻域点共25个像素的水平、垂直方向的haar小波特征,该处水平、垂直方向均为相对主方向而言的方向.此时得到的harr小波特征为水平、垂直值,加上水平绝对值以及垂直绝对值之和.通过减少每个特征点的向量数从而提高了特征匹配的速度.

2.8 Surf匹配

通过计算两个特征点间的欧氏距离来判断是否匹配,距离越小则相似度越高.Surf还引进积分图的概念,通过矩形区域内像素和来加速计算达到加速匹配的效果,另外Surf还加入了Hessian矩阵迹的判断,可以判断排除一些欧氏距离为0但不是目标点的特征点.

3 实验结果及分析

采用DeepFashion图像数据集中的图片,数据集来自香港中文大学,包含服装实物图片、卖家秀、买家秀图片等对应的数据集,每个商品id对应的文件夹中包含一张卖家秀和几张买家秀.总共33881种商品,239557张图片.为验证改进算法的有效性,选取MATLAB2014b作为实验平台进行仿真实验.

3.1 仿真结果及结论

单独采用Surf算法提取源图像中所有的特征点,并与目标图像提取到的所有特征点进行匹配,现就部分实验匹配结果进行展示,图2(a)为待检测图像a的特征点提取结果,图2(b)为待检测图像b的特征点提取结果,图2(c)为待检测图像c的特征点提取结果.图3(a)、图3(b)、图3(c)分别为传统Surf算法对于图像图3(a)的图像匹配结果,因为没有先过滤数据库,所以得到了源图像、同款不同色服装图像以及无相关且特征点相近图像的三个检索结果,使得检索结果混乱且计算量增大,单独使用Surf算法而丢失了颜色信息,不但匹配到了不同颜色相同型号的服装,还对完全不一致的服装进行了匹配,降低了算法效率以及准确性.图4为CMSurf算法对图像图3(a)的图像检索结果,因为CM-Surf算法首先对数据库进行过滤,消除了同款不同色服装图像以及无相关且特征点相近图像对检索结果的影响,从而得到了精确的检索结果.

图2 特征点提取结果

图3 Surf算法图像匹配结果

图4 CM-Surf图像匹配结果

3.2 算法性能比较

两种算法的不同之处主要在于单独使用Surf算法无法通过颜色矩过滤掉一部分图像,算法效率较低,虽然在特征匹配阶段,两种算法对目标图像提取到的特征点是一样多,但是采用CM-Surf特征匹配算法,解决了丢失颜色信息而导致的相同形状而不同颜色的误匹配,再加上颜色矩既能表示丰富的颜色信息,又包含一定的空间分布信息,而且具备特征矢量维数少的特点[12].通过改进颜色矩匹配的方法过滤掉一部分图像,并在此基础上,利用Surf算法对剩下的目标图像进行寻找特征点以及匹配,匹配过程直接通过颜色矩过滤了图像颜色矩欧氏距离差距过大的图像,减少了在匹配阶段的工作,使检索结果明确,消除无用的检索结果带来的影响,减少计算量并缩短运算时间,图像检索时间比单一算法缩短了62.5%,效率提高了166%,

CM-Surf算法结合2种算法作出改进,在实际应用上可以得到更多较为准确的目标服装图像,同时也可以在匹配后得到唯一的目标服装图像,得到更佳的检索结果.

实验结果如表2及图5(a)、图5(b)所示.图5(a)为两种算法匹配过程所需时间对比图像,其中纵坐标表示匹配所需时间,横坐标表示不同算法,值越小代表匹配时间越短,算法效率更高.图5(b)为两种算法得到的匹配目标个数对比图像,纵坐标表示检索结果个数,横坐标表示不同算法,值越小代表检索结果越少,得到的结果越精确.

表2 部分实验结果对比

图5 实验结果对比

4 结论

针对服装图像检索效率偏低和准确率不高的问题,提出了一种基于Surf特征与改进颜色矩特征相结合的CM-Surf服装图像检索算法,算法仿真实验结果表明,算法结合了颜色特征和Surf特征的互补性关系,改善了Surf特征匹配法对颜色不敏感的问题,能够更准确地检索出需要的服装图像,证明了算法的准确性以及高效性.

猜你喜欢
欧氏检索服装
渐近欧氏流形上带有阻尼和位势项的波动方程的生命跨度估计
让人心碎的服装
具平坦欧氏边界的局部凸浸入超曲面
瑞典专利数据库的检索技巧
在IEEE 数据库中检索的一点经验
一种基于Python的音乐检索方法的研究
欧氏空间中超曲面的L2调和2—形式
现在可以入手的mina风高性价比服装
服装家纺个股表现
服装