基于多特征的服装图像检索的智能购物系统研究

2019-08-22 11:10杨华
微型电脑应用 2019年8期
关键词:袖子检索长度

杨华

(陕西工业职业技术学院 化工与纺织服装学院, 咸阳 712000)

0 引言

随着智能手机和购物Android应用程序的出现,网上购物已经有了很大的发展。当前利用互联网购物可以让人们可以享受一个舒适的购物感觉,避免了路上、停车、实体店选取物品所造成的时间浪费,因此互联网彻底改变了购物行为,网上购物已经变成了当前主流的购物模式。然而在实际购物过程中的一个主要问题就是目标产品的选取,这就存在大量产品的选取过程。尤其在购买女士服装时问题会变得更为明显,如购买连衣裙有多种颜色、图案以及不同的长度,这使得个人主观匹配和最终决定购买成为一项具有挑战性的任务[1];面对该类问题本文提出了一种方法,即用户将图像作为查询而不是一组描述着装的关键词,然后通过识别衣服的长度和袖子的类型来确定衣服的样式——无袖、半袖或全袖,并且将颜色和纹理作为其它选取条件。

1 系统框架设计

根据对购物引导的需求,按照多特征设计的要求需设计智能购物系统总体框架,用户可以使用该框架生成感兴趣的服装图像,在该框架的帮助下,用户根据自己的特征在数据库中找到相似的服装,系统所提出的框架,如图1所示。

图1 服装检索系统框架

包含预处理、特征提取和分类三个阶段。在本节中,将详细描述框架中的各个阶段,为寻找匹配的服装提供了一个自操作过程,并在女装数据集上给出了很好的检索和识别结果。

下面对各阶段进行详细介绍:

(1) 预处理阶段

在这一步中,首先通过使用Viola Jones算法删除头部部分来计算感兴趣的区域,每个识别出的人脸的比例和相对位置被用来预测脸周围的包围盒。

(2) 特征分类阶段

在提出的方法中,根据衣服的长度和袖子对其进行分类。使用水平投影直方图[2]来找出裙子的长度,这里的用法是找到衣服的顶部和底部。在图像二值化之后,得到了服装的上下界。上界和下界之间的空隙被称为上半身连衣裙的长度,下身衣服的长度可以计算为从下界到图像末端的长度,为了将裙子的长度归为长、短、中,通过设置对裙子进行分类的阈值来计算上半身和下半身的比例。

和衣服长度一样,袖子也分为3种类型——无袖、整袖和半袖。初步的手工标注是用来了解衣服的袖子。为了自动计算套筒长度,本文引入了一种算法,探讨了在皮肤颜色像素的帮助下,袖长可以发现的想法,即可以通过肤色和服装颜色的比例很容易地找出袖子的长度,如图2所示。

图2 袖子分类示意图

(3) 特征提取阶段

对于匹配服装的检测,与颜色和图案设计相关的信息是非常重要的。因此,得到这两个属性,然后使用相似度测量技术来检索匹配的服装,正如CIELAB[3]所引导的那样,CIELAB在定义图像中的颜色信息方面具有精妙的能力,因此有利于评估不同图像之间的区别。为了更好地匹配,本文将图像的中心部分作为感兴趣的区域。

模式:使用Gabor filter[4]提取模式的特征,Gabor滤波器通常是高斯函数乘以余弦函数发现在一定频率和角度下的边,为了提高效率,首先计算和存储过滤器系列,表示如式(1)。

(1)

其中,x′和y′分别表示如下:

x′=xcosθ+ysinθ

y′=ycosθ+ysinθ

提取模式特征的特征向量的算法如下所示。为了比较图像,选取两个描述符向量的差值,并提供了一个距离值,数据库图像和目标图像之间的相似度取决于距离,如果距离大,相似度就小,如果距离小,相似度就大。

特征组合:一件有特定设计/图案的衣服可以有不同的颜色,这就是为什么在女性服饰搭配中图案起着至关重要的作用。所以本文给图案特征更多的权重而不是颜色,采用如下权重实现特征提取[5-6]。

Wg=1.7

Wc=1

(2)

2 实验结果

(1)数据集

为了评估使用显示社会中服装图像数据的1 000种方法的成功性,从各种在线购物网站——flipkart、jabong、snapdeal、voonik、shopper stop、myntra——准备了一组XX服饰的图片。从集合中随机选择10%的图像作为查询,其余的图像将在以后任意检索。因为所有的服装图片都有清晰的背景,所以不需要图像处理技术来提炼图像,每个图片的中心部分,也就是我们感兴趣的区域(ROI),在去掉头部和手的部分后会被裁剪出来,从而构建特征数据集合。

(2) 性能评价

通过系统的精确性和可回忆性有助于找出潜在的检索,Recall计算系统的性能以检索所有相关的模型,同时precision计算系统的性能以仅检索相关的模型,他们的定义分别如式(3)

(3)

其中A表示检索到的相关图像的数量,B表示检索到的不相关图像的数量,C表示未检索到的相关图像的数量。

使用最佳F-score标准确定选取的准确性:

在衣服的选取过程中,P和R是像素相对于手工分割的地面真相的精度和召回率。通过式(3)可获取F值为0.879,这在我们的F-score方法中显示出了合理的准确性,它在1处达到了最佳值,在0点处最差。此外,通过对图3的可视化检查,可以肯定检索结果是定性的。我们可以观察到,该系统对相似颜色、图案、服装长度和袖子长度的相关服装结果是可靠的,为采用特征匹配对三款不同风格的衣服样本进行检索,正确的和错误的获取的衣服属性分别用蓝色的星星和红色的星星来标记,如图3所示。

利用Matlab 13a实现了该方法。每个查询从数据库中返回前10个图像,然后使用式(1)计算精度值,使用式(3)计算平均精度。这一工作结果的平均精度为83%,这是指比其他方法更好的检索结果。

用该方法求出的服装长度和袖子长度,其性能与实际相符。服装长度的平均精度为93%,说明该方法对服装长度进行了分类,得到了最新的技术成果,本文所提出的袖子长度分类平均精度为89%。商业服装图像数据集的实证结果表明,与其他最先进的检索方法相比,所提出的框架获得了满意的检索结果,结果如图4所示。

图3 分类结果图

图4 检测结果图

对RGB、CIELAB和HSV颜色空间模型的结果进行了比较。结果表明,CIELAB颜色模型优于HSV和RGB颜色模型。

4 总结

本文提出了一种非常新颖的方法来检索和识别服饰,本文在对服装形象的四个主要属性进行提取和比较的基础上进行了研究。这些特性包括颜色、图案、服装长度和袖子长度。根据目标图像和数据库图像之间的相似性,对每个属性进行评分。结果表明,基于本研究的系统在大多数情况下均运转良好。

猜你喜欢
袖子检索长度
袖子的窗口
袖子的窗口
绳子的长度怎么算
瑞典专利数据库的检索技巧
在IEEE 数据库中检索的一点经验
一种基于Python的音乐检索方法的研究
爱的长度
陈敏尔:撸起袖子加油干、迈开步子加快赶
长度单位