周占宁
【摘要】本文对电子商务中基于内容的图像检索应用进行了分析,文章阐述了基于内容的图像检索技术的应用现状,并且对基于内容的图像检索技术(CBIR)进行了研究,最后提出了特征向量提取的要点。
【关键词】电子商务;基于内容的图像检索;应用现状;技术;特征提取要点
在现代社会,市场经济体系得到了不断的完善,各种新的经济形式涌现出来,电子商务就是非常突出的例子。在电子商务企业的发展经营中,建立完善的商品运营体系是非常重要的,其中要用到大量的信息技术,搭建好信息传输、图像检索等平台,使得商家和消费者之间形成良好的沟通。
一、基于内容的图像检索技术的应用现状
电子商务购物网站本身具有一定的特别之处,而为了更全面地展现出商品信息,往往是将图片作为其基本的信息载体。因为技术的原因,商品信息的检索大多是依靠文本标注的方法来完成的,而这种标注方法虽然能够获得比较全面的信息,但是准确度并不高,这最终降低了商品信息的传输和检索效率。以内容为主体的图像检索技术最早是运用在一些特殊行业,如公安刑侦的头像对比、安防工作的指纹对比等等。在商务工作中,国内发展比较先进的图像搜索引擎是“安图搜”,它是集传图、视觉搜索为一体的全网比较购物搜索引擎。
二、基于内容的图像检索技术(CBIR)研究
(一)CBIR技术概念界定
以内容为基础的图像检索技术将图像内容自身的特点当做索引,这就避免了以文本为索引的单一、模糊问题。CBIR是合集成技术,它整合了颜色、纹理、形状等不同的特征属性,而这些特征是用向量方式被保存数据库中的,在检索时,用户只需要输入模糊的特征,引擎自行通过匹配计算得到特征结论,并据此得到与之相关的图像结果,按照特征相似度的高低,对其按先后进行排序、呈现。
(二)商品图像特征提取层次模型
在图像数据库中,对目标特征进行提取,而图像特点的提取可以归纳为三个层次,其一是可视化层次,其中包括了商品的色彩、纹理、形状、轮廓等直观的外在特点,这种提取方式最简单、最直接,使用的頻次也最高。其二是中间对象的层次,这是将图像的单个地区或者目标物体当作索引工具,在操作时技术难度会更高。其三是高级抽象层次,这是在局部特征提取的前提下所展开的抽象化描述,图像的语义信息会更丰富,比如给图像增添的的可以体现情感色彩的部分语义。
(三)组合特征提取算法分析
从电子商务商品的销售特点来说,对实体图像进行呈现,可以从多个方面来说,包括颜色、形状等,所以以内容为基础的图像搜索方法中,也往往会和多个层次的特点提取操作相联系,避免用单一检索方法所带来的局限性。而组合特征技术就是指对颜色、形状特征向量二者加以联合,构成一种综合性的商品特征。借助这种组合性质的特征提取方法,可以综合调动两种方法各自的优势。在图像检索技术中,颜色是最常见的特征类型,在确定了具有该种颜色特征的产品范围后,在此基础上增加形状特征等限定词,缩小搜索范围,使对象更加精确化。
三、特征向量提取的要点
(一)颜色特征向量提取
对商品来说,颜色本身是商品外在特征上非常重要的一种,而虽然各种商品都有其特定的特点,但颜色是图像内容中最基础的因素之一,并且构成了人们辨识图像的重要感知方式。在图像的多种特点中,颜色是相对具有稳定性的一种。基于内容的图像检索技术通常依据HSV颜色模型算法设计,在操作时,重点分析图像的色相(huge)、饱和度(saturation)和色调(value)三个角度的情况。
(二)形状特征提取
形状也是商品非常关键的一大外在特点,现在,根据商品形状上的区别,对图像进行检索,大概可以分成根据图像局部形状特点、以及根据图像整体形状特点进行检索两种方法。其中,局部的检索指的是工作人员在提取时,可以得到图像中商品的部分形状区域或形状边界等完整信息特征,并且借助该区域和相关特征得到完整的图像内容。而这种局部形状的理念,需要对整个图像内容做细化处理和适当切割,而检索的范围也会因此被细化、受到局限。与之对应的,全局化的形状特征检索无省略了图像细化这个步骤,可以直接借助体现图像形状的全局特征向量完成对应的图像检索工作,这种方法的运用,更多地出现在比较大型的通用图像数据库中。
(三)图像相似性比对
基于内容的图像检索技术主要采用比对两幅图像的相似性的检索方法。在检索过程中,采用逐步求精的办法,在匹配需求过程中不断与用户进行交互。用户可以浏览系统反馈的查询结果,相似度最大的商品排在前面。若需进一步明确查询结果,则可在前期检索结果的基础上通过调整特征提取方法重新进行检索匹配,直至找到自己心仪的商品为止。目标图像与特征库中图像的匹配比对方法就是采用前面计算所得的颜色特征向量和形状特征向量与特征库中的数据进行相似度匹配,通常采用Euclidean距离算法计算。
四、结语
综上所述,加强对电子商务中基于内容的图像检索应用问题的分析,意义重大。相关工作人员需要明确基于内容的图像检索技术的应用现状;并且对基于内容的图像检索技术(CBIR)进行研究,把握CBIR技术概念界定、商品图像特征提取层次模型、组合特征提取算法等等内容;在此基础上,探讨特征向量提取的要点,如颜色特征向量提取、形状特征提取、图像相似性比对等等。
参考文献
[1]朱林婷,丁荣涛.基于内容的图像检索在电子商务中应用初探[J].商场现代化,2011(11):138~139.
[2]孙振权,肖诗斌,吕学强.基于内容图像检索的特征融合技术研究[J].图像图形技术研究与应用,2010(01):156~161.