陆伟宇
摘要:电子商务搜索引擎成为电子商务活动中人们网络购物中的基本手段,同样也是是客户、商家和电子商务关心的重要领域,但是网络购物中商品检索问题一直困扰着电子商务的进一步发展。本文首先对通用搜索引擎与垂直搜索引擎进行了比较;接着,提出电子商务背景下商品信息检索的诸如检索模式单一与信息孤岛、信息的领域约束性、用户需求的多样化与个性化、网络商品的可信度问题;再次,针对存在的问题提出了ProductRankProductCrawler、ContextRank和OpinionRank解决策略,以期为电子商务背景下商品信息检索的研究提供参考和借鉴。
关键词:电子商务;商品信息;检索
中图分类号:G354.4 文献识别码:A 文章编号:1001-828X(2016)004-000329-01
进入21世纪以来,电子商务发展迅速,根据相关数据统计,截止2015年6月,我国网络购物用户达到4.17亿。伴随着电子商务网站的增多,随之而来的是商务信息资源更加丰富,呈现出多样化。电子商务搜索引擎成为电子商务活动中人们获取商品、服务和信息的基本手段,是客户、商家和电子商务关心的重要领域。但是在信息资源过载问题的同时,网络购物中普遍存在“信息迷失”的现象,一些公共搜索引擎也很难满足用户的需求,用户将大量的时间都消耗在一些重复的信息,甚至虚假的信息上。因此,如何在这些海量数据里,快速、高效的检索出用户需要的信息,是电子商务急需解决的问题。
一、信息检索
信息检索(Information Retrieval,IR)指将信息按照一定的方式组织和存储起来,又称为“信息存储与检索”。一般分为通用搜索引擎与垂直搜索引擎,如表1所示,进行了对比。
二、电子商务检索存在的问题
1.检索模式单一与信息孤岛问题
以目前的天猫商城为例,其提供的商品检索服务基本以传统的单一的关键字匹配,尚不能真正满足客户的需求,同时由于各个电子网站之间也缺乏互通互联,用户不能全面获取商品信息,容易造成信息不对称。
2.信息的领域约束性问题
电子商务网站消除信息孤岛问题的同时,检索空间可能会存在非商品信息的个体。由于各个电子商务商家网站之间缺乏统一的商品信息标准,乃至页面的布局都不尽一致。结果导致在海量的商品信息中,不能保障检索空间的主题约束,进而会对查准率产生负面影响。
3.用户需求的多样化与个性化问题
用户需求的个性化与年龄、学历和工作性质等因素均存在着密切的联系,据相关数据表明,2012年71.9%的网络购物用户年龄在18-30岁之间,这一年龄段的用户具有天然的个性化,市场化的发展也导致需求的多样化。这些购物的环境因素都需要综合考虑,否则商难以满足用户的真实需求。
4.网络商品的可信度问题
在对电子商务网络购物调查中,大部分用户担心假冒网站和商品,有的客户甚至表示如果无法获得该网站进一步的确认信息,将会选择退出交易。由此可见,网络购物的质量问题成为电子商务发展的最大制约因素,因此,如何继续规范商家的行为,并对商品信息的可信度进行评价越来越成为网络购物的新问题。
三、电子商务检索策略
上文提到了电子商务搜索面临的诸多困难,针对电子商务搜索存在的问题,提出一系列检索解决方案,主要包括以下几方面。
1.ProductRank解决网站检索模式单一与信息孤岛问题
ProductRank是一个涵盖商品信息采集和匹配的商品信息检索服务模型。截止目前,大多数网站仍以传统的关键字作为主要的搜索模式,致使用户无法获取真正需求的产品,前人针对此问题,在对海量数据信息特征分析与提取的基础上,对国内外的商务搜索引擎进行比较,从购买者和企业出发,提出了ProductRank商品检索服务平台。
2.Product raw ler解决电子商务信息领域约束性问题
随着互联网信息量的普及,大量的电子商务信息被包括其中,如何面向用户,有效地定位这些信息就需要搜索引擎的帮助,但是在现实中,用户真实需要的信息往往淹没在大量无用的数据中。所以实现商品信息搜索引擎的首要任务就是构建一个高效的商品信息主题爬虫(ProductCrawler),爬虫将网页的主题链接分析与主题内容语义分析有机的结合起来,充分发挥两者的优势,保持着较高的主题收获率。
3.Context Rank解决网络购物用户检索需求的多样化与个性化问题
在商品信息的检索过程中,用户的需求是个性化与多样化并存,前人针对次问题,提出基于情境相似度计算的用户商品匹配算法(contextRank)。此模型师徒构建了需求、商品特性的情景,并尝试实现情景感知获取方法,得到了精确到商品排序,尽可能满足了消费者的需求。
4.OphbnRank解决网络商品信息的可信度问题
面对网上众多商家推销的海量商品,商家一直积极宣传,导致大量的信息存在于消费者脑海中,一时难以区分,加大了网购的风险与难度。针对此问题,OpinionRank对商品信息的可信问题进行了深入分析,基于自然语言处理,分析出商品特性,以进一步服务于商品精确排序,从而使用户能够检索到具有可靠性的商品。
四、结语
对于电子商务背景下商品信息检索问题的研究,前人利用文献资料分析、实证研究、比较研究、注重系统观在研究中的应用以及多学科方法对其进行了研究,取得了丰硕的成果,但是由于网络购物的发展需要进一步深入,需要挖掘更多的商品排序因子。在今后电子商务背景下商品信息检索问题的研究中,尝试将ProductCrawler应用到其它主题爬行领域,进一步挖掘用户商品情境的组成因素,提高网络评论预处理结果质量,精确地计算评论整体的极性强,建立商品通用检索优质排序应用平台,使系统更具有实用性。