高 华
(大连艺术学院 文化艺术管理学院, 辽宁 大连 116600)
电子商务智能推荐系统中的案例检索算法探讨
高华
(大连艺术学院 文化艺术管理学院, 辽宁 大连 116600)
摘要:针对传统电子商务推荐算法中的缺陷,提出以案例推理为基础的案例检索算法,通过对商品概念语义相似度的加权平均算法以及数据类型和属性的相似度等计算出案例的综合相似度,避免了传统算法中计算单一相似度的不足,提高了电子商务系统的运行效率和精确度,为电子商务系统的设计提供考参考的价值。
关键词:电子商务;智能推荐系统;案例检索算法;分析
电子商务智能推荐技术是在搜集和分析用户所检索的商品信息和数据的基础上,分析用户的购买行为和购买兴趣,并且及时的更新用户的偏好信息,智能的向用户推荐所偏好的商品信息[1]。目前在电子商务中常用推荐技术有协同过滤、内容过滤等,但仍存在着推荐数据以来原始数据搜集等问题[2]。因此为了解决这些问题,提高电子商务系统推荐的精确度和效率,经本体技术引入到系统中,设计出基于案例推理的案例检索算法,利用商品的概念语义相似度、数据类型和属性的相似度计算出案例的综合相似度,提高电子商务智能推荐系统的推荐效率和质量,克服传统算法中的弊端。
1领域本体协同案例推理的系统构架
本系统构架的设计主要是在多层结构设计思想的基础上,应用层、业务逻辑层和数据存储层共同组成了系统中最重要的三个层次。在系统中应用层可以为普通用户、企业用户和VIP用户提供可操作的界面,并给与不同用户授权来完成用户需要的操作步骤。系统用户可以在应用层面进行注册,获取用户的偏好,对用户的浏览行为进行隐性的评价,用户通过对商品的查询,应用层面可以对同类的商品进行分析,并将推荐结果以列表的形式展示给用户。业务逻辑层是智能推荐层的核心层面,掌握着的电子商务的主要业务和案例表示等,在商务领域本体中案例的表达主要将语义要素抽取出来,并对用户的偏好和用户所搜索的商品信息和数据进行整理,向用户推荐相关的产品所需要的商品。数据存储层主要功能是分类和整理数据,并实现最后的储存,在元数据中抽取有用的信息和数据并及时的更新模型库。
本系统框架具有多方面的优势和特征,将领域本体作为一种形式化的规范来表达共享概念,最终电子商务所涉及到的概念和属性通过知识性的描述方式来进行表达,并且奠定了知识共享和运用的良好基础。采用领域本体来进行定义电子商务的案例结构,并且将分类索引建立在概念语义树层次结构上,这样案例的检索和储存变得更加便捷和规范化。从领域本体的角度抽取目标案例要素,表达和描述案例则采用语义信息来完成,实现对案例的问题空间和解空间的完善。因此新用户可以通过语义来进行检索和信息的匹配,将案例求解的空间进行了有效地拓展,并且在电子商务智能推荐系统中提高了案例检索的效率和精确度,保障了推荐的质量。
2关键技术研究
案例推理作为案例表示的理论基础,案例表示的质量决定着案例检索的效率,在本次研究中将领域本体引入到电子商务系统中,并且以WordNet作为语言组织和表达的案例,对传统系统中的旧的数据进行记录,对用户浏览的商品信息和数据库进行整理和记录,实现数据的预处理,将格式转换,之后抽取概念等一系列的环节和步骤。之后利用WordNet构建领域本题库,并在此基础上规定所用词的范围,将案例结构进行定义,在概念层建立索引,实现对案例结构和组织的规范化,建立相应的存储模式。案例库和本体库等组织结构的管理和维护是通过案例表示和领域本体建模管理的方式来实现,从而促进电子商务智能推荐系统的规范化和组织化。
3基于领域本体的综合语义相似度的案例检索
(1)案例检索策略
在案例检索之前,可以先对案例进行预处理,这样可以有效地保障智能推荐系统的运行效率和推荐商品的质量。预处理也就是先对数据信息进行分析,进一步建立目标案例,并对案例属性进行分类和分析,接下来一步一步的进行案例的检索,因此案例检索是建立在信息的分类处理上的[3]。接下来进行案例相似度的检索,主要是检索采用的商品属性和概念之间的相似度,之后将属性、概念和类别三者之间利用加权平均数计算出综合的相似度,最后通过列表的形式显示出案例,通过智能推荐系统推荐给用户[4,5]。该案例策略主要是根据用户的偏好信息以及偏好内容对案例的索引进行适当的调整,并能够有效地提高案例检索和推荐的效率。
(2)案例相似度计算
本案例主要先计算出属性、概念和数据类型三者的相似度,然后利用加权平均数计算出综合的相似度。g1为目标案例中的商品,g2为源案例中的商品,具体的模型如下:
1.概念相似度计算模型:相似度算法采用WordNet语义概念树和距离的相似度算法,表达式如下:
(1)
商品g1和g2在语义概念树中最近的共同原始数据为los(g1,g2),在WordNet概念树中,depth(g1)和depth(g2)为概念g1和g2的。
2.基于类型的属性语义相似度计算模型
基于类型的属性语义相似度取决于数据和对象类型属性语义相似度,可以先将商品g1和g2进行分类,建立起数据类型的一个集合[6]。然后采用式(1)的方法构建语义相似矩阵,
计算出属性集合中的相似度SimC(g1,g2),最后得到相似度平均值SimA平(g1,g2)也就是所有数据类型属性语义的相似度。SimO平(g1,g2)代表着相似度平均值,最后得到基于类型的属性的语义相似度为:
(2)
3.基于数据类型的属性值相似度计算模型
假设Fi和Fj的属性和数据类型相同或者相似,那么他们的属性值为VFi和VFj,ωFj和ωFi分别为属性权重,那么根据不同的数据类型,计算出属性值VFi和VFj的相似度,具体的表达式子如下:
(3)
(4)
当数据类型为离散型数值时:
(5)
当数据类型为字符串型时:
(6)
根据不同的计算模型丘恩处所有属于类型属性语义的相似度,并得到数据类型的总体属性相似度为:
(7)
4.g1和g2商品的案例相似度为Csim(g1,g2)为
Csim(g1,g2)= αSimC(g1,g2)+βSimA′(g1,g2)+γSimAV(g1,g2)
(8)
α,β分别表示数据类型的属性语义相似度和概念语义相似度,γ表示数据类型的属性值相似度的权重为γ,α+β+γ=1。知识工程师可以根据三者之间的相似度权重和用户的偏好对系统进行有效的调节,最后将案例的相似度进行排序,取得最大的值,并给用户推荐相关的案例,最后得到的案例考虑了三者之间相似度的影响,避免了传统案例算法中依靠属性相似度的缺陷[7]。
三、实际应用分析
某计算机配件销售网站上应用了该算法,知识工程师要抽取近三个月销售网站上商品的销售中语义要素,作为原型案例建立的基础,将该算法应用到某白领用户购买主机配件为例来验证算法的精确度。
某白领用户在该销售网站上想要搜索一台计算机,基本的配置为:转速7200r/min,320GB的容量,SATA类型的4MB接口,知名品牌价格在450左右,免费保修期为3年时间。该用户搜索了自己想要的产品信息后,计算机先分类整理用户输入的商品信息,并抽取出信息中所需要的关键信息,建立目标案例y,那么会得到一个案例集X={x1,x2,x3...xi},在案例集中抽取相关的案例类型,如表1所示:
表1 案例参数
为了简化计算,每个属性权重设为0.166,
1.概念的语义相似度计算
商品g1为硬盘1,g2为硬盘2,在概念树中两个商品的共同概念为存储设备。因此可以将数据带入带式子(1)中得到:
depth(lso(g1,g2))=8,depth(g1)=9,depth(g2)=10,得SimC(g1,g2)=16/19=0.842。
2.基于类型的属性语义相似度计算
g1,1={接口,供应商,质量保证};g2,1={代码,品牌,界面,制造商,质量保证};整数类型:g1,2={容量,缓冲,速度},g2,2={缓冲容量,速度};浮类型:g1,3={价格},g2,3={价格}。字符串类型的属性按照式子(1)得到属性相似度和语义相似度矩阵:
SimA(g1,g2)=SimA字符串+SimA浮+SimA整数)/3=1,得到商品的属性语义相似度为:
SimA’(g1,g2)=SimA(y1,x1)+Sim0(g1,g2))/2=13.
令权重α=β=γ=0.333,由式(8)可知综合语义相似度为:
CSim(yi,xi)= αSimC(g1,g2)+βSimA′(g1,g2)+
γSimAV(g1,g2)=(0.842+1+0.81)×0.333=0.884
总结:针对传统电子商务智能推荐系统中算法单纯运用属性值的弊端,忽视语义和属性类型相似度的算法,从而解决了智能推荐系统推荐的效率低,推荐给用户的商品质量得不到保障的问题。本文引入了领域本体的案例检索算法,运用语义相似度、属性类型相似度和数据类型属性值相似度三者之间的的综合相似度,规范了案例表示和组织的形式,增加了案例检索的空间,提高了案例检索的速度和效率,保障了智能推荐的质量[8]。
参考文献:
[1]杨艳霞,于海平,陈燕,等.基于Web挖掘的个性化推荐算法研究[J].计算机与数字工程,2014,42(4):674-677.
[2]崔春生,齐延信,田哲,等.基于Vague值的电子商务推荐系统及其相似度研究[J].图书情报工作,2012,56(6):130-134.
[3]邓检名.基于移动Agent技术在电子商务系统中的应用研究[J].军民两用技术与产品,2015,(4):48-49.
[4]肖冰,陈潮填.电子商务系统的复杂性特征与方法论探析[J].商业经济研究,2015,(21):77-79.
[5]高锁军.电子商务系统与ERP系统集成[J].价值工程,2014,33(33):238-239.
[6]王芮.B2B模式电子商务系统的需求获取与分析[J].中国管理信息化,2015,18(5):223-224.
[7]毛意辉.B2B与B2C整合的电子商务系统的分析思考[J].中国管理信息化,2015,(8):199-199.
[8]吴碧霞.电子商务环境下基于证据理论的信任评估模型[J].湖北民族学院学报(自然科学版),2011,29(3):331-334.
责任编辑:程艳艳
Discussion on Case Retrieval Algorithm in Intelligent Recommendation System of Electronic Commerce
GAO Hua
(Culture and Art Management College, Dalian Art College, Dalian 116600, China)
Abstract:In view of the defects in the traditional electronic commerce recommendation system, this paper presents a case retrieval algorithm based on case reasoning, which calculates the comprehensive similarity of cases by using the weighted average algorithm of product concept semantic similarity and the similarity of data types and attributes, avoiding the shortage of the single similarity in traditional algorithm. This algorithm has improved the operating efficiency and accuracy of electronic commerce system, providing references for the system design.
Keywords:E-commerce; intelligent recommendation system; case retrieval algorithm; analysis
中图分类号:TP311
文献标志码:A
文章编号:1009-3907(2016)02-0014-04
作者简介:高华(1975-),女,辽宁大连人,副教授,硕士,主要从事计算机应用技术与电子商务方面研究。
基金项目:辽宁省教育厅科学研究项目(w2012283)
收稿日期:2015-12-14