罗 亚
(贵州财经大学,贵阳 550004)
专家系统与电子商务个性化推荐系统之间存在相似之处,从整体上都包括输入模块、数据处理模块和输出模块,利用专家系统的专家诊断功能可以识别客户、分析客户需求,并为客户提供推荐结果,以此解决复杂的电子商务个性化推荐问题。
个性化推荐系统是指利用电子商务网站向客户提供商品信息和建议,帮助用户决定该购买什么产品,模拟销售人员帮助用户完成购买过程。个性化推荐系统主要分为三个模块:用户输入模块、推荐方法模块和输出功能模块。
关于个性化推荐系统的研究主要包括网站系统设计、推荐算法设计和网络购物流程设计。在这些研究中,主要技术是协同推荐技术、关联推荐技术和数据挖掘技术,应用专家系统推荐技术的较少。
科学技术的发展使得专业化加强,人们的吃穿住用行都有专家进行研究,将专家系统引入到电子商务个性化推荐中,有利于帮助消费者进行科学合理的消费决策。
当引入专家时,消费者购物过程为:
1)消费者表述自己需求特征;
2)专家分析消费者需求特征;
3)专家判断哪些商品可以满足消费者需求;
4专家推荐最适合的商品。
在这套系统中需要静态数据库(规则、信息)和动态数据库(用户数据库、商品数据库),需要
咨询子系统、规则子系统和结果子系统,设本文中设计的系统名称为MYG,则MYG系统结构图如图1所示。
图1 MYG 电子商务个性化推荐系统结构
在咨询过程中,MYG根据消费者的一般情况,将用户信息归类到相应的上下文中,所得到的结果以分层树的形式组织数据结构,如图2所示。
每组上下文类型都由一组购物参数描述,例如描述Consumer上下文的参数称为CSM,其中包 括 Name、Age、Sex、Salary等, 描 述 Goods上下文的参数称为GSM,包括Brand、Number、Size、Weight、Price等。追踪参数获得参数的值,每一个值都有一个从-1到1的可信度,应用产生式规则把专家知识表示成IF……THEN 语句。
示例规则1: IF PREMISE :[$AND (CONSUMER IS FEMALE)
(NOT BOUGHT EVER)
(CONSUMER LIKES RED)
(CONSUMER LIKES SWEET)(CONSUMER LIKES CHEAP)]
THEN ACTION:( SUGGEST GOODS1 TALLY 0.4)
图2 MYG数据结构图示例
MYG系统的静态数据库用来存放所有产生式规则和所有咨询需要的信息,由若干参数来描述,这个数据库其实就是专家系统的知识库。
1)规则特性
每个规则都包括四个特性:
PREMISE 规则的前提部分;
ACTION 规则的操作部分;
CATEGORY 规则按上下文分类,每条规则只能用于某几个上下文,以便于调用;
SELFREF 规则是否自我引用,如是则为1,否则为0。
2)参数
对于每个参数,各存一组属性,以便咨询和解释程序调用。
MEMBEROF 相应参数组名称
VALUTYPE 参数类型
EXPECT 参数取值范围
3)函数
函数分为三部分,用于规则前提部分、知识表示和用于操作部分。在前提部分,应用许多简单函数求关于消费者的值,建立函数KNOWN()、SAME()、THOUGHTOUT()等,回答真假,判断参数是否已知。在知识表中,利用专门函数建立可被规则前提利用的数据结构,建立GRID()函数,从动态数据库检索可信度最高的值。操作函数根据前提规则计算值进行操作,建立函数CONCLUDE( ),把用户数据三元组连同前提可信度存入动态数据库,再计算此操作的可信度。
4)上下文特性
上下文特性表示数据结构之间的关系,包括这些特性:
ASSOCWITH 父辈节点的上下文类型。每一种上下文只可能是另一种类型上下文的直接后代。
TYPE 某种类型上下文词干
PROPTYPE 参数分类
SUBJECT 用于某类上下文规则的分类表
MAINPROPS 跟踪某种类型上下文的参数表
每次咨询,动态数据库都要重新建立一次。动态数据库都以对象-属性-值的三元组形式储存,其中,值包括三项内容, 值、取此值的可信度、参数被跟踪次数。动态数据库包括消费者即用户数据,动态数据即每次咨询记录,商品数据以及上下文特性。
1)用户数据库
根据消费者个人统计特征, 用户属性包括性别、年龄、行业、收入、偏好、购物经历等信息,建立表1。
表1 用户数据库表
2)商品数据库
消费者在购物过程中最关注的商品信息包括商品名称、品牌、价格、尺寸、重量、功能、材料、生产日期、保质期、售后服务、产地等,建立表2。
表2 商品数据库表
3)随机数据库
随机数据库记录在咨询过程中产生的参数及其得到方式,得到方式包括推理获得、用户回答两种,在回答问题时,要记录回答问题的次序,以进行推理和解释推理。
推理规则1:单证据模糊推理
消费者在咨询时的提问和操作都有可信度,根据主管概率理论,专家的先验概率P(h)反映专家在不出现证据e的条件下相信假设h 的程度为P(h|0),即1-P(h)可认为是在此条件下专家不相信该假设成立的程度。如果P(h|e)大于P(h),说明由于证据e的出现使专家相信h成立的可能性增加了,或者说不相信h成立的可能性减少了。
设MB为可信度增加量,MD为可信度减少量,则
把MB和MD合为一个,定义可信度CF为:
当有几种可能的情况时,为了方便地比较它们的证据的强度,需要可信度把相信和不相信组合成一个数。由于MB和MD的值在0~1之间,所以CF的值在-1~1之间。如果CF大于零,则系统相信成立,反之,则不成立。
推理规则2:多证据模糊推理
如果顾客在咨询时,同时有两个或以上的证据,则推理公式为:
如果肯定地不相信h,则对h 的相信程度为零;否则,给定两个观察时对h 的相信程度可以是只有一个证据时的相信程度加上由于第二个证据所增加的相信程度。为计算此增加的相信程度首先取可信度与只有第一个证据时的相信程度之差,这个差是第二个观察所能增加的相信程度的最大值。所以要按第二个证据对h的相信程度进行调节。这个公式满足交换律,即计算结果与证据顺序无关。
MYG系统采用逆向推理过程。在咨询开始时,例示结构树中的根节点,先赋予上下文名称,把这个上下文加入到结构树中,跟踪这类上下文数据表中的参数,如果所有参数值都已获得,则咨询过程结束。
示例规则2 IF 30岁男性顾客欲购买笔记本,年收入3万左右,公务员
THEN 寻找价位在3000元左右,品质较好,配置适中笔记本
ELSE 推荐上网本
在这个过程中,数据结构可能为:
为了尽快找到可推荐商品,采用启发式搜索算法,寻找由推理规则得到的可信度最高节点。设OPEN为数据结构表,s、n、m为节点,i、j、k为节点序号,函数 F( )=CF( )、G( )=MB( )、 H()=MD( )为可信度函数,F()=G( )-H( ),则:
1)OPEN=(s) F(s)=G(s)-H(s)
2)Loop: IF OPEN=( ) THEN EXIT(FAIL)
3)N=FIRST(OPEN)
4)IF GOAL(n) THEN EXIT(SUCCESS)
5)REMOVE(n,OPEN) ADD(n,CLOSED)
6)EXPAND(n) 到 {mi} 计算 F(n, mi) =g(n, mi)-h(mi)
7)ADD(mj,OPEN)
8)IF f(n,mk)>f(mk) THEN f(mk)=f(n mk,)
9)IF f(n, mi)>f(mi) THEN f(mi)=f(n, mi)
10)OPEN中节点按可信度从大到小排列
GO Loop
在推荐显示结果中,按 TOP… N序列模式排列, 将可信度最高的商品排列在最前,依次次之,让消费者自行选择。
专家系统技术引入到电子商务个性化推荐技术中,采用启发式搜索提高推荐速率,提高了商品成交量。由于专家系统需要应用人工智能技术,可能包含不同于本文的模块,各模块的实现方法也存在多样性,在这些方面可以开展进一步研究。
[1] 赵永梅, 基于用户浏览路径的协同过滤推荐技术研究[D], 西安建筑科技大学, 2008. 6.
[2] J.Ben Schafer,Joseph Konstan, John Riedl,Recommender Systems in E-Commerce, In ACM.
[3] 韩慧俊, 电子商务个性化推荐系统的研究[D]. 上海交通大学, 2007. 1.