王炎
(陕西财经职业技术学院 管理学院, 咸阳 712000)
随着电子商务的快速发展,越来越多的企业开始对网络用户的行为进行分析,通过用户行为来对兴趣爱好进行掌握,根据用户的兴趣爱好来为其进行个性化商品的推荐,在此过程中,能够充分提高用户交易的成功率,增强企业的盈利水平。用户在使用互联网的过程中,浏览记录会被网络进行自动识别并记录,该项记录会对用户的行为分析提供基础,在对行为分析过程中,数据的采集以及网站数据的提取至关重要[1]。
个性化的智能推荐系统可以通过对相关信息的过滤,将用户感兴趣的信息推荐给用户,例如电影、音乐、书籍、图片等。此次研究以电影为例,对数据挖掘技术下的智能推荐系统进行设计分析,最终目标为:结合用户的喜好,推荐系统为其提供经过筛选之后的电影推荐列表,并且能够及时更新。系统整体构架如图1所示。
由图1所示,该系统以三层构架结构进行设计,当用户对需求信息发出指令以后,接口会将指令传递到中间层,位于中间层的搜索引擎会结合用户给出的喜好信息与多媒体资料库中的内容相匹配,产生符合用户标准的媒体信息反馈给用户接口。用户对所推荐的内容满意之后可以进行付费并浏览。本次所设计的智能推荐系统由用户处理子系统、管理员控制系统与推荐子系统构成。
图1 个性化智能推荐系统整体构架
1.1 用户处理子系统:该子系统主要对用户的个人信息进行收集,并且为用户提供注册、观看视频的相关信息等功能。包括列表推荐、热点分析、分类列表、资料搜寻等。
1.2 管理员控制系统:对多媒体资料库进行及时更新与维护,可以对用户或媒体信息进行删除,在搜索引擎上,可以对参数进行调整。管理员可以对用户资料库进行管理,对系统个性化信息进行自动更新。
1.3 推荐子系统:该子系统主要产生关联规则,以最快的速度提供信息推荐。
数据挖掘技术下的个性化智能推荐系统的设计主要涉及个人信息的自我学习技术以及个性化特征分析技术[2]。
2.1 个人信息自我学习技术
该项技术主要是通过用户对不同类型电影的点击频率来构建起个性化的浏览信息列表,对电极习惯与特性进行自我学习。在对电影进行推荐时,要根据电影自身与用户的喜好关系进行推荐,所以需要对电影资料与用户信息之间做出相应关联。通过信息搜索技术,最终产生规则信息。用户可以直接通过推荐系统来对规则库中的资料进行使用,通过对比之后,给出正确的推荐信息。系统会将用户每次选取的电影操作当作一次交易记录,每个信息特征都当作一个项目,通过CBW算法能够增进搜索速度,结合不同的用户资料结构,快速的搜索出相关项目集[3]。针对多维度关联规则举个简单例子:如表1所示。
表1 挑选记录交易信息表
{(性别,男),(星座,巨蟹),(年龄,中年),(职业,教师),(居住,南部)}—{(类别,动作),(男主角,汤姆克鲁斯),(电影点选记录,点击)}
其中代表的意义为:居住在南部的中年巨蟹座男教师通过点击浏览了由汤姆克鲁斯主演的动作片。
2.2 个性化特征分析技术
在智能推荐系统的构建中,个性化特征分析技术的应用主要是为了找出电影自身与用户需求信息之间的关系,用户信息包括性别、年龄、职业、兴趣爱好等。电影信息包括导演、男女主角等。用户行为包括试看、点击、付费三种。通过个性化特征分析技术将这些信息形成相关联的规则。个体关系如图2所示。
图2 推荐视频与个人资料关系
推荐程序主要是对众多条件的因素进行分析,针对需求给予最佳匹配。以较新的电影资源优先,其次为点击率,点击率较高的电影优先次序较高[4]。具体逻辑分析如下:
输入:用户的个人资料、交易记录、多媒体资料以及关联规则。
输出:推荐的10部符合要求的电影。
处理:对电影推荐的流程处理如图3所示。
图3 系统推荐流程
当用户登录到浏览器之后,系统会分析用户数据,判断其是否为第一次使用,如果是第一次使用,系统会自动对用户需求进行检索,找到合适的关联规则,通过关联规则来推荐电影,如果找不到相关的关联规则,会直接推荐给用户最热门的10部电影。如果用户不是第一次使用推荐系统,那么系统会对与用户适合的关联规则进行搜索,一旦发现可用的关联规则,会通过该关联规则对电影进行推荐。如果搜寻不到关联规则,会直接按照用户的交易记录来进行推荐。
3.1 根据关联规则推荐
首先系统会检查关联规则右项的结论,当系统给出的结论为单向信息时,可以直接根据右项结论来进行推荐。如果结论为多项信息,则需要对信息进行分离,分离成单一的结论信息之后,针对每个单一信息推荐出10部电影,根据这10部电影之间的信息交集,来选出最符合用户的五部电影做出推荐[5]。根据规则推荐电影流程,如图4所示。
图4 关联规则推荐
3.2 交易记录推荐
如果根据交易记录进行推荐,那么需要从用户的交易记录中挑选出用户最长看的五部电影类型,找出用户是否对电影的某个信息有所偏爱,如果有,需要将该信息下的电影挑选出来,对电影类型进行分析,与之前的电影进行对比分析,最后集成为一种电影类型,根据相应比例计算出各种类型的电影推荐书目进行推荐。推荐流程如图5所示。
系统测试模块是系统设计中不可缺少的一部分,通过测试能够证明系统运行的稳定性与实用性。本次对智能推荐系统以实际数据进行实验测试。在Intel Core i5-1.6 GHz,4GB RAM硬件环境下,运用Ubuntu 14.04操作系统,通过模拟数据器产生数据。本次测试以交易数量10万笔与5万笔为基础,交易平均长度为12,项目种类为1400种[6]。如表2所示。
图5 交易记录推荐
参考值参数名T12.100KT12.50K交易数量/个100 00050 000平均交易长度1212项目 种类/种14001400
根据相应的数据量生成五种不同的测试数据,测试系统的稳定性。根据表3所示。
表3 不同资料执行时间以及频繁项目集
将最低门限值设定为1%时,两者执行时间为14.19秒和16.22秒。所以,系统在相同数据量所产生的不同测试数据下,时间非常稳定。基本不会由于测试数据而对稳定性造成很大影响。可靠性比较高,值得信赖。另外,系统所产生的项目集在2万个左右,使用者的个性信息在越长频繁项目集中出现,代表电影队额推荐准确性越高。利用最低门限值来产生频繁项目集,预测推荐的电影会更准确。
本文所设计的数据挖掘技术下的个性化智能推荐系统,主要运用数据挖掘技术,针对用户的个人喜好进行预测,将符合用户需求的内容推荐给用户,通过关联规则与交易记录的结合,摆脱传统被动的推荐方式,使用户无需时刻进行上线查询,能够随时掌握最新信息。经过对系统的测试,能够证明该只能推荐系统的运行稳定性,在实际应用中具有一定的推广价值。