数据挖掘在电子商务中的应用

2014-05-30 14:28张伊张冰冰
2014年47期
关键词:推荐算法数据挖掘

张伊 张冰冰

摘要:如何面对海量的信息如何进行过滤和筛选,并将用户最想得到的信息进行展现,这已经成为这个信息爆炸时代最重要的问题之一。在此情景下,推荐系统应运而生。它不像搜索引擎一样只是对用户提供的显式需求进行被动式的匹配,而是可以根据用户潜在的兴趣和爱好主动地进行信息推荐,从而最终提升用户体验、提高服务质量。

关键词:推荐算法;数据挖掘;用户兴趣

一、引言

1.研究背景与意义

随着网络的高速发展,现在互联网已经从个人PC向移动互联网发展。在全世界范围内,除了传统的个人PC外,互联网中有增加了大量的移动终端,如智能手机、平板电脑、智能电视、智能汽车等各种设备都连到了互联网当中。互联网中的各式终端在随时随地的获取数据的同时,也会产生新的数据。例如,刚过去的一分钟内,淘宝卖出数以万计的商品,谷歌产生几千万条的搜索查询等等,新浪和腾讯微博发送数万条微博,几万个应用程序从苹果应用商店下载,这些都是海量数据的具体体现。目前,随着移动互联网的广泛运行,产生的数据比以往任何时期都要多的多,互联网中的数据呈现出爆炸式增长的景象。大数据处理成为当今信息领域中最热门的项目之一。大数据处理通过运行新工具、系统、机器学习等,把海量动态的数据转化为有价值的知识,挖掘出数据背后隐藏的经济规律。

2.新的推荐系统

目前,个性化的智能推荐系统是当今大数据处理发展的一个重要趋势。个性化的智能推荐系统可以结合用户的历史浏览记录,分析出用户习惯、行为、兴趣爱好等,再通过建立用户兴趣模型,从而为用户推荐所感兴趣的信息。在现今这个信息大爆炸的时代,用户面对海量信息时,往往不知改如何选择,因此推荐系统得以产生并得以广泛应用。在现实中,用户在互联网上购买书籍时,推荐系统便可以可以向用户推荐感兴趣的书籍。例如,亚马逊网站会根据用户的书籍历史购买记录,向用户提供个性化的推荐服务。因为不同的人有不同的性格特点、兴趣爱好,所以,推荐系统应针对每个人提供个性化的智能推荐服务。

二、推荐系统的实现技术

1.动态推荐系统

由于用户的兴趣是动态变化,物品的属性也并非是单一的,所以推荐系统也应具备动态特性。用户的上下文,如地点、时间等,是动态推荐系统中需要考虑的重要因素。上下文的变化往往意味着用户兴趣的变化。因此,结合用户上下文的动态推荐系统能够在旅店、音乐、旅游景点等方面发挥出非常重要的作用。与传统的推荐系相比统,结合了用户上下文具体环境的动态推荐系统在评价指标:精度、错误率、召回率都要好。

动态推荐系统的关键,是要建立用戶的上下文和用户兴趣之间联系模型。在日志记录中,用户的评分作为显性的反馈数据,往往只占有很少的一部分,日志中大量的数据是用户浏览、评论等这样的隐性用户反馈数据。要建立上下文与用户兴趣之间的联系模型,必须考虑到用户评分时一些细节,像在视频网站,是陪朋友观看还是独立观看,观看时间,是否连续播放等上下文具体情境,但是有些数据描述的是现实生活中的环境,动态推荐系统往往很难取得。用户在进行评分时,是将多个环境因素考虑进去,以时间,地点等因素尤为重要。动态推荐系统应该结合多个环境因素,向用户提供与兴趣最匹配的商品。

2.推荐系统的评价指标

任何一个最终可以实际运行的系统,都绕不开评估检测。只有每项评价指标都达到了目标值时,系统才算是一个合格的系统。不同的系统有着不同的评价指标,推荐系统的评价指标主要有准确度,覆盖率,惊喜性,新颖性等。下面详细介绍一下每个评价指标。

准确度在推荐系统中是最重要的一项指标,Top-N推荐系统和预测评分推荐系统在准确度上各有各自的表现方式。Top-N推荐系统通过采用分析用户的隐性反馈行为数据,向用户推荐N个可能感兴趣的物品。在预测评分推荐系统中,采用的是平均绝对误差或者绝对均方根误差来进行计算。

覆盖率往往是用来解决推荐系统中所面临的长尾问题,可以向感兴趣的用户推荐非热卖的物品。例如,在许多电子商务网中,有一些冷门的商品评分很少,如果推荐系统向用户推荐热门的商品,那么该推荐系统的覆盖率可能就会很低。

近几年,新颖性和惊喜性越来越被人重视。惊喜性和新颖性可以反映出用户对某些事物的特定需求。例如,一个喜爱电影的用户,如果推荐的是当下热门的电影,则用户可能不会感到意外,因为用户可能已经看过这些热门电影。但是如果系统推荐了一些用户没有看过的且满足用户兴趣爱好的电影,那么用户在接受推荐时候,会有意外的感受。当然并非只有最新的物品才具有新颖性和惊喜性,在用户的认识领域当中,只要是用户没有接触的物品皆有可能为用户带来惊喜。

三、小结

在互联网蓬勃发展的背景下,信息数据也呈现出爆炸式的高速增长。可以预见的是,在以后的一段时间内向用户提供高效、精准的个性化推荐是其必然的发展趋势。(作者单位:河南财经政法大学)

参考文献:

[1]李国杰.大数据研宄的科学价值.中国计算机学会通讯,2012,8(9):8-15.

[2]项亮.推荐系统实践[M].北京:人民邮电出版社,2012,1-9

[3]艾瑞网.2012-2013年中国移动互联网行业年度监测报告简版.2013.

[4]刘建国,周涛,汪秉宏.个性化推荐系统的研究进展.自然科学进展,2009,19(1):1-15.

[5]曾鸣.云商业的大创想.[EB/OL]:http://www.aliresearch.com/html/stopic/ayan13.html,March 9,2013

[6]朱郁筱,吕琳媛.推荐系统评价指标综述[J].电子科技大学学报,2012:41(2),163-169

[7]项亮.动态推荐系统关键技术研究[D].北京:中国科学院研究生院,2011,24-27

[8]李方涛.基于产品评论的情感分析研究[D].北京:清华大学.2011.17-21

猜你喜欢
推荐算法数据挖掘
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
校园社交平台中标签系统的研究
基于相似传播和情景聚类的网络协同过滤推荐算法研究
社交网络推荐系统
数据挖掘技术在中医诊疗数据分析中的应用
混合推荐算法在电影推荐中的研究与评述
一种改进的基于位置的推荐算法
基于情景感知的高校移动社交网络平台设计与开发
一种基于Hadoop的大数据挖掘云服务及应用