协同过滤算法应用于景点推荐研究

2017-12-02 19:00牟进军罗国宽熊志斌
软件导刊 2017年11期
关键词:个性化推荐协同过滤

牟进军+罗国宽+熊志斌

摘要:旅游电子商务与网络社交媒体发展导致旅游信息爆炸式增長,用户面临信息过载问题。为使用户快速获取并甄别信息,将传统协同过滤推荐算法应用于景点推荐,游客对景点评分构成评分矩阵,计算景点之间相似度,根据相似景点评分预测游客对目标景点评分。实验结果显示,景点预测评分平均绝对误差为0.696,Itembased景点推荐算法能根据游客偏好推荐景点。

关键词关键词:协同过滤;个性化推荐;景点推荐;Itembased

DOIDOI:10.11907/rjdk.171818

中图分类号:TP319

文献标识码:A文章编号文章编号:16727800(2017)011018603

0引言

随着国民经济发展,旅游业成为朝阳产业,各类旅游电商平台与旅游社交媒体应运而生,如携程、艺龙、去哪儿、旅人网、蚂蜂窝、穷游网等,这些旅游电子商务平台与社交媒体为游客提供机票与酒店预定服务、景点信息、旅游攻略与游记分享平台。网络查询已成为游客获取资讯的主要方式,游客规划旅游路线时,通常会在旅游电子商务平台与社交媒体上查阅景点信息、游客评分及点评。

游客能够快速在旅游电商平台与社交媒体获取景点信息,同时遭遇“信息过载”问题[1]。游客在网络上获得海量信息,相应需要花费额外时间查阅并甄别信息。这不仅增加了游客时间成本,还提高了线路规划难度。推荐系统作为解决信息过载、满足用户个性化需求的有效工具,已在淘宝、亚马逊等电商平台成功应用[2]。基于用户需求提供景点推荐的国内旅游电商平台与社交媒体为数不多[34]。推荐算法有多种,其中基于协同过滤的推荐算法在个性化系统中应用最广[5],如高明虎等[6]改进传统协同过滤算法解决冷启动问题,并应用于酒店推荐;娄小风[7]提出基于酒店多维度属性打分的协同过滤推荐算法提高了推荐准确度;王益[8]将协同推荐算法应用于旅游路线推荐。本文研究协同过滤算法在景点推荐中的应用,为游客提供个性化数据服务。

1协同过滤推荐算法概述

协同过滤推荐算法诞生最早,基本思路是如果用户过去物品偏好一致,将来偏好仍将一致[7]。算法通过挖掘用户历史行为数据发现用户偏好,以此为依据计算得到相似用户或物品并进行推荐。协同过滤推荐算法有2个重要分支:一个是基于用户的协同过滤算法,另一个是基于物品的协同过滤算法。Itembased算法得出的结果具有较好说服力,因此,本文将该算法应用于景点推荐[9]。

基于用户的协同过滤算法思路是根据用户物品偏好找到相似用户,然后将相似用户喜欢物品推荐给目标用户。基于物品的协同过滤算法思路类似基于用户协同过滤算法,通过计算不同物品相似关系,找到相似物品推荐给当前用户。

数字化描述用户物品偏好是协同过滤算法数据基础,用户物品偏好量化方法一般有2种形式:一种是量化成离散整数值,不同值代表偏好程度;一种是量化成布尔值0或1,代表喜欢或厌恶二值偏好。电子商务网站通常为用户提供对物品评分、投票及评论功能,评分值与票数代表了用户物品偏好程度。用自然语言处理方法处理用户评论,可得到用户情感取向,量化成布尔值0或1。用户对物品购买与否,也可量化成布尔值0或1。除电子商务网站外,社交媒体用户也用多种行为表达偏好,如自媒体订阅数、信息转发数、好友关注数,需要根据具体应用量化用户偏好。

3.2数据来源

实验数据源于“携程旅行网”,携程网向会员提供酒店、机票预订、旅游资讯、景点评分、攻略分享等线上旅行服务,网站会员超过1亿8千万。选择携程网作为数据源,可获取足够景点评分数据。

携程网旅游目的地攻略栏目中,游客分别从“景色”、“趣味性”、“性价比”3个指标对景点评分,分值区间为5(最高)至1(最低)。用网络爬虫采集海南省景点点评数据,原始数据按“景点名”+“用户名”+“景色评分”+“趣味性评分”+“性价比评分”项目保存。由于数据量非常大,只选择点评数10条以上景点进行编号处理,得到评分数据133 864条,含343个景点、32 587名游客。

3.3结果及分析

原始数据含“景色”、“趣味性”、“性价比”3个评分指标,测试选取“景色”评分作为数据项。为测试算法可行性,将数据分为2组,10万条数据为训练数据,余下33 864条为测试数据,相似景点个数K取10。实验结果为平均绝对误差MAE=0.696,表明Itembased景点推荐算法是可行的。

4结语

互联网“信息过载”现象日益突出,用户需花费大量时间查阅、筛选信息。本文将Itembased协同过滤算法应用于景点推荐,使游客能快速找到满足个性化需求的景点与旅游资讯。旅游社交媒体上,游客从多个指标对景点进行评分,并附加文字评论。开发推荐系统时,需要综合考虑各指标下评分,利用自然语言处理技术从文字评论中挖掘游客情感倾向,以提高推荐精度。实验过程发现,旅游社交媒体游客与景点数量太大,计算景点相似性非常耗时,很难做到实时推荐,而Itembased协同过滤算法可利用“游客-景点”评分矩阵,离线计算出景点相似矩阵,然后实时计算,预测游客对景点评分,向游客推荐景点。

参考文献参考文献:

[1]李聪.电子商务推荐系统中协同过滤瓶颈问题研究[D].合肥:合肥工业大学,2009.

[2]洪亮,任秋圜,梁树贤.国内电子商务网站推荐系统信息服务质量比较研究——以淘宝、京东、亚马逊为例[J].图书情报工作,2016(23):97110.

[3]令狐红英,姜季春.改进的贝叶斯算法在旅游景点推荐中的应用[J].贵州师范学院学报,2012(3):2226.

[4]皇苏斌,王忠群.景区智能空间下的实时景点推荐技术[J].安徽工程大学学报,2011(4):6163.

[5]马腾腾,朱庆华,曹菡,等.基于Hadoop的旅游景点推荐的算法实现与应用[J].计算机技术与发展,2016(3):4752.

[6]高虎明,李伟丽.基于协同过滤和Rankboost算法的酒店推荐系统[J].微计算机信息,2010(36):206208.

[7]娄小丰.基于多属性打分的酒店推荐算法研究[D].哈尔滨:哈尔滨工业大学,2012.

[8]王益.基于用户兴趣特征变化的旅游路线个性化推荐技术研究[D].武汉:武汉理工大学,2015.

[9]冷亚军,陆青,梁昌勇.协同过滤推荐技术综述[J].模式识别与人工智能,2014(8):5064.

[10]侯新华,文益民.基于协同过滤的旅游景点推荐[J].计算技术与自动化,2012(4):116119.

责任编辑(责任编辑:何丽)endprint

猜你喜欢
个性化推荐协同过滤
基于远程教育的个性化知识服务研究
改进的协同过滤推荐算法