孙礼辉
(安徽商贸职业技术学院 经济贸易系,安徽芜湖241002)
基于地理位置和协同过滤的移动推荐算法
孙礼辉
(安徽商贸职业技术学院 经济贸易系,安徽芜湖241002)
针对当前移动推荐中存在的“信息过载”和推荐质量不高等问题,提出一种基于地理位置和协同过滤相结合的移动推荐算法。算法根据用户与物品间距离对被推荐物品进行预过滤,以缩小推荐范围,并根据用户间的相似度,对预过滤的物品进行偏好预测推荐。实验证明,该算法明显优于基于用户协同过滤推荐算法(UserCF)和基于位置的最近距离均值推荐方法(DARS)。
地理位置;协同过滤;移动推荐;O2O
随着互联网技术的迅速发展及移动通信设备的普及,我国手机用户的数量快速增加。工业和信息化部公布的数据显示,2016年1月我国移动互联网用户总数达到 9.8亿[1],超过传统的 PC互联网用户数量,这意味着移动电子商务也随之成为电子商务的主流。越来越多的企业进入移动电商领域,移动互联网信息服务的内容剧增,而同时由于移动设备处理能力的限制,出现了“移动信息过载”的问题[2]。
移动推荐系统是解决这一问题的重要手段,通过优化移动推荐算法,可以对移动信息进行科学排序,有效帮助用户进行购买决策。O2O电子商务,即线上与线下相结合的一种电子商务模式,已成为移动电子商务的一个重要发展方向。用户在线上搜索感兴趣的物品后到线下消费这一过程具有很强的地理位置属性,产品推荐需要考虑到用户所在的位置及物品与用户间距离做出人性化的推荐。将地理位置信息引入移动推荐算法中,可以更有效地为O2O用户推荐所需要的产品,对改进用户体验具有重要意义。
本文提出一种结合协同过滤技术,将地理位置融入移动推荐系统的算法,以弥补传统算法在推荐效果上的不足,并解决以下问题:1)按照与用户间距离的远近对被推荐的物品进行预处理,减少推荐算法的计算量,提高推荐算法的效率;2)使新用户和新物品都有被推荐的机会,规避冷启动问题。
1.1移动推荐思想
在移动推荐的场景中,用户是移动的,而物品是固定的,物品的位置可以直接获得,用户的位置可以通过移动设备获得(如运营商的基站定位、GPS定位等)。从地理位置来看,当用户与物品间距离较近时,用户接触和选择物品的概率较大,同时选择某物品的用户也主要集中在该物品附近[3]。据此,本文以移动用户为推荐对象,选择与用户间距离在一定范围内的物品作为推荐目标,形成推荐场景。
首先,获取某用户u的地理位置,以此位置为圆心,以一定距离为半径的圆作为该用户的有效推荐区域,并实时统计有效推荐区域内的物品,形成预推荐的目标物品i的集合。接着,对预推荐集合中所有未评过分的目标物品,利用UserCF预测u对i的评分,并将u 与i距离的影响考虑在内进行评分修正,使距离更近的“用户—物品对”的评分更高。最后,根据u对所有预推荐的目标物品评分的高低,取评分较高的N个物品进行NTop推荐,形成用户u的物品推荐列表。考虑到用户是移动的,物品推荐列表会按照特定周期更新,以保证推荐的时效性。
1.2相关定义
为了更好地描述提出的推荐方法,定义以下相关的概念。
定义1:有效推荐距离D。某用户的有效推荐区域的半径即为该用户的有效推荐距离。
定义2:预推荐集P。与用户地理位置距离小于有效推荐距离的所有物品组成的集合称为该用户的预推荐集。预推荐集是对单个用户而言的,即每一个用户对应一个预推荐集。
1.3相关计算公式
1.3.1协同过滤
协同过滤包括ItemCF和UserCF两种。ItemCF是基于物品之间的相似性做出的物品推荐,而UserCF是基于用户之间的相似性做出的物品推荐。本文采用UserCF算法为用户推荐与之相似的用户感兴趣的产品。用户间的相似度采用当前较为流行的皮尔森相关系数(Pearson correlation coefficient)来计算。用户u和用户v之间的相似度为
其中:Rui表示用户u对物品i的评分;Rvi表示用户v对物品i的评分;iuv表示用户u和用户v都评过分的物品集;s(u,v)表示用户u和用户v间的相似程度,数值越大表示相似程度越高,反之,相似程度越低。
1.3.2预测评分
用户u对物品i的预测评分可以通过式(2)的计算得到。
其中,iList表示对物品i评过分的用户集合。
1.3.3修正评分
根据用户u与物品i间的实际距离,对预测评分进行修正,修正公式为
1.4推荐算法描述
基于地理位置和协同过滤的移动推荐算法(LBCF)描述如下。
输入:用户集合U、物品集合I、用户对物品历史评分集R、用户位置、物品位置和有效推荐距离D。
输出:每个用户的物品NTop推荐列表List。
(1)取出用户集合U中的某个用户u和物品集合I中所有物品的位置,并根据有效推荐距离D计算出用户u的预推荐集P。
(2)从历史评分集R中取出用户u的评分记录,形成用户u的物品评分列表uList。
(3)取出预推荐集P中某物品i,如果u对i有过评分,则直接跳到步骤(7);如果没有,则通过步骤(4)~(6)进行u对i的评分预测。
(4)从历史评分集R中取出对物品i评过分的用户,形成物品i所有历史评分列表iList。
(5)对iList中每个评分用户ui,都从R中获取其评分记录列表uiList,并根据式(1)计算出用户u和ui相似度s(u,ui)。
(6)以iList中用户ui对物品i的评分为值,以用户u 和ui的相似度为权重,利用式(2)计算用户u对物品i的预测评分。
(7)对预推荐集P中所有物品都执行步骤(3)~(6),使用户u对P中的物品均有相应评分。
(8)根据用户u与预推荐集P中每个物品的距离,利用公式(3)进行评分修正。
(9)根据修正后的评分高低选取NTop个物品进行推荐,形成用户u的推荐列表。
(10)对用户集合U中所有用户都执行步骤(1)~(9),最终获得推荐列表List,完成推荐。
为了对文中提出的推荐算法的效果进行验证,我们进行如下实验。
2.1数据集
实验数据来自某团购网站2014年8月—2016 年3月的销售数据。通过对该团购网站会员和物品进行筛选预处理,保留活跃的用户和热门的物品,并保证每个用户至少对一个物品有评分。所形成的数据集包括2 527个用户对798个团购物品的13 742条团购记录,数据稀疏度为68.1%。每条记录中都包括某个用户购买某个物品的时间、交易产生时的GPS定位信息和用户的评分信息,其中评分范围是1~5分。
2.2评价标准
本文中的推荐算法是基于评分计算的,并按照评分的高低进行NTop推荐,实验结果采用平均绝对误差MAE(mean absolute error)作为评价标准,记为M。MAE通过计算预测评分与真实评分的平均偏差来度量推荐结果的推荐精度,M值越小说明偏差越小,预测值越准确,推荐精度越高[5]。MAE计算方法为
其中,N表示预测样本的数量,pi表示第i个样本的预测评分,qi表示第i个样本的真实评分。
2.3实验设计与结果分析
首先将数据集划分为训练集和测试集,数据划分比例为8∶2。用训练集进行算法模型的训练,在测试集上进行验证,并用MAE进行结果评价。同时用UserCF 和DARS作为对比算法进行对比实验。然后进行有效推荐距离D值的确定:取不同的有效推荐距离D,在训练集上进行基于地理位置和协同过滤的移动推荐算法(LBCF)训练,并在测试集上进行测试,得到结果如表1所示。从表1可知,当D取1 000 m时,评分预测精度最高,因此在实验中D均取此值。
表1 不同有效推荐距离D值的LBCF推荐结果
参数ρ取不同值时的对比实验结果如图1所示。图1中,UserCF与LBCF中协同过滤部分采用相同的相似度计算方法,DARS和LBCF中的有效推荐距离D值也取1 000 m。
图1 参数ρ在不同取值情况下各算法的MAE
由图1可知,在设定ρ为0.85时,本文提出的LBCF的推荐精度明显优于UserCF和DARS。
为了给移动用户带来更好的推荐体验,本文根据O2O电商特点,在现有算法的基础上,将地理位置信息引入移动推荐算法中,并结合了UserCF算法来改善移动推荐算法的效果。
与传统的协同过滤推荐相比,保留高交互概率的物品并进行推荐计算的推荐思想可避免大规模相似度计算,大大缩小了推荐范围,提高了计算效率和推荐效果。与传统基于位置的移动推荐相比,本文中的推荐利用协同过滤思想对基于位置的推荐进行优化,具有更高的推荐精度。
下一步需要进行的改进工作包括移动用户位置的历史轨迹、移动用户位置的预测和基于预测位置的移动推荐。
[1]工业和信息化部.2016年1月份通信业经济运行情况[EB/OL].(2016-03-1)[2016-04-1].http://www.miit. gov.cn/newweb/n1146285/n1146352/n3054355/n3057511/ n3057518/c4652953/content.html.
[2]WANG L C,MENG X W,ZHANG Y J.A Cognitive Psychology-based Approach to User Preferences Elicitation for MobileNetworkServic[J].Acta Electronica Sinica,2011,39(11):2547-2553.
[3]李贵,陈盛红,韩子阳.基于协同过滤的位置感知推荐[J].计算机科学,2014,41(11):340-346.
[4]RICCI F,ROKACH L,SHAPIRA B,et al.Recommender SystemsHandbook[M].Berlin:Springer Press,2011:107-144.
[5]HERLOCKER J L,KONSTAN J A,TERVEEN L G,et al. Evaluating Collaborative Filtering Recommender Systems [J].ACM Transactions on Information Systems,2004,22 (1):5-53.
【责任编辑梅欣丽】
A Mobile Recommendation Algorithm Based on Geographic Location and Collaborative Filtering
SUN Lihui
(Department of Economy and Trade,Anhui Business College,Wuhu 241002,China)
With the rapid development of O2O E-business,mobile recommendation algorithm became a research focus.Aiming at problems such as“information overload”and poor recommendation quality existing in the current mobile recommendation,the paper put forward a mobile recommendation algorithm based on the combination of geographic position and collaborative filtering.In this algorithm,recommended objects were pre-filtered according to the distance between a user and the object so as to narrow the recommendation scope,and then preference prediction were recommended to the pre-filtered objects according to similarity among users.Experimental results showed that the results obtained through this algorithm obviously prevailed over results from the userbased collaborative filtering recommendation algorithm(UserCF)and the position-based minimum distance average recommendation method(DARS).
geographic location;collaborative filtering;mobile recommendation;O2O
TP311
A
2095-7726(2016)09-0030-04
2016-05-13
安徽省高等学校省级质量工程——大学生创客实验室建设计划项目(2015ckjh139);安徽省高校优秀青年人才支持计划重点项目(gxyqZD2016489);安徽商贸职业技术学院科研项目(2016KYZ04)
孙礼辉(1982-),男,安徽巢湖人,讲师,硕士,研究方向:电子商务。