韩欣欣
摘要:近年来,随着定位技术的成熟,基于位置的社交网络(Location-Based Social Networks,LBSN)应运而生。LBSN的出现使得传统的社交网络更加接近现实。位置网络所包含的位置信息是相当重要的,综合分析位置信息可以识别用户的行为偏好,为用户推荐可能感兴趣的位置,即POI推荐,也是目前LBSN的热门研究方向。由于涉及隐私问题,用户的历史位置数据存在高度稀疏性。因此,如何提升POI的推荐质量也是LBSN服务所面临的挑战。本文考虑融合地理位置因素、社交关系、时间因素、空间因素、热门地区等,针对POI推荐所面临的冷启动以及推荐精度等问题进行分析与研究,对该领域在未来提升POI推荐质量提供参考。
关键词:社交网络;位置信息;稀疏性;融合;POI推荐
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2020)24-0047-02
传统的推荐系统主要应用于好友推荐和商品推荐,将位置这一特性加入社交网络,使得传统的推荐系统变得丰富多彩,同时,也带来了许多商机。由于Web2.0技术的发展以及智能移动终端设备的普及,越来越多的用户愿意通过社交网络去分享自己的经历,如Foursquare、Gowalla、微博、微信、ins等热门网站,用户通过分享位置、照片、文本信息等记录自己的行为轨迹,这些与位置信息相关的数据构成用户-兴趣点矩阵,可以用来挖掘用户的兴趣偏好,在未来的某个时刻为其推荐可能感兴趣的位置。与传统的推荐系统不同,POI推荐面临数据稀疏的挑战,具有一定的复杂性。目前已有的POI推荐模型中,大多数仅仅考虑到一种相关影响因素,因此如何通过分析用户的历史行为记录,对用户偏好建模,准确有效地为用户推荐感兴趣的位置,是服务的主要任务。
1基于位置的社交网络简述
LBSN将位置信息嵌入社交网络,可以从图论的角度分析,把用户和位置作为两种类别的节点,因此由用户行为产生的数据形成边,主要有用户与用户的关联度、位置与位置的关联度、用户与位置的联系。将该网络形式化描述为:U={u1,u2,…un},L={l1,l2,…ln},其中,U是该网络中的用户集合,从每个用户位置数据中提取几种特征属性,L是位置点集合,每个位置用对应的经度纬度信息表示。
2相关研究
目前,兴趣点推荐主要包括连续位置推荐和非连续位置推荐。连续位置推荐是根据行为轨迹推荐下一时刻位置,比如李梅一般会在晚上六点钟下班后去公司附近餐厅吃饭,吃过饭后会去家附近的健身房锻炼一个小时,在周末经常会去附近景点打卡或者购物。这是一种基于位置感知的推荐,Cheng 等人[1]将个人签到序列看作马尔科夫模型,并考虑地理区域限制,实现了短期的兴趣点推荐。非连续位置推荐,也即是单个位置推荐,对用户的行为偏好建模,通过协同過滤技术向用户推荐没有访问过的位置。位置信息是基于位置的社交网络不同于传统社交网络的关键,用户在各种社交网络中签到分享与所处位置维度、时间段以及流行度等因素有着重要的联系。Li 等人[2]分析了用户行为模式随着时间的变化趋势,考虑用户的长期偏好和短期偏好,提出一种基于时间感知的连续兴趣点推荐算法。文献[3]将地理位置影响引入 LBSNs 的兴趣点推荐中,采用幂律概率模型捕捉兴趣点对之间的地理位置影响,通过朴素贝叶斯方法计算拟推荐兴趣点的地理位置对目标用户的影响分数,再使用统一的协同过滤方法进行兴趣点推荐。Cho 等人[4]采用高斯分布模型,将用户访问地点划分为工作-住宅区域,同时考虑时间因素与空间因素,提出基于社交网站的用户移动轨迹模型。
3 POI推荐影响因素的分析与研究
3.1 地理位置
在位置社交网络中,位置因素的影响权重占比较大,对用户选择兴趣点其决策性的作用。许多研究工作模拟用户在位置网络中签到曲线,发现用户的位置偏好与距离呈一定的幂律分布、高斯分布、泊松分布等。 实际生活中,同样用户优先考虑近邻位置,比如以居住位置为中心,在兴趣点推荐过程中使用距离计算函数,通过设定一定的距离限制过滤掉位置相对较远的位置点,一定程度上减少冗余数据。针对推荐效率,可以选择将兴趣点聚类,毕竟类别数量远小于兴趣点数量。因此基于以上分析,可以将用户位置转移概率类比距离相关函数进行兴趣点推荐。
3.2 社交关系
在推荐系统中,用户是推荐对象的主体,因此,用户间社交关系在兴趣点推荐过程中也是相当重要的。用户签到矩阵高度稀疏,通过计算好友相似度将用户聚类,主要以基于用户的协同过滤推荐,相关研究发现,好友间访问兴趣点的行为有很强的关联性,当好友推荐某一个餐厅或者电影院时,用户更倾向于尝试,这取决于社交关系中好友间的信任值。用户间信任值越大,产生的影响越大。LBSN中,通过研究好友在某一位置的签到信息分布,Ui、Uj分别表示用户i和用户j,E表示关系边,W(i,j)表示两用户间信任值,Sim(i,j)表示两用户间的相似度。目前,用户间相似度计算方法有很多,经典的有欧式距离、余弦相似度、Pearson相关系数、Jaccard 相似性。
3.3 时间因素
基于位置的社交网络中,时间偏好也会对兴趣点偏好产生一定的影响, 在推荐兴趣点时,给时间因子分配一定的权重也会提高推荐质量。一天可以分为24个时间戳,不同时间戳内用户有不同的行为偏好,构建时间因子模型可以在位置网络中捕捉到密集时间戳,计算不同时间戳之间的距离,将距离进行排序(类似权重W),得出用户日常活动偏好以预测POI。基于以上提出的位置相似度、好友相似度,时间因子也有时间相似度,采用平滑相似度和矩阵填充的方式可以解决签到数据稀疏性问题,提高模型的推荐效果。目前,时间因素的研究在基于位置的服务领域具有很大的需求。研究表明,时间因素对兴趣点偏好选择的作用集中表现在:1)时间关联度;2)时间独立性;3)时间连续性;4)时间循环性。
3.4 基于时间因素的流行度
针对远距离异地场景,用户历史签到数据稀疏导致推荐精度低。引入流行度因素分析,可以在一定程度上缓解这种问题。兴趣点流行度是该兴趣点是否是热门区域,简单定义为一定时间下访问该位置频次的多少划定,通常采用HITS链接分析模型获取流行度高的兴趣点,该模型有两个主要的度量值中心度( Hub) 和权威度( Authority),兴趣点的中心度越高,说明访问该位置的用户越多,权威度越高,说明该用户有较高的可信性。兴趣点流行度数学定义如下:P(li)=V(i)/Vmax(i)(i∈U),其中P(li)表示该兴趣点li的流行度,V(i)表示兴趣点li处被签到记录的次数,Vmax(i)表示相同类别兴趣点中最大的签到频次。
由于在位置社交网络中用户行为偏好是动态的,流行度也会随时间而变化,一般小吃街在晚上八点至十点活动量较大,购物街在周末比较聚集,咖啡馆在中午属于热点区域等。因此,在分析兴趣点流行度因素时,融合时间因素将流行度密度曲线按照不同时间段划分,可以得出不同时间段下兴趣点的流行度,提高推荐精度。
4多因素融合框架构建
在LBSN中,POI推荐受多重因素影响,深入分析各因素的潜在影响,初步构建一种融合多因素的POI推荐框架通过建模分析形成一种线性加权模型,设置调节各因素的权重参数,通过算法优化实验不断调整参数,与现有较优的算法相比较,达到提高推荐精度的效果。
5 POI推荐所面臨的挑战
POI推荐是基于位置服务的重要研究方向,目前,国内外已经做出大量相关研究,但是仍然面临一些问题,主要有:1)签到数据稀疏面临的冷启动问题;2)数据特征提取;3)异地远距离场景推荐精度低;4)用户签到信息涉及隐私问题有待保护。
6结束语
本文针对基于位置服务的POI推荐所存在的推荐精度低等问题进行相关研究,分析了地理位置、社交关系、时间因素以及流行度因素对POI推荐的影响,提出一种线性加权融合多因素的POI推荐模型,考虑模型多参数的优化调整。在此基础上,下一步将继续深入分析影响POI兴趣点推荐的因素,例如签到文本信息所包含的情感因素等,并综合以上几种因素完善自己的推荐算法设置实验进行验证,达到POI推荐精确度和准确度提高的目的。
参考文献:
[1] Cheng C,Yang H Q,Lyu M R,et al.Where You like to go next:successivepoint-of-interest recommendation[C]//Proceedings of the Twenty-Third International Joint Conference on ArtificialIntelligence,2013:2605-2611.
[2] Li X,Jiang M M,Hong H T,et al.A time-aware personalized point-of-interest recommendation via high-order tensor factorization[J].ACM Transactions on Information Systems, 2017,35(4):1-23.
[3] YeM,YinP F,Lee W C,et al.Exploiting geographical influence for collaborative point-of-interest recommendation[C]//Proceedings of the 34th international ACM SIGIRconference on Research and development in InformationRetrieval,July 24-28, 2011. Beijing, China. New York: ACM Press, 2011: 325-334.
[4] E Cho, S A Myers, Leskovec J. Friendship and mobility: user movement in location-based social networks[C]//Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining,ACM, 2011:1082-1090.
【通联编辑:代影】