Personalized Ranking Metric Embedding forNext New POI Recommendation

2018-06-09 11:37尹荣
科学与财富 2018年10期
关键词:信息点社交网络

摘 要:基于位置的社交网络(LBSNS)的快速发展提供了大量的记录数据,这能够提供许多服务,比如,信息点(POI)推荐。在本文中,我们研究了一个新的POI推荐的问题,使新的信息点基于用户的当前位置来被推荐。这个挑战在于精确的了解用户的序列信息和个性化推荐模型是有难度的。为此目的,我们求助于公制嵌入方法的推荐,这就避免了矩阵分解技术的缺点。我们提出了一个个性化的排名指标嵌入方法(PRME)来模拟个性化序列。实验基于两个现实世界LBSN数据集,结果显示为我们的新算法优于最先进的POI推荐方法。

关键词:社交网络、信息点、马尔可夫链算法、数据集

1. Introduction

随着基于位置的社交网络(LBSNS)的日益普及,用户想通过记录POIs来分享他们的位置。大量的记录数据提供了机会来更好地了解用户的移动性的行为,在此基础上推荐的POI将成为有价值的。 POI的推荐是很有价值的,它可以帮助用户探索他们周围的环境。POI推荐的重要性是已经引起了大量的对开发推荐技术感兴趣的研究。

相比于POI推荐,下一个POI推荐目前受到的关注较少。除了用户的偏好,下一个POI推荐额外考虑了用户的记录序列信息。因为人体行为表现出的有序模式,有序行为对POI的推荐很重要。我们分析两个真实世界的数据集来验证用户的有序行为。我们开发了一个公制嵌入算法来模拟POI的有序转移。为了模拟个性化序列信息,我们提出了一种新颖的PRME算法,它既考虑到有序转移也考虑到用户偏好。

2. Related Work

定位推荐最近吸引了深入的研究关注。大多数以前的方法是基于协同过滤(CF)技术。其中最流行的CF算法是基于用户的CF,它利用相似用户签入的用于建议的目的。在基于CF算法主要利用用户的喜好提出建议。目前,地域的影响力已经融合与CF的算法,以提高POI建议。例如,混合高斯分布和幂律分布已经提出来建模地域影响。

3. Next New POI Recommendation

我们使用两个可公开获得的数据集。第一个数据集是在新加坡Foursquare的签到,而第二个是在加利福尼亚州和内华达州Gowalla的签到数据集。我们用这两个数据集一年的数据。每办理入住手续是<用户的形式的元组; POI;时间>。各个POI与纬度和经度相关联。我们剔除谁拥有签入少于10个兴趣点的用户,以及已经访问了少于10个用户的兴趣点。

3.1 Observations on real-world datasets

观察1:新的位置的探索,图1示出的新的POI对所有用户上两个数据集,每50天平均比率。例如,该比率在第100天是POI的比例拜访,但没有被访问过在先前天第100天。新的POI的比例是相当高的(大部分在0.4以上的比例)的两个数据集,这意味着人们总是喜欢探索新的兴趣点。这种观察是根据最近的研究结果[连等人,2013]。

观察2:暂时影响,图2(a)示出两个连续的签入的时间差的累积分布函数(CDF)。图2(a)表明,50%以上的连续检查插件发生在少于24小时。与此同时,许多连续的签入发生在较长的时间。为25%以上的连续的签到,他们的时间差异超过48小时大。

(图1显示了新的POI对所有用户上两个数据集,每50天平均比率)

观察3:空间影响,我们计算了两个连续签入的地理距离并绘制在图2(b)的CDF分布,这表明70%连续签到有不足10公里的两个数据集。该CDF曲线增加快时,距离小,这意味着大多数签到发生在附近地区。该结果表明用户的下一个动作由它们的当前的位置的影响。这一发现是根据所报告的结果。

.(图(a)显示两个连续的记录数据之间的时间差的累积分布函数图(b)显示了两个连续的记录数据之间的地理位置距离的累积分布函数)

3.2 Next new POI problem definition

当两个签入发生在很短的时间内,马尔可夫链属性存。根据观测1,用户倾向于访问新的POI为他们的勘探利益,这表明这表明新的POI为用户的问题是有意义的。

根据一个很短的时间周期和新的POI用户意愿内连续属性,我们正式定义下面N2-POI建议问题。

对于一组用户的U和一组的POI L,C是历史校验数据,并且 是一组POI中的用户U已经访问过。鉴于用户u当前POIlC 时, N2-POI问题是推荐一套POI ,可实现用户U接下来的访问和兴趣点是新的用户

4 Personalized Ranking Metric Embedding

为了模拟顺序信息,我们需要在马尔可夫链模型的转移概率。然而,由于该数据稀疏,这是不可行通过使用标准计数方法估计的转换。度量嵌入模型可以用来处理数据稀疏和推广到未观察到的数据。我们代表每个POI作为一个潜在的空间中的一个点。我们假设在潜在空间的POI之间的欧几里德距离反映了转换概率。距离越大,转场的强度越低。

I

where ,

在度量嵌入模型,将各个POI升具有在K维空间中的位置X(l)。鑒于观察到的连续的POI转换,目标是学习所有POI的位置。我们涉及的一对,li和lj的转移概率,以欧氏距离的公式定义。

其中 ,K为潜在空间和Z(LI)的维数, 是正常化术语。

5.Conclusion and FutureWork

在本文中,我们研究了下一个新的POI推荐的问题。我们提出了一个新颖的成对公制嵌入来模型化连续的POI转移。我们进一步发展出PRME-G,这个模型连接了三个因素:连续转移,个人偏好和地域的影响力。我们的算法性能表现在两个数据集中进行大量的实验。几个有趣的未来发展方向可以作进一步的探索,例如产品的推荐和朋友的推荐。

References

[Chen et al., 2012] Shuo Chen, Josh L Moore, Douglas Turnbull, and Thorsten Joachims. Playlist prediction via metric embedding. In KDD, pages 714–722, 2012.

[Chen et al., 2013] Shuo Chen, Jiexun Xu, and Thorsten Joachims. Multi-space probabilistic sequence modeling. In KDD, pages 865–873, 2013.

[Chen et al., 2015] Xuefeng Chen, Yifeng Zeng, Gao Cong, Shengchao Qin, Yanping Xiang, and Yuanshun Dai. On information coverage for location category based point-ofinterest recommendation. In AAAI, pages 37–43, 2015.

[Cheng et al., 2012] Chen Cheng, Haiqin Yang, Irwin King, and Michael R Lyu. Fused matrix factorization with geographical and social influence in location-based social networks. In AAAI, 2012.

[Cheng et al., 2013] Chen Cheng, Haiqin Yang, Michael R Lyu, and Irwin King. Where you like to go next: Successive point-of-interest recommendation. In IJCAI, pages 2605–2611, 2013.

作者簡介:

尹荣(1992.8.4—), 男,汉,上海,本科,中国电信股份有限公司上海分公司、助理工程师、项目管理。

猜你喜欢
信息点社交网络
土建类专业教材营销信息点及属性探析
基于信息全生命周期的信息类人才培养新模式研究与实践
一种基于模板的配电终端信息点表自动生成方案
运用“三讲”模型来讲题
主题出发,以生为本
医疗建筑智能化施工中常见问题的协调解决
大数据时代社交网络个人信息安全问题研究
社交网络中的隐私关注及隐私保护研究综述
社交网络自拍文化的心理解读