社交关系与地理位置信息融合的GRU兴趣点推荐模型

2023-08-26 04:13吴忠权钱萌程树林
电脑知识与技术 2023年20期

吴忠权 钱萌 程树林

关键词:兴趣点推荐;社交关系强度;位置社交网络;图嵌入;门控循环神经网络

中图分类号:TP18 文献标识码:A

文章编号:1009-3044(2023)20-0043-04

0 引言

随着移动互联网的发展和智能终端的广泛使用,很多应用程序都会涉及社交功能以及位置信息。因此,基于位置的社交网络,如微博、Foursquare等得到迅猛发展。在位置社交网络中,平台允许用户与他人建立社交关系和分享地理位置信息,这些地理位置信息记录了用户访问的兴趣点(Point of Interest,POI) ,如餐馆、超市、旅游景点等。然而在LBSN中,兴趣点的数量成千上万,用户很难快速找到自己感兴趣的地点。因此,兴趣点推荐成为位置社交网络中一个重要研究分支。它通过算法对用户社交行为以及POI相关信息分析,捕获用户的个性化偏好,从而帮助用户发现新的兴趣点和活动,提高用户的满意度。此外,POI推荐还可以为商家提供广告投放的机会,从而带来商业价值。

传统的POI推荐方法通常是基于序列的个性化推荐[1–3],如FPMC[4]模型通过马尔科夫链和矩阵分解的组合对用户的序列行为和总体兴趣进行建模,但是马尔科夫链难以捕获较长的序列信息并且计算复杂度较高。随着深度学习的发展和广泛应用,一些研究将RNN类模型[5–8]应用到用户顺序签到行为建模,取得了更好的效果。在LBSN中,社交关系和时空信息能够提供有价值的信息,这些信息有助于更准确地预测用户的兴趣,并向他们推荐更合适的地点。例如,如果一个用户好友在某个时间去了某个地点并在社交媒体上发布了关于此地点的评论,则该评论可能会吸引用户好友的注意,并对他们未来兴趣点的选择产生影响。此外,利用用户所在的位置和时间信息也能够更好地为用户推荐合适的 POI。例如,如果用户周末在城市中心,则可以向他们推荐当地的商场或餐馆,而不是在郊区的购物中心或餐馆。因此,本文提出了基于社交关系与地理位置信息相融合的GRU兴趣点推荐模型,为目标用户推荐感兴趣的兴趣点。

1 相关工作

传统的POI推荐根据所应用的方法主要集中在两个方面,即基于协同过滤方法相关的POI推荐和基于序列模型相关的POI推荐。

1.1 基于协同过滤方法相关的POI推荐

Zhang等人[9]提出了一种个性化的有效地理位置推荐框架iGeoRec。该框架一方面可以为每个用户计算个性化的位置概率分布;另一方面通过似然估计方法预测用户访问下一位置的概率。Lian等人[10]提出了一种结合地理模型和加权矩阵分解的兴趣点推荐算法GeoMF。该算法认为人类的位置活动具有空间聚集现象。然而,基于矩阵分解的算法难以捕捉到用户的动态兴趣偏好,因此不适合于用户签到序列的建模。

1.2 基于序列模型相关的POI推荐

常见的基于序列的POI推荐算法主要是对马尔科夫链、树模型、循环神经网络RNN等进行了扩展。在马尔科夫链模型方面,如Cheng等人[11]提出了FPMC- LR模型,该模型结合了位置转移矩阵的马尔科夫链和用户地理距离从而实现地点推荐。在循环神经网络方面,如Liu等人[12]将RNN改进为ST-RNN的模型,该模型学习空间和时间信息来模拟个人轨迹以进行下一位置推送。但以上模型没有对用户社交关系信息进行建模,忽略了社交信息对用户兴趣偏好的影响。

3.3 实验环境和参数设置

本文使用Python 3.8 实现了相关模型,并在Py? Torch 1.8中进行了实验。实验中,本文所提出的模型SG-GRU中的异构图构建部分参数设置如下:默认社交关系权重ε 为0.5,POI先后访问时间间隔参数默认为一天,即θ 为24 h,最大空间间隔参数D 在Gowalla 数据集中设置为140 74 m,在Brightkite数据集中设置为15 150 m。图嵌入过程中,最小出入度阈值ρ 设置为400,学习率为0.002 5,嵌入维度d 为128,负采样数为5。序列模型使用双层GRU,其中隐藏层大小设置为128,学习率设置为0.001。所有实验运行环境为Ubuntu18.04,GPU为Nvidia RTX 5000 16GB。

3.4 对比模型

为了验证本文所提出模型的性能,选取以下3个经典模型进行对比,所有模型參数均使用对应论文提供的最佳参数:

1) Rank-GeoFM[17]:该模型是一种基于排名的因子分解模型,通过地理和时间影响加权来获取用户和POI的嵌入。

2) SAE-NAD[18]:利用自注意力编码器区分用户兴趣偏好,利用邻域感知解码器并结合地理上下文信息进行POI推荐。

3) GEAPR[19]:考虑了用户属性、邻居影响和地理位置信息,结合注意力机制进行POI推荐。

3.5 综合实验

首先,笔者对所有模型分别在两个数据集上进行c5a次ll@综k、合F1实-s验ocr,e最@k终指取标平,如均表值2作和表为3所示。

在表2的Gowalla数据集上,本文提出的SG-GRU 模型在Precision@k,Recall@k和F1-score@k指标上显著优于现有基准模型。对比最优的基准模型GEAPR,本文算法SG-GRU模型在F1-score@5和F1-score@10 上分别提升了17.3%和5.2%。同样在表3的Brightkite 数据集上,本文提出的SG-GRU模型也优于其他基准模型,对比最优的基准模型GEAPR,SG-GRU在F1- score@5和F1-score@10上分别提升了8.3%和7.2%。

在表2的Gowalla数据集上,本文提出的SG-GRU 模型在Precision@k,Recall@k和F1-score@k指标上显著优于现有基准模型。对比最优的基准模型GEAPR,本文算法SG-GRU模型在F1-score@5和F1-score@10 上分别提升了17.3%和5.2%。同样在表3的Brightkite 数据集上,本文提出的SG-GRU模型也优于其他基准模型,对比最优的基准模型GEAPR,SG-GRU在F1- score@5和F1-score@10上分别提升了8.3%和7.2%。此外,所有模型在Brightkite数据集上的综合性能都优于Gowalla数据集,这是因为Brightkite数据集中的用户平均签到记录长度长于Gowalla数据集,可以使模型学习到更多的用户行为及兴趣偏好。

4 结论

利用深度学习中的GRU网络研究了位置社交网络中的兴趣点推荐问题,提出了融合社交关系与地理位置信息的GRU兴趣点推荐模型。基于异构图对用户社交关系、用户与兴趣点的关系以及兴趣点之间的关系进行了建模。同时,根据用户社交关系强度以及POI之间地理位置信息对异构图边的权重进行度量,并利用权重对异构图进行了优化,从而通过图嵌入的方法,更好地表达了用户和POI的特征信息。最后运用门控循环神经网络对用户签到序列信息进行建模,捕捉用户的动态兴趣演化,预测用户下一个兴趣点的访问概率,实现用户POI的TOP-K推荐。在两个公开数据集Gowalla和Brightkite上进行了相应的实验,结果表明,本文提出的模型在Precision@k、Recall@k、F1-socre@k指标上优于基准模型,有效地提升了兴趣点推荐的精度。在未来的工作中,将考虑整合用户情感等更多的上下文信息对模型进行改进,从而进一步提高推荐质量。