基于图神经网络的会话型服务推荐

2022-03-19 02:00钟毅文伊方舟曾诚
电脑知识与技术 2022年2期

钟毅文 伊方舟 曾诚

摘要:随着互联网信息资源的爆炸式增长,“信息过载”问题日益突出,服务推荐被视为解决“信息过载”问题的一种有效手段。考虑到用户会话中的行为数据一定程度上代表着用户偏好,本文提出了一种新的推荐模型SRGNN,将用户会话中的点击序列抽象为一个有向的会话图,再利用主流的图神经网络对会话图的结构信息进行特征提取,同时使用门限循环神经网络(GRU)提取会话点击序列中的时序信息以及整个会话过程中的兴趣信息,并结合用户会话中最后时刻的兴趣信息为用户进行相关推荐。

关键词:图神经网络;会话型服务推荐;用户偏好;门限循环神经网络;信息过载

中图分类号:TP311      文献标识码:A

文章编号:1009-3044(2022)02-0088-03

人们已经从数据贫乏的时代,进入了信息共享化的时代,数据量也随之爆發式增长。虽然海量的数据蕴含着丰富的信息和巨大的价值,但是随之而来的也有严重的“信息过载” 问题。目前,解决“信息过载”问题最有效的方法是个性化推荐,例如电影推荐、音乐推荐和商品推荐等[1-2]。

推荐系统基于用户的特征及产生的行为数据,通过用户的评分、评论、投票等行为表征用户的偏好,然而在很多场景下,出于安全需求,用户的上述信息无法获得的。因此,基于用户历史行为记录的推荐不再适用,于是基于用户在某个会话期间内的行为数据就发挥作用,即基于会话的推荐(Session-Based Recommendation)[3]。基于会话的推荐是根据用户在当前会话过程中产生的会话行为序列,预测用户下一次可能会点击的物品,并将可能性最高的几个物品推荐给用户。

基于会话的推荐系统能够很好地解决用户匿名情况下的推荐问题,同时提升用户的体验感,增加平台的留存率。因此可以得到更好的推荐效果。

1 研究方法

本文提出一种基于图神经网络的会话型推荐模型。首先介绍基于会话的推荐场景,并对基于会话的推荐问题进行描述,接着将介绍本章模型的提出动机,并对模型中的图神经网络(GNN)和门限循环神经网络(GRU)介绍,然后将对模型的整体结构与实施步骤进行介绍,最后是实验结果分析。

1.1 基于会话的推荐场景

基于会话的服务推荐是根据用户在当前会话的交互过程中产生的物品点击序列,为用户推荐下一次最可能点击的K 个物品。如下图1所示,用户先后看了一双运动鞋、手机、耳机、手机和耳机。基于会话的推荐系统会根据用户当前会话中的物品点击序列,最终给用户推荐耳机和手机。

上述问题可形式化定义为:[I={i1,i2,i3,…,im}]是物品集合,[S={(ts,1,is,1),(ts,2,is,2),…,(ts,n,is,n)}]是用户一次会话的点击序列,其中[ts,n]会话序列s第n次点击发生的时间,[is,n]表示会话序列s第n次点击的物品。因此,本文推荐任务即为构建一个模型M,给定一个会话序列S,预测第n+1个最可能点击的物品[is,n+1]。

1.2方法描述

本文提出的基于图神经网络的会话型推荐模型(Session-based Recommendation with Graph Neural Network, SRGNN)主要由物品图神经网络层(Item Graph Neural Network)、门限循环神经网络层(Gated Recurrent Unit, GRU)和线性变换(Liner Transformation)组成,整体结构图如图2所示。

1.2.1构建物品会话图

首先获取用户会话中的物品点击序列信息,将其转换成一个有向的物品会话图[G=(I,E)],其中每个节点[ik∈I]表示物品,每条边([ik,ik+1])[ ∈E]表示用户在点击了物品[ik]后,又点击了物品[ik+1]。为方便后续图神经网络的学习,我们为每个有向会话图构建一个节点关系矩阵[A],并使用邻接矩阵存储有向会话图数据,同时对值进行归一化处理。

1.2.2获取物品嵌入向量表示

将得到的会话图喂入图神经网络中,通过对物品会话图中节点的结构信息进行学习,得到每个物品的嵌入向量[Ei]。学习以及更新过程的公式如下:

将物品嵌入向量[Ei]序列输入到 GRU 网络层中,通过对用户点击序列时序信息的提取与学习,得到嵌入向量[Sℎ],该嵌入向量包含了会话中的顺序信息,同时也包含整个会话期间,用户兴趣的偏移情况和全局兴趣信息。考虑到用户在会话的最后时刻点击的物品是用户在当前会话最后感兴趣的物品,因此,可以将用户在会话中最后时刻点击的物品的嵌入向量[S]表示作为用户在一次会话中的最后的兴趣信息,然后与[Sℎ]进行线性变换,得到融合了用户最后兴趣信息的向量表示。

1.2.3生成Top-k推荐列表

将用户得到的嵌入向量[S]与所有候选物品[Sℎ] 进行计算,得到每个物品的得分[Z],最后通过一个softmax 激活函数后得到输出结果清单,具体公式描述如下:

[z=SℎTS]

[y=softmax(z)]

模型使用交叉熵函数作为损失函数,其中,[yi]为真实值,而[yi]是预测值。

[Ly=−i=1nyilnyi+(1−yi)ln1−yi]

根据模型对物品预测的评分值大小进行排序,并生成 top-k 推荐列表推荐给用户。

2 实验与结果分析

2.1数据集

在公开的 Yoochoose 数据集和 Diginetica 数据集上进行实验。Yoochoose数据集由英国的在线零售商提供,并在 RecSys Challenge 2015 上公开发布。数据集的每条记录包含会话ID、商品 ID、商品类别以及时间戳四个信息。

2.2评价指标

在推荐领域,Precision@K 和 MRR@K(Mean Reciprocal Ranks, MRR)是两种常用的评价指标,不是一般性,我们也采用这两个指标进行评价。前者用于衡量基于会话的推荐系统的预测准确性,表示推荐结果列表中top-k个推荐物品中,有正确物品的比例;后者表示平均位置排名,加入了推荐物品位置的影响,即在推荐物品列表中物品的位置越靠前,则其值越大,反之越小。

[Precision@K=nℎitN]

[MRR@K=1Ni=1N1rank(i)]

其中, N 代表测试集的总样本数, rank(i) 表示第 i 个测试样本的推荐列表中正确物品所在的排列位置。

2.3基准方法

为了评估本文提出的模型的有效性,引入4 种已有推荐模型作為参照进行了对比。

POP[4]:是一种最简单的流行度预测方法,方法将数据集中出现频率最高的商品进行推荐。该方法思想简单,实现也不复杂,在某些场景中十分有效。

S-POP[5]:该方法将当前会话中最受欢迎的商品推荐给用户,随着会话的不断变化,推荐列表也会相应发生变化。

Item-KNN[6]:基于物品的 k-近邻算法,通过召回和会话最相似的物品进行推荐。主要通过计算物品向量之间的相似度,通常可以采用余弦相似度进行衡量。

NARM[15]:在循环神经网络会话推荐模型的基础上,加入了注意力机制。模型利用注意力机制从隐状态捕获用户在当前会话的目的,并结合用户浏览时的序列行为进行物品推荐。

2.4实验结果

本文模型的参数设定如下,初始学习率为 0.001,学习率衰减系数为 0.1,训练的Batch 大小为 100,迭代轮数为 10 轮。物品向量以及物品类别向量的维度均为 100 维,物品图神经网络嵌入表示层、物品类别图神经网络嵌入表示层以及 GRU 层的隐层节点个数均为 100。模型的损失函数使用交叉熵损失函数,使用 Adam 优化方法对模型参数进行求解。评价时,统一选用 K=20。

实验结果如表2所示,与其他4个基准模型对比,本文提出的模型在两个数据集上的表现均不同程度优于其他模型,并且相较于最好的NARM基准模型,在Yoochoose数据集上MRR指标提高幅度达5.76%,在Diginetica数据集上MRR指标提高幅度达4.76%。

综上,本文提出的基于图神经网络的会话型推荐模型在使用用户会话信息后,可有效提升推荐的准确率。

3总结

本文利用用户的会话信息,提出了一种基于图神经网络的会话型推荐模型,将用户的会话点击序列构建成有向的用户会话图,通过图神经网络对会话图的结构和信息进行学习及提取,使用门限循环神经网络提取会话点击序列中的时序信息以及整个会话过程中的兴趣信息,并结合用户会话中最后时刻的兴趣信息为用户进行推荐。为验证模型的有效性,在公开的 Yoochoose 数据集和 Diginetica 数据集上进行了对比试验。在 Precision 和 MRR 两种评价指标上,均证明了本文提出模型的有效性。

参考文献:

[1] Linden G,Smith B,York J.Amazon.com recommendations:item-to-item collaborative filtering[J].IEEE Internet Computing,2003,7(1):76-80.

[2] 黄立威,江碧涛,吕守业,等.基于深度学习的推荐系统研究综述[J].计算机学报,2018,41(7):1619-1647.

[3] Hidasi B,Karatzoglou A,Baltrunas L,et al.Session-based recommendations with recurrent neural networks[EB/OL].2015

[4] Phuong T M,Thanh T C,Bach N X.Combining user-based and session-based recommendations with recurrent neural networks[C]//Neural Information Processing,2018:487-498. DOI:10.1007/978-3-030-04167-0_44.

[5] Davidson J,Livingston B,Sampath D,et al.The YouTube video recommendation system[C]//Proceedings of the fourth ACM conference on Recommender systems - RecSys '10.September 26-30,2010.Barcelona,Spain.New York:ACM Press,2010:293-296.

[6] Li J,Ren P J,Chen Z M,et al.Neural attentive session-based recommendation[C]//Proceedings of the 2017 ACM on Conference on Information and Knowledge Management.Singapore Singapore.New York,NY,USA:ACM,2017:1419-1428.

【通联编辑:唐一东】

2765500511379