张 彬 徐建民 * 吴 姣
(1.河北大学管理学院,河北 保定 071002;2.河北大学期刊社,河北 保定 071002)
随着互联网、大数据和云计算技术的快速发展,数据呈爆炸式增长,信息过载问题日趋严重,跨域推荐通过挖掘、迁移并融合利用不同来源的知识为用户提供个性化推荐服务,近年来得到学术界和工业界的热点关注[1]。知识融合在跨域推荐中具有重要作用,可以在知识层面实现对数据的深度加工和有效利用[2],为跨域推荐问题研究与实践提供新的范式。
跨域推荐针对传统单域推荐的局限,从对辅助域知识进行融合的角度出发,利用多域的用户行为数据挖掘用户偏好特征,以提高推荐的准确性和多样性[3]。传统的信息推荐系统主要采用基于内容、协同过滤或混合推荐等算法为用户提供推荐服务,在单域推荐场景下取得了较好的效果;但随着数据规模的增大,进行精确推荐服务的难度提高,单域推荐的问题和局限也更加突出。首先是稀疏性问题,单域场景下的用户与项目的交互数据稀疏问题较为普遍,大数据环境下高维数据的稀疏性更加明显,给定用户或项目之间的相似性或相关性甚至为零,无法进行有效过滤,影响推荐效果[4]。然后是冷启动问题,大量的新用户或新项目进入推荐系统时,由于缺少必要的兴趣或评分数据,难以建立用户与项目的关联,推荐系统无法推断用户偏好进行推荐。大数据场景下,跨域推荐系统从更加丰富的知识源获取有效的用户偏好或项目特征信息,进行整合加工来丰富目标域中的数据,可以有效解决单域推荐面临的数据稀疏和冷启动问题,提高用户满意度,改善用户体验[5]。事实上,跨域推荐研究尚处于起步阶段,多数研究仅关注有两域或少数域间的知识迁移,较难应用于具有多辅助域的跨域推荐场景,对于外部知识、用户兴趣知识、社交网络知识等多源异构数据的知识融合利用和跨域交互等问题缺乏理论指导和系统研究。
知识融合的概念源于20世纪90年代的信息融合,现有文献对于知识融合的定义尚未统一[2]。以KRAFT项目为代表的文献认为[6],知识融合是指从众多分布式异构的网络资源中搜索和抽取相关知识,并转换为统一的知识模式,从而为某一领域的问题求解构造有效的知识资源[7]。知识融合是情报学领域的重要发展方向,是面向行业、面向领域或面向学科的复杂问题的解决过程,相关理论和实践的研究对跨域推荐具有借鉴作用[8]。跨域推荐本质上可以划分为跨域知识融合和利用知识推荐两个子问题,跨域知识融合是对多源知识进行有效整合、加工和利用的关键步骤,因此有必要从知识融合的角度出发,对目前跨域推荐的相关研究进行梳理和分析,以期对今后的跨域推荐和知识融合研究提供参考。
国外关于跨域推荐的研究由Winoto P等[9]首先提出,认为跨域推荐会比单域推荐更加多样化,可以提供更高的用户满意度和参与度,该研究确定了3个重要的问题:验证不同域中用户对项目偏好的全局相关性;设计模型利用用户在来源域的喜好来预测用户在目标域的偏好;制定适合跨域推荐的评价方法[5,10]。Li B等[11]、Azak M[12]也证明了跨域推荐能够解决单域推荐一直以来的冷启动和数据稀疏性问题。陈雷慧等[5]认为,跨域推荐模型设计与传统单域推荐系统类似,也由用户建模模块、推荐对象建模模块和推荐算法模块[13]组成,区别在于跨域推荐利用的是融合多个辅助域信息的数据,而不仅仅是目标域提供的数据资源。因此,如何有效地融合各域知识,并在不同域间对知识进行传递和利用,是跨域推荐研究中的关键问题。
跨域推荐研究中尚没有形成关于“域”的统一定义,学术界提出了多种关于“域”的划分依据,在具体研究中主要按照系统[11]、数据源[14]、项目概念[15]或项目类别[16]等方式划分域。较多研究者认可Li B等[17]的分类定义[5],按照系统域(System Domain)、数据域(Data Domain)和时间域(Temporal Domain)划分不同的域。系统域按照推荐项目所属的系统划分,如豆瓣和亚马逊网站属于不同的系统域;数据域按照多源异构的数据源划分,各数据源属于不同的数据域;时间域按照行为产生的时间跨度进行分片,各分片属于不同的时间域,适用于行为数据具有时间戳的场景。陈雷慧等[5]、陶鸿等[3]综合不同域划分的研究,在上述域分类的基础上提出了“概念域”的划分方式,按照推荐物品的类型或概念层次进行划分。知识融合主要针对不同的知识来源,多源异构的大数据环境下,不同的知识源可以划分为独立的数据域,不同系统域或时间域的数据也可根据推荐任务需求,定制或重组数据集到不同的数据域,因此基于知识融合思想采用“数据域”的划分方式更为合理。
国内部分研究者亦称“跨域推荐”为“跨领域推荐”[1,3,5],两种表述方式均源自英文“Cross Domain Recommendation”的翻译。在计算机术语中,“域”字的使用较为频繁(如网络域、控制域、域名和子域等),泛指具有边界的对象;《辞海》中“领域”二字释义为“学术思想或社会活动的范围”,范围相较于“域”窄,与“概念域”范畴较为接近。因此,在推荐对象属于不同概念域时(如图书、电影或音乐属于不同的类型),两种表述方式都适合。但是,如果按照数据域、时间域的划分方式,不同域中的项目可能会属于相同的概念域(如MovieLens、Netflix和豆瓣的推荐对象均为电影),此时使用“跨领域”表述不够准确。因此,从域的涵盖范围来看,“跨域推荐”比“跨领域推荐”的范畴更大,“跨领域推荐”只是利用概念划分域的一种特殊情况,不能涵盖所有域划分场景,本文统一采用“跨域推荐”的表述。
在跨域推荐中,根据两域之间用户知识和项目知识的重叠程度差异,分为不同的知识重叠场景。设两个域分别为DA、DB,两个域的用户集分别为UA、UB,项目集分别为IA、IB;同时出现在两个域的用户知识交集为重叠用户集,UAB=UA∩UB;同时出现在两个域的项目知识交集为重叠项目集,IAB=IA∩IB。
参照Cremonesi P等研究者关于协同过滤数据重叠的思想,可分为4种知识重叠情况[18-19]:
1)无用户重叠—无项目重叠(No User-No Item Overlap,NU-NI):两个域中不存在知识重叠,即UAB=∅且IAB=∅。这种情况下,由于缺乏可直接利用的共同知识,无法使用传统的推荐方法实现推荐。
2)有用户重叠—无项目重叠(User-No Item Overlap,U-NI):两个域中只有用户知识存在重叠,即UAB≠∅且IAB=∅。如用户在购买DVD和图书的数据有重叠或者使用关联的社交网络账号登录等,此种情况可采用基于内容的推荐或基于用户的协同过滤方法。
3)无用户重叠—有项目重叠(No User-Item Overlap,NU-I):两个域中只有项目知识存在重叠,即UAB=∅且IAB≠∅,此种情况可采用基于项目的协同过滤方法。
4)有用户重叠—有项目重叠(User-Item Overlap,U-I):两个域中的用户、项目知识均有数据交集,即UAB≠∅且IAB≠∅。该场景可把两个域的知识关联合并,把跨域推荐问题转化为单域推荐问题。
由于跨域场景以及推荐需求存在的差异,不同的跨域推荐任务在知识融合模式方面也有一定的区别:
1)单域推荐任务(Single-domain Recommendation Task,SRT):把域DA和域DB中的评分或相关知识进行简单结合,在同一个域中的项目和用户间进行推荐,即把域DA中的项目iA推荐到用户uA,或把域DB中的项目iB推荐到用户uB,推荐的效用函数为f(uA,iA)或f(uB,iB)。
2)跨域推荐任务(Cross-domain Recommendation Task,CRT):把域DA和域DB中的用户知识和项目知识进行交叉融合,向域DB中的用户uB推荐另一个域DA的项目iA(或向域DA中的用户uA推荐域DB的项目iA),推荐的效用函数为f(uB,iA)或f(uA,iB)。
3)多域推荐任务(Multi-domain Recommendation Task,MRT):把多个域中的用户和项目知识进行多实例融合,向多域(如DA,DB,DC…)的用户(uA,uB,uC…)推荐集合多域的项目(iA,iB,iC…),推荐的效用函数为f(uMD,IMD),其中uMD=uA∪uB∪uC,iMD=iA∪iB∪iC。
从对辅助域知识的处理方式来看,可分为知识迁移和知识聚合两类:对少数域的知识进行处理通常采用跨域知识迁移,对多个域的知识进行聚合、加工及相关数据处理为狭义的跨域知识融合。事实上,这两类处理方式都处于广义的跨域知识融合范畴。
基于协同过滤等传统技术的跨域推荐主要关注用户的评分数据,较少考虑辅助域中用户兴趣、项目属性或语义标签等其他维度的知识,部分研究者认识到知识维度缺失导致的局限,在评分知识的基础上,把其他不同类型的知识也引入到跨域推荐,丰富了跨域知识融合的研究范畴。跨域推荐中的主要知识融合方法包括聚类法、语义法、图模型法和标签关联法等。
基于聚类的方法通常针对同一类型、不同来源域的知识进行融合处理,以用户—项目的评分知识为主。在很多情况下,用户只对有限数量的项目进行评分,可用的评分数据可能非常稀疏,在实际的跨域推荐场景中,来自多个域的评分数据集可能很少包括相同的用户或项目,聚类方法能够弥补原始评分矩阵的不足,增强跨域知识的关联[20-21]。
Li B等[22]为了解决用户及项目不重叠跨域推荐场景下的数据稀疏问题,提出了一种基于聚类的密码本知识迁移方法。如图1(源自文献[22])所示,电影域(辅助域)的评分矩阵为Xaux,图书域(目标域)的评分矩阵为Xtgt,两个矩阵的评分均有一定缺失。该方法创建了评分数据密集域的评分模式,把原始评分矩阵中的用户、项目聚合为用户类和项目类,构建了用户—项目类的矩阵Utgt,项目—项目类的矩阵Itgt;使用一种等价于双向K均值聚类算法的正交非负矩阵三因子分解(Orthogonal Nonnegative Matrix Tri-Factorization,ONMTF)对辅助域评分矩阵进行矩阵分解,矩阵求解目标函数为:
图1 基于聚类密码本的跨域知识迁移
(1)
s.t.UTU=I,VTV=I
(2)
其中,W是一个与X形状相同的二进制加权矩阵,用以屏蔽未出现的项目。目标域评分矩阵的重建如图1所示。(图1、式(1)、式(2)及示例数据源自文献[22])。
(3)
Chen W等[24]在用户和项目聚类的基础上引入标签聚类,并把跨域推荐和社交网络知识进行了结合。Rafailidis D等[21]提出了一种跨域用户聚类和相似性学习联合推荐算法(Joint Cross-Domain User Clustering and Similarity Learning,JCSL),在计算基于用户和类的相似度时,使用联合目标函数进行自适应聚类。这些研究丰富了聚类法在跨域推荐领域的应用,为跨域推荐研究中用户、项目聚类提供了借鉴。
基于聚类的跨域知识融合方法主要用于协同过滤推荐的用户—项目评分知识聚合,由于原始评分数据比较规范,采用的矩阵分解或聚类等技术较为成熟,通过引入辅助域评分知识建立了评分知识聚类+协同过滤的算法组合,因此计算效率较高、可移植性较强,相对于单域协同过滤推荐具有一定的效果提升。但由于该类方法对评分数据的类型、质量和形式要求过于严格,知识类型单一,其本质只是同类知识的数据聚合,知识融合的层次较浅,较难应用于大数据环境下的多源异构复杂知识场景。
基于语义的方法起源于知识工程和本体论,主要思想是利用源域中的可用信息生成知识映射,然后将知识映射转移到目标域,根据生成的评级对项目进行适当地分类[19]。
Fernández-Tobías I等[25]根据用户正在访问或浏览的城市中的兴趣地点(Place of Interest,POI)与音乐之间存在的语义相似性,借助加权有向无环图建立两个域中的概念连接,为用户提供音乐推荐。链接兴趣地点和音乐艺术家的语义知识框架如图2(源自文献[25])所示,用户的源域特征为“兴趣地点”,目标域特征为“音乐艺术家”,兴趣地点和音乐艺术家分别代表了知识框架中的起止节点,框架目标是在基于DBpedia链接知识语义图中,自动发现实体从源域特征到实体之间的路径。
从兴趣地点实体到音乐家实体发现3种潜在语义路径:第一种路径通过“城市”实体连接兴趣地点和音乐艺术家,即可能存在在特定兴趣地点城市出生、死亡或居住的音乐艺术家;第二种路径通过“日期”实体连接兴趣地点和音乐艺术家;第三种路径以更复杂的方式进行连接,使用实体“关键词”关联建筑和音乐类别。
Nie W等[26]提出了一种面向社交网络平台视觉信息自动图像标注的跨域语义建模方法。首先,从采集到的文本信息中提取一组热点主题用于图像数据集的预处理;然后对提出的噪声样本进行滤波,去除低相关性的照片;最后,利用跨域数据集从用户生成内容(User-generated Contents,UGCs)中发现每个语义概念的共同知识,通过语义转移提升语义标注的性能。
(4)
其中,tk为每个辅助域分类器的权重。
Vf(x)的权重参数w使用最大边值法确定,如式(5)(源自文献[26]):
(5)
基于语义的跨域知识融合方法跳出了用户—项目评分的知识范畴,从语义相似度的视角出发,通过语义路径、概念联系或实体间关系,建立了多域用户与项目之间的关联,为跨域推荐提供了数据支撑。此类方法拓展了推荐来源知识的维度,不再依赖于评分数据,但需要原始数据中蕴含用户和项目的内容层面关联,或额外引入经过加工的外部知识,且针对不同来源及类型的语义挖掘算法需要进行定制研发,知识融合方法的通用性和可移植性不强。
基于图模型方法使用图来表示域中对象与其表征特征之间的关系,利用图的思想建立异构域间的知识连接[27]。
在跨域推荐中,域Di可以表示为二部图Gi={Vi,Ei},其中,Vi为图中节点的集合,由两类节点组成,包括ni个对象节点(包括用户节点和项目节点)和mi个特征节点;Ei为Di域中边的集合,边只存在于不同类型的节点之间,表示对象节点和特征节点之间的关联。令G0={V0,E0}为匹配图,其中,V0包括来自多域的所有特征节点,E0表示连接不同域特征的边集合。基于此图定义(m1+m2)×(m1+m2)连通矩阵X0,其中m1、m2分别为域D1、D2的特征元素数。
将多个域中的图进行合并,能够得到一个多部图G={V,E},当V=V1∪V2,E=E1∪E2∪E0时,G的结构如图3(源自文献[27])所示。各域用户节点和特征节点之间的关联关系可以定义为一个(m1+m2+n1+n2)×(m1+m2+n1+n2)的连接矩阵X(源自文献[27]),表示如下:
图3 跨两域的多部图结构
(6)
在图G中,不同域的对象节点之间没有直接的连接,用户节点和项目节点之间通过用户特征、项目特征才能建立关联。
基于图模型的跨域知识融合方法把推荐系统中的用户和项目对象转换为图节点,并利用图结构框架把用户特征、项目特征表示为特征节点,利用节点间的边关系建立了用户和项目的知识关联。由于图模型具有天然的结构优势和融合能力,能够建立多个异质域之间知识特征之间的联系,利用图传播等算法来度量不同域实体之间的全局相似度,进而实现多域间的跨域推荐。图模型方法拓展了知识融合的思路,为多域间的知识融合提供了理论指导,经典、成熟的图计算方法也能够在此基础上移植到跨域推荐中。由于用户及项目特征对于图模型来说尤为重要,而现有研究在知识特征提取方面不够充分,导致推荐效果的稳定性差异较大。
对于不同类型的资源(如书籍、音乐、电影或网页等),很难从中提取共同的特征来构建不同域之间的桥梁,标签关联是一种建立不同类型域间知识连接的有效方法[28]。
在标签关联推荐中,源域和目标域可定义为DS/DT={U,R,T,Y},其中U、R和T分别是用户、资源和标签的有限集,Y是它们之间的三元标签关系,Y⊆U×R×T。对于∀u∈U,Yu=u×R×T。
图4 用户兴趣知识
画像映射算法(Profile Mapping Algorithm,PMA)可以解决跨域推荐中目标域的用户兴趣数据稀疏和冷启动问题,其利用源域的用户数据生成目标域的用户画像。如图5(源自文献[28])所示,在已知源域中用户画像的情况下,可以从用户给定的画像数据中找到与目标域中每个标签最相似的标签,建立源域和目标域标签之间的关联。
图5 跨域用户兴趣标签映射
张彬等[29]提出了基于多源用户标签的跨域兴趣融合模型,首先把多个域中的用户兴趣进行标签化处理,然后利用跨域用户识别和标签权重归一方法得到多个域的用户实体—标签矩阵,最后使用域权重影响系数对标签进行融合,构造具有复合权重的用户兴趣标签集。通过实验证明融合模型能够有效提高标签用户覆盖效果,在查全率不断提高的情况下,融合域能够保持较高的标签用户查准率,有效提高用户兴趣特征的描绘效果。
基于标签的跨域知识融合方法在跨域知识特征提取和融合方面问题上具有较强的语义知识优势,共享利用含义相似的标签能够作为连接域的桥梁,蕴含语义信息的标签本质上是对用户或项目特征进行的知识提取和归纳,能够更好地表达和理解用户的偏好。现有基于标签的跨域知识融合方法能够较好地提取合并多域用户或项目特征,但对特征的聚合利用方法较为简单,未充分发挥利用标签进行跨域知识融合的优势。
近年来,知识图谱技术的出现为跨域知识融合研究提供了新的思路。知识图谱是一种有向异构信息网络,在跨域推荐中引入知识图谱能够把推荐系统的用户、用户兴趣、项目及其属性之间的关系进行语义关联和知识融合[30]。目前基于知识图谱的推荐研究主要集中在单域推荐场景,少数研究涉及多域数据,从知识融合的角度来看,主要分为基于路径的知识关联、基于嵌入的知识映射和基于混合方法的知识融合[31]。由于知识图谱本身就具有跨域基因,相关研究能够为跨域知识融合提供一定的借鉴[32]。
基于路径的知识关联方法主要关注知识图谱中项目之间的各种关联路径,通过节点路径的特征来挖掘知识图谱,捕获项目知识之间复杂且有意义的关系,为项目推荐提供辅助信息。Noia T D等[33]提出了基于语义路径的排名(Semantic Path-based Ranking,SPR)算法,从DBpedia链接开放数据中提取基于语义路径的特征,利用图的多关系结构建立用户知识和项目知识之间的连通性,并通过Web数据中的开放知识计算前N个推荐。实验证明了该方法的有效性,在数据稀疏的场景中尤为明显。Yu X等[34]提出一种融合异构信息网络的个性化实体推荐算法,将不同用户的异构关系进行组合,利用用户隐式反馈数据和个性化推荐模型提供高质量的个性化推荐结果。该方法首先引入基于元路径的潜在特征来表示用户和项目间各种路径的连通性,然后在全局和个性化两个层次上定义推荐模型,并使用贝叶斯排序优化技术对推荐模型进行评估,并实验证明了推荐方法的有效性。基于路径的方法融合了项目间的关联知识,以自然、直观的方式有效利用知识图谱网络结构,提升了推荐效果;但基于路径的方法多依赖手工设计的元路径,在不同场景实践中需要人工设计路径,现有方法如用在跨域项目推荐中算法复杂度较高,缺乏实用性。
基于嵌入的知识映射方法使用知识图嵌入算法把实体和关系映射到低维向量,再将其引入到推荐算法生成推荐列表。Palumbo E等[35]提出了一种从知识图谱中学习用户—项目相关性的推荐模型Entity2rec,从建立用户—项目和项目—项目关系的知识图谱出发,通过神经网络将用户属性值训练为特征向量,利用机器学习排序函数生成前N项推荐列表,并通过对比实验证明了该方法的有效性。Wang H等[36]提出了一种利用外部知识进行新闻推荐的深度知识感知网络(Deep Knowledge-aware Network,DKN)模型,该模型基于内容进行点击率(Click-through Rate,CTR)预测,以一条最新新闻和一个用户的点击历史作为输入,输出用户点击新闻的概率。该模型的知识感知神经网络(Knowledge-aware Convolutional Neural Networks,KCNN)把新闻的单词嵌入、实体嵌入和上下文实体嵌入视为多个堆叠的通道,并生成知识感知的嵌入向量。Zhang L等[37]提出了一个知识感知表示的图卷积网络推荐模型(Knowledge-aware Representation Graph Convolutional Network for Recommendation,KCRec),把知识图谱作为边信息的来源,有效地捕获用户间和项目间的关联性,建立了端到端的推荐框架。该模型通过在图中邻域之间传播的关系,聚合项目特征并获得用户偏好的表示,并进一步与图卷积网络集成,挖掘用户潜在的长期兴趣。在真实数据集上的实验表明,该方法能够有效地提高推荐性能。基于嵌入的知识映射方法不依赖元路径的设计,在利用知识图谱辅助推荐时具有较高的灵活性,但主流方法多为端到端的推荐框架,忽略了图谱中的多条连接,学习到的实体嵌入在描述项目之间关系时不够直观,推荐过程缺乏可解释性。
基于路径的知识关联利用了知识图谱中的实体连接关系,基于嵌入的知识映射能够学习图谱中的语义信息表示,但两类方法都具有一定的局限性,部分研究者结合两种方法的优势,基于混合方法进行知识融合,进而完成推荐任务。Wang H等[38]提出了一个端到端的知识图谱感知推荐框架RippleNet,将用户的历史用户看作知识图谱的种子集,通过知识图谱中的链接自动迭代扩展用户的潜在兴趣。该方法把知识图谱自然地融入推荐系统,通过偏好传播克服了现有基于路径和基于嵌入的知识图谱感知推荐方法的局限,通过实验证明了混合方法的有效性。Wang X等[39]提出了一个基于知识图谱的意识网络(Knowledge Graph-based Intent Network,KGIN)推荐模型,把用户意图建模为知识图谱关系的注意力组合,将来自多条路径的关系信息集成在一起进行关系路径感知聚合,相对于只有一种关系的嵌入推荐模型,在意图粒度上展示了与项目间的关系,并把关系路径编码到表示中,具有更好的性能和可解释性。基于混合方法的知识融合相较基于路径和基于嵌入的方法具有更优的效果,但同时也提高了模型的复杂度,并带来了更多的资源消耗。
基于知识图谱的跨域知识融合研究尚处于起步阶段,多局限于两域之间,随着大数据环境下的数据域叠加,模型构建的复杂度和难度也呈指数级增加,现有方法较难应用于具有多辅助域的跨域推荐场景,对于外部知识、用户兴趣知识和社交网络知识等多源异构数据的知识融合利用和跨域交互等问题缺乏深入研究。
大数据环境带来了多样化的跨域数据资源,使得采集利用多源异构数据成为可能,如何在跨域场景中有效地进行知识融合,为推荐系统提供知识支撑,成为数字时代的重要需求。现有跨域推荐中的知识融合方法从对单纯的用户—评分数据进行聚类,到引入语义信息的知识关联,研究者逐步认识到了从知识层面考虑跨域推荐问题的优势;具有多域结构优势的图模型,为跨域推荐中的知识融合方法提供了图挖掘算法支撑,基于标签的研究丰富了多域知识融合中的特征挖掘方法;知识图谱技术的快速发展,为大数据环境下的跨域知识融合和推荐研究带来了理论参考和方法集成,也为跨域推荐带来了新的契机。
上述研究拓展了跨域推荐的研究广度,开辟了知识融合在推荐领域的新视角,但从知识融合的角度来看,跨域推荐研究与多维知识挖掘的结合深度仍然有限,知识融合与推荐方法的适配组合缺乏系统分析和评价。与此同时,多源异构的大数据推荐场景变得越来越普遍,推荐需求变得愈加复杂,跨域推荐中的知识融合面临着新的挑战,这些问题也将会成为新的研究方向和热点。
1)增强跨域知识融合方法的可扩展性和可移植性。多数跨域推荐技术局限于各自特定的应用场景,后续研究需考虑在数据源结构、数据类型、数据规模变化较大的情况,如何进行灵活的迁移和扩展[5]。
2)对多维度知识间的关联进行深度挖掘。现有方法较多关注域内用户与项目之间的知识关联,后续研究对于不同域间的实体关联、具有语义知识的外部知识库、富含用户兴趣知识社交网络等因素考虑较少,这些复杂关系在跨域知识融合及推荐领域的作用未得到充分发挥。
3)提高跨域知识融合和推荐的可解释性。由于跨域推荐系统使用的知识较为分散,知识融合方法的复杂度相对较高,导致推荐结果的产生过程不够直观,未来研究会更加注重知识的融合过程的可视化,进一步提高可解释性。
4)完善跨域知识融合的评测指标。现有研究主要对跨域推荐性能的进行评价,较少关注跨域知识融合的评价,对知识融合前后跨域推荐的覆盖率、多样性和新颖性等指标的效果评价,也会成为未来的研究热点之一。
5)构建基于知识图谱的跨域知识融合和推荐框架。未来的跨域知识融合,将以构建跨平台、跨数据域的知识图谱为基础,整合多源异构知识,建立用户、兴趣标签、特征标签以及项目等类型实体关联的多部图跨域推荐框架,基于元路径和图嵌入方法为用户提供多辅助域的推荐服务,有效提升跨域知识融合和推荐效果。