移动社交网络情境化推荐关键问题研究综述

2020-12-19 18:13刘海鸥黄文娜张源强苏妍嫄
小型微型计算机系统 2020年9期
关键词:异构信任个性化

刘海鸥,黄文娜,张源强,苏妍嫄

1(燕山大学 经济管理学院,河北 秦皇岛 066004) 2(东营区人力资源和社会保障局,山东 东营 257000)

E-mail:3672402@qq.com

1 引 言

移动互联时代海量数据的规模化、隐性知识的价值性以及数据分析的高效性显著提高了大数据价值的外显性和应用性,大数据挖掘已成为信息服务范式发展的重要内容.大数据是数据维数和数据量大到传统的数据处理方法难以对其进行有效处理、挖掘的数据集合,其中的移动社交网络大数据是随着微博、微信、签到、网络社区、LBS等社会网络的普及而产生的多源异质、动态异构的海量信息[1].传统的个性化服务模式很难适应目前动态、异构的移动社交网络推荐研究,也无法满足用户情境感知的个性化需求,亟需提出深度挖掘移动用户情境属性的特征提取方法,构建融合多源异构情境特性的移动社交网络推荐模型.总体而言,移动社交网络推荐服务面临如下几方面挑战.

首先,移动社交网络大数据的处理存在较大的困难.移动终端具有较高的移动性和灵活性,推荐系统需要实时处理用户频繁交互而产生的大规模异构情境信息,这势必会增加推荐系统算法计算的复杂度,而传统的数据处理方法无法对移动社交网络异构大数据进行有效地挖掘,亟需开发新的数据处理模型算法.其次,情境特征提取技术制约了移动社交网络用户行为模式的深入挖掘.当前的情境特征提取与情境挖掘方法尚未达到理想的准确率要求,特别是在移动环境下,移动社交网络信息交互方式多样,用户的信息引用、转发导致语义分析更为困难.而当前技术难以对移动社交网络异构大数据进行情境特征提取和挖掘,应通过提取用户的情境特征来深入挖掘其行为模式,基于情境关联分析发现与用户当前情境语义最为关联的个性化服务资源.最后,移动社交网络大数据的多源、海量、异构特性使得传统的个性化推荐模型不再适用.当前个性化推荐研究大多针对传统集中式、依靠Web支撑的社交网络,随着移动互联网络的飞速发展,社交网络与无线移动通讯技术相融合的各种平台不断涌现,移动社交网络消解了空间距离和个性化服务的时滞性,让用户随时随地、随心所欲进行沟通交流;移动社交网络的定位、信源确认等服务,增加了在线社交网络平台的可信度;借助移动互联网的上下文识别、情境信息挖掘感知、终端个性化等特点,用户个性化需求、兴趣探索等逐渐成为移动社交网络发展新的风向标,最终实现信息的个性化表达和商业价值.

通过上述分析可以发现,传统的数据处理方法在面对移动社交网络异构大数据时已力不从心,亟需开发新的数据模型算法,以精确抽取移动社交网络用户历史行为、情境特征、社会化关系等价值数据.特别是移动互联新生态的到来,使得人们已不再满足于单纯的社交活动.如何在移动社交网络推荐系统中引入大数据多源异构情境信息参量,根据用户的兴趣和偏好自主地发现相关度较高的社会化信任关系,据此提供情境特征挖掘与信任关系融合的移动社交网络个性化推荐服务,具有重要的理论意义与现实价值.

2 移动社交网络情境化推荐的大数据处理问题

移动社交网络情境化推荐是系统融合移动社交用户的个人兴趣以及情境信息,将其加工为能够生动描述用户情境偏好的知识元,并应用于移动社交网络的个性化推荐服务领域,以此为用户提供与其情境需求最为匹配的服务资源.需要指出的是,随着用户数量的增多,推荐算法的计算量成线性加大,其性能也越来越差,加之响应速度、海量数据的并行处理与计算成本问题也难以解决,极大限制了个性化推荐在移动社交网络大数据环境中的使用.目前,大数据处理的策略包括数据分治、增量学习、并行挖掘等.本文将从上述几方面详细阐述移动社交网络情境化推荐的大数据处理相关进展.

2.1 移动社交网络大数据的分治

数据分治是近年来大数据处理经常采用的一种策略,具体是将规模较大、难以处理的数据集分割为几个规模较小、相似的问题,然后采取各个击破的方式分而治之.如文献[2]基于分治的思想,通过将复杂的CNF表示问题划分为多个子问题来进行求解,从而在很大程度上降低了原先计算的复杂度.文献[3]在研究中通过数据分治方法提出了一种并行的双向图匹配算法,最后以较小的计算代价获得了更高的图匹配精度.文献[4]提出基于分治策略的视频内容情感提取框架,实验证明,该框架模型能够更为准确地反映用户情感内容,有利于提取用户的情感特征和个性化偏好.文献[5]探讨了并行支持向量机以及机器学习的大数据分治策略,证实了分治在大数据处理于挖掘方面的有效性.此外,文献[6]针对数据分治难以确定大数据置信区间的问题进行了研究,分析了数据分治边界的确定问题,从而在保持数据分布的前提下给出理想的数据分治边界确定策略,并就大数据分治后的输出误差进行了讨论.文献[7]为解决大规模数据集最小代价属性选择方法存在的效率问题,提出了基于误差数据的最小代价属性选择分治算法,将数据集拆分为独立的子数据集,将计算效率提高了30%.文献[8]提出一种基于分治策略的多姿态人脸识别框架,并在CMUPIE和FERET人脸库中验证了该框架对姿态变化的有效性.文献[9]重点研究了数据分治中的划分方法,提出了近似解代价模型,减少了分布式节点之间的数据通信和同步开销.

通过上述分析可以看出,数据分治思想可以在很大程度上降低大数据处理的复杂度,也取得了较好的应用效果,但移动社交网络大数据分治后易出现的数据类型片面化和分布单一化问题.如何融合移动社交网络大数据分治后的输出结果,并保证其误差在可接受的范围内,是移动社交网络异构大数据分治面临的主要问题.

2.2 移动社交网络大数据的增量学习

增量学习是一种解决大数据挖掘的有效策略,主要通过学习算法的记忆功能来优化学习算法参数,从而进行有效的大数据处理.极速学习机(Extreme Learning Machine,ELM)是文献[10]提出的一种新型的增量学习方法,也是一种快速的单隐层神经网络,ELM算法不仅学习速度快,而且有更好的泛化性能.文献[11]总结了ELM近年的发展,包括在线序列ELM、增量ELM、集成ELM等方法,证明了ELM是适用于各种随机节点的通用逼近器,且无需任何先验知识即可根据任何连续概率分布生成所有隐藏节点参数.在此基础上,文献[12]在研究中提出一种大数据分类的弹性极化学习机,指出ELM学习方法与传统的增量学习方法相比能够显著提高大数据挖掘和聚类的性能,优化了大数据处理的分类效果.文献[13]通过研究发现,将大数据集分解成若干小数据集,通过MapReduce实现ELM的并行学习,可提高大数据的学习速度.此外,文献[14]构建了分布式环境下无监督学习的大数据ELM学习模型,并探讨了大数据不确定削减的ELM集成学习机制.文献[15]利用ELM对大数据进行了动作特征学习与识别,证明了ELM在大数据增量学习中的普适性.文献[16]提出正则化理论可以有效地解决标准ELM算法出现的过拟合和鲁棒性问题.文献[17]考虑了建模过程中误差的分布,提出概率正则ELM算法来保证误差和噪声分布的一致性.文献[18]在ELM中引入多图学习方法,提出了自适应多图正则化半监督算法AMGR-SSELM,可以自适应地为图分配权重,但训练时间比单一图的SS-ELM算法要高.文献[19]将ELM扩展到深度学习中,成为人工智能领域的新的研究热点.文献[20]归纳总结了ELM理论和应用的最新国内外研究成果,对主要的学习算法和模型进行了梳理,在此基础上指出深度ELM网络框架能为移动推荐算法的改进带来新的解决思路.

需要指出的是,移动社交网络大数据的非结构化和异构特性会降低ELM学习的记忆功能,导致推荐系统的记忆能力和泛化能力较弱,最终影响数据处理算法的挖掘性能.此外,ELM难以过滤移动社交网络大数据的冗余信息,不能有效解决高维数据建模问题,因此在移动社交网络大数据情境特征提取方面面临的困难较大.

2.3 移动社交网络大数据的并行挖掘

传统的机器学习和数据挖掘算法不具备大数据并行处理的能力,并行挖掘技术的出现显著改善了移动社交网络大数据学习和挖掘的性能.Facebook、Amazon、Yahoo、Apache基金会和Google等分别推出了专门针对海量文件并行挖掘的Haystack、Dynamo、PNUTS、Hadoop 和MapReduce.其中,Hadoop是一个分布式系统基础架构,同时也是目前最为流行的大数据处理平台,目前学术界主要聚焦其平台性能改进、系统耦合、数据处理与挖掘、个性化推荐领域;MapReduce则是谷歌开发的一个并行处理框架,由于具有并行计算、跨异构平台优势、高扩展性和容错性特点.文献[21]基于MapRedue框架提出了粗糙集知识获取方法的并行化挖掘,并认为并行粗糙集算法是非结构化数据挖掘的未来发展方向.文献[22]针对大数据情境化推荐面临的推荐稀疏性问题,构建移动SNS信任模型,从聚合与同引社交网络信任双重维度挖掘移动SNS潜在的用户信任关系,基于此进行云计算Mapreduce化的并行推荐,并取得了良好的大数据处理效果.文献[23]在实验过程中利用大数据处理框架对移动社交网络大规模数据进行聚类,由此提出基于密度的分布式聚类方法MRCSDP,实验表明该算法能更迅速有效地处理.文献[24]结合Hadoop云环境提出一种面向移动社交网络大数据的K-means聚类方法,该方法利用MapReduce中的Map任务完成一次K-means算法迭代,由此获得一个局部聚类中心,然后再通过Reduce任务进行二次聚类,如此反复直到聚类结束;与经典的并行K-means聚类方法相比,该移动社交网络大数据的K-means聚类方案效率更佳,聚类精准度也更高.文献[25]在研究过程中考虑到Slope One算法在移动社交大数据处理方面的不足,提出一种基于并行Slope One算法的新型微博信息推荐模型,经过实验证明该算法具有良好的加速比和扩展性,可以更高效地处理微博数据.文献[26]提出一种基于大数据并行处理框架的互信息文本特征选择机制,引入熵的思想对传统的互信息计算公式进行修正,使特征词选择更加得当,从而提高后期分类精度;同时,利用大数据并行处理技术缩短了移动社交网络文本大数据的训练和分类过程,显著提高了分类的精度和执行效率.文献[27]通过研究分析比较了MapReduce和Spark的优缺点,结果表明,MapReduce在处理非迭代问题时的性能较为优越,而Spark在处理迭代或低延迟问题时能有效减少数据传输与同步次数,两种架构在大数据领域都起着重要作用.可以看出,面对社交媒体带来的丰富社会化网络数据,移动社交网络推荐系统需要拥有比传统推荐系统更为强大的数据处理能力.因此,当前学术界关注的目标之一就是如何基于大规模数据系统架构建立多源异构大数据并行挖掘模型,从而提高推荐系统大数据挖掘的效率.

综上所述,移动社交网络推荐过程中的异构大数据处理受到了学者的广泛关注,并取得了一些有价值的成果,但还存在以下问题:

1)如何解决移动社交网络异构大数据分治后出现的数据类型片面化和分布单一化问题,从而解决数据挖掘算法的失效和表现失常.

2)移动社交网络大数据的异构特征往往会损坏传统增量学习算法本身的记忆功能,导致推荐系统的记忆能力和泛化能力较弱,从而降低大数据增量学习的挖掘性能.

3)ELM难以过滤移动社交网络大数据的冗余信息,不能有效解决高维数据建模问题,亟需解决移动社交网络多源异构大数据情境特征提取与融合方面的难题.

3 移动社交网络情境化推荐的情境信息融合

融合情境信息的推荐是在变化频繁的情境下基于资源特征和用户兴趣的深层次挖掘来预测当前情境下与目标用户最为匹配的项目,可从海量、过载的网络资源中高效过滤出符合用户个性化需求的信息资源,因此在海量数据的移动环境下具有广阔的发展空间.这里的“情境”也译为“情景”或“上下文”,文献[28]对情境的定义目前被广泛引用:“情境是指描述某个场景中实体特征的各种信息”.在此基础上,情境又被进一步细化为用户情境、时间情境、物理情境、计算情境、社会情境等.情境的引入对完善个性化推荐系统的推荐机制起到了积极作用.文献[29]指出移动互联网的发展为个性化推荐的研究提供了全面实时的情境信息,能否把情境因素引入移动社交网络推荐系统在很大程度上会决定个性化推荐的质量.文献[30](1)http://sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-791/paper6.pdf通过研究指出时间、位置和天气等不同的情境信息要素会对推荐系统产生不同程度的影响,因此在进行多维情境推荐时需要深入探讨不同情境要素对推荐结果的影响.文献[31]通过研究也证实了在某些变化频繁的环境中,融合情境的用户行为模式可以在一定程度上改善对用户的预知能力.

基于上述研究,文献[32]采用图论和随机游走方法对移动社交网络用户个性化浏览行为进行建模,通过融合用户情景为用户提供移动音乐的情境化推荐服务.文献[33]构建了增强情境上下文的推荐服务框架,基于此对移动社交网络推荐过程中的上下文感知服务质量进行预测与推荐.文献[34](2)https://vbn.aau.dk/ws/portalfiles/portal/90989735/recsys2010_cars_workshop.camera_ready.pdf.将情境相似度作为权值引入基于最近邻的协同推荐方法中,利用最近邻用户在相似情境下的选择来对移动社交用户的行为进行预测.文献[35]指出在微博用户浏览新闻时,用户对新闻的偏好并非是一成不变,而会受到用户所处情境的影响,由此设计了引入情境信息的微博新闻推荐系统,在考虑用户情境偏好的基础上为用户推荐最为相关的新闻信息.文献[36]开发了基于位置感知的移动社交网络推荐服务系统,通过交互地图发现用户所在位置附近的相关资源,并对用户进行推荐.文献[37]构建了大数据深度融合的移动情境化推荐系统,通过深度融合用户的情境信息,有效缓解大数据环境下评分数据稀疏导致的推荐性能下降问题.文献[38]提出的TimeSVD++算法推进了情境领域的进一步深入研究,他将位置情境引入到用户偏好相似度计算中,由此构建了基于位置情境的移动社交网络推荐模型.文献[39]考虑到上下文情境对用户认知行为与偏好的影响,由此提出了基于用户认知行为与上下文情境的偏好获取方法,并将其成功应用于移动社交网络情境感知推荐系统中.文献[40]系统化梳理了情境在移动推荐服务中的作用,论证了融合多维情境的移动情境感知服务系统可以提高个性化推荐的准确性,并认为随着社交网络的发展,移动社交网络情境的研究将越来越重要.

基于上述分析可以看出,融合情境信息的移动社交网络推荐是当前一个重要的研究方向.情境关联分析有助于深入剖析服务资源与用户所具有的自然属性、社会属性、交互行为属性等,由此能识别、抽取可体现用户情境兴趣的相关信息,从而挖掘出用户的情境行为模式,明晰情境与用户行为间的关联关系与相互影响机制.因此,将情境信息引入协同过滤推荐算法,结合大数据处理技术深入探讨其情境化协同过滤推荐机制,可有效改进协同过滤在海量移动数据环境下的执行效率,显著提高移动社交网络推荐系统的规模性与可扩展性、对多源海量数据的信息萃取能力和利用效率.

需要指出的是,移动社交网络推荐系统面临着多源异构的海量情境信息,通过对这些海量情境信息的整合、分析,将为个性化推荐带来新的知识发现与价值创造.但目前基于情境挖掘视角探讨大数据异构移动社交网络推荐服务的研究还比较匮乏,鲜有面向移动社交网络异构大数据的情境化挖掘相关论述.

4 移动社交网络情境化推荐的信任关系挖掘

大数据时代的来临以及数据密集型科学研究范式的兴起使移动社交网络推荐存在的“数据稀疏性”问题备受关注.随着移动推荐系统中的项目种类以及使用用户数量的增多,用户-项目评分矩阵的维度不断增加,且大数据环境下许多用户间共同评分项缺失的现象比较突出,导致评分矩阵极端稀疏,这显著降低了移动社交网络推荐系统的精准度.社会化信任推荐较好地融合了社交网络用户的个性化偏好与用户之间的信任关系,在一定程度上缓解了传统推荐系统面临的冷启动与数据稀疏性问题.如文献[41]在研究中系统引入了用户间的信任关系,以此来对移动社会化推荐系统的数据稀疏性进行优化.文献[42]在内容协同过滤推荐的基础上融合了社会化信任关系,通过挖掘目标用户对不同社交关系的信赖程度,以此来推荐其最为信任的检索结果.文献[43]提出了基于邻域相似性的移动社交网络概率矩阵分解模型,以缓解数据稀疏性,提高推荐算法的准确度.文献[44]将直接信任作为一种检测机制,并提出一种基于信任检测和服务推荐两种互补机制的Web服务分散式发现方法,提高了推荐系统的响应率.文献[45]针对移动社交网络用户相似性与感知信任度量难、多源信任不易融合等问题,结合直觉模糊集构建感知信任模糊融合模型,完善了移动社交网络信任融合方法.

尽管直接信任提高了推荐效果,但显示反馈仍然具有数据稀疏性的问题.如文献[46]提出以移动社交网络用户浏览时的停留时间、主页交互次数等非显示的形式来对间接信任关系进行表征,由此可解决推荐过程中的信任数据稀疏问题.文献[47]在研究过程中有效结合了直接信任与间接信任,由此提出了基于移动社交网络用户信任行为的个性化推荐算法.文献[48]系统计算了移动社交网络用户对其好友的直接信任关系与间接信任关系,基于此建立了协同过滤推荐的置信模型,围绕信任关系与信赖好友的评分进行个性化推荐.文献[49]指出现有基于信任的推荐算法假设用户是单一和同质的,且相似关系和信任关系的融合缺乏高效的模型,据此设计了可信的移动社交网络推荐模Trust-PMF,在FilmTrust、Epinions两个数据集上均验证了模型的高效性.文献[50]指出传统推荐算法或是没有充分挖掘间接信任在社交信息中的价值,或是存在信息传递路径不充分的问题,据此设计了考虑移动社交网络用户间接信任的推荐算法GITCF,利用IpmTrut计算间接信任,并在Matlab仿真平台上进行实验,结果表明该模型的推荐精度有了显著提高.文献[51]基于目标用户所处移动社交网络中存在的间接信任关系,提出融合用户间接信任关系与信赖评分的概率矩阵分解推荐模型,有效改进了大数据环境下移动社交网络推荐的准确率,在一定程度上完善了社会化信任推荐与情境化推荐研究的理论体系.

通过对上述文献分析可以看出,基于移动社交网络发现用户信任的朋友集合相对于寻找相似用户集合更为容易且得到的数量更大,将信任关系融入到个性化推荐领域可以有效解决数据稀疏等问题.因此,可将信任推荐看作是传统协同过滤推荐的进一步延伸.由于移动社交网络用户所面临的环境比传统环境更为复杂,数据特征也更为多样,只有在充分融合移动社交网络多源异构数据并进行深度挖掘后,才能生成更为精准的个性化推荐.但当前的推荐算法很难较好地解决多源异构大数据的处理和挖掘问题,大规模社会网络分析处理的研究也有待进一步完善.如何快速处理移动社交网络形成的丰富数据是移动社交网络推荐的一大难点.

同时,移动社交网络推荐的信任关系在属性确定和量化方面还面临较多的问题,目前也没有统一的标准能够对社交网络用户间的社会关系及其信任程度进行表述.此外,大数据海量信息环境下,可能仅有少量好友与目标用户存在相互的信任关系.若仅仅依靠这些原始的、少量的信任关系进行个性化推荐,将难以获得理想的个性化推荐结果.如何在稀疏信任信息中挖掘出有价值的潜在信息并在此基础上改善信任推荐的性能,成为制约移动社交网络情境化推荐发展的瓶颈.

5 总结与展望

在移动互联网通讯技术飞速发展、海量个性化需求不断驱动的时代背景下,移动社交网络情境化推荐系统受到学术界和业界的广泛关注并取得了一定的进展,但仍是一个充满挑战的热点研究领域,主要包括:

5.1 推荐系统多源异构数据处理

大数据技术的进步为移动社交网络推荐带来了海量的信息资源,并以数字化的形式将用户行为模式沉淀于“移动云端”.而传统的推荐系统数据处理方法难以有效处理移动社交网络的海量信息,不能有效解决用户频繁交互所产生的海量异构数据,同时在移动社交网络用户多维特征提取、即时兴趣建模等方面困难较大.通过文献梳理可以看出,已有的研究成果中涉及的现有代表性分类方法如ICA、RNC以及Gibbs等,部分是基于小规模移动社交网络数据进行测试验证,或者从数据集缩减、聚类、降维等方面解决大数据处理问题[52],如采用物理学中的张量概念来对移动社交网络大数据进行表征,通过多阶张量表示大数据结构来对数据特征向量进行降维处理,以此提取数据的情境信息,但当前研究提出的多是静态的大数据张量模型,对动态背景下的多源异构大数据张量模型考虑不足.同时,移动社交网络大数据的多源异构特征还会损坏传统学习算法的记忆功能,分治后易出现数据类型片面化和分布单一问题,从而导致数据挖掘算法失效,降低大数据的挖掘性能.因此,如何设计出快速有效的移动社交网络异构大数据处理算法,同时挖掘出大数据蕴含的关键特征信息并应用于用户推荐的精准匹配,成为移动社交网络情境化推荐亟需解决的关键问题.

此外,当前移动社交网络推荐涵盖的数据源广泛,交叉混合的数据源间存在异构型,且移动社交网络数据、应用对象、用户属性以及用户属性值间也面临着异常复杂的交互耦合关系.上述这种形式的数据也被称为“非独立同分布数据”,即这些数据是非独立同分布的.当前大多数挖掘与推荐算法都假设其面向的数据是独立同分布的,这就难以解决个性化推荐过程中的耦合关系分析问题.鉴于此,操龙兵教授[53]提出了非独立同分布学习的概念,具体包括属性值、属性、对象、数据源、方法及模板的学习,在此基础上又进一步提出了非独立同分布推荐方法.非独立同分布推荐思想的提出实现了传统推荐范式从独立同分布推荐到非独立同分布推荐的转化,由此可构建相关性更高、可操作更强的个性化推荐系统.在此基础上,操龙兵教授进一步从非独立同分布学习的角度深入分析了移动社交网络用户的耦合关系与社交群组关系,由此提出基于群组的社交矩阵分解推荐模型,该模型可有效解决推荐系统存在的多维数据处理与交叉领域推荐等问题,并在推荐系统多源异构数据处理方面取得了较好的应用效果.

5.2 推荐系统动态行为建模与情境特征深度挖掘

许多传统的推荐模型利用目标用户的静态行为特征进行个性化推荐,这在用户需求没有发生显著变化或者偏好相关的情境下是可行的.移动社交网络环境下,移动社交网络用户对个性化推荐系统的要求更高,不仅仅局限于推荐结果的准确性,还要在时间、空间、地理位置、社会环境等方面具有普遍的适应性,这就要求推荐系统对用户兴趣变化反应快、处理短期兴趣、处理变化很大的项目属性、情境敏感、动态画像等[54].情境化推荐基于对服务资源特征和用户情境兴趣的深层次挖掘来预测当前情境下与目标用户最为匹配的项目,可在频繁变化的环境中协助移动社交网络用户从海量、过载的服务资源中过滤出最符合其个性需求的服务资源,情境化挖掘也成为大数据时代移动社交网络用户个性化服务领域新的学术生长点.但是,移动社交网络用户间的即时互动信息会产生大规模的异构情境信息数据集,这些异构情境信息的融入势必会进一步增加移动社交网络推荐系统算法的计算复杂度,并且会加大情境特征提取与融合推荐的难度.目前,学术界关于移动社交网络异构大数据情境挖掘的研究还比较少,尚缺乏基于移动社交网络异构大数据分治、情境语义增量学习与相关性挖掘的学术文献.

此外,传统的个性化推荐系统多采用浅层模型对用户偏好行为进行预测,依赖专家人工设计特征和提取特征,很难有效挖掘到深层次的用户和项目隐形特征表示.深度学习是在数据样本的基础上通过训练、强化得到的具有较强学习能力的深度网络结构,借助深层结构模型对原始数据进行处理,通过逐层特征属性提取来改进知识的聚合效率,以此提升预测的准确性.凭借其在复杂数据处理、特征提取、抽象概括、个性化匹配等方面的优势,深度学习在解决推荐系统情境特征深度挖掘方面取得了一定成效.因此,基于深度学习方法挖掘移动社交网络用户的深层次行为特征将是未来研究的一个发展方向,如基于深度学习与系统管理推荐方法建立两者间适度的知识迁移机制[55],引入模型泛化误差[56]等进一步强化情境化推荐过程中的深度特征学习等,这将在一定程度上改善用户-项目相关特征的深层次表示,提高推荐的精度.

5.3 推荐系统的数据稀疏性和冷启动问题

多源异构大数据的引入为移动社交网络推荐带来更为严峻的数据稀疏性问题.推荐系统需通过高维矩阵/多维度向量来计算移动社交网络用户的情境偏好程度,但由于目标用户与多个情境维度的关联度为零,使得高维矩阵中绝大部分元素的值为空.如何利用极少部分非零的用户情境偏好得到精确的个性化推荐结果,成为移动社交网络推荐系统的难点之一.同时,推荐系统还存在冷启动问题,当推荐系统中存在新的或者是从未被调用的服务,则难以找到历史执行信息进行预测.虽然研究表明基于情境的协同过滤推荐可以在较大程度上缓解冷启动问题,但由于获取用户情境偏好的难度比获取不含情境信息的用户偏好更大,因此在实际应用中冷启动的问题依然存在.

移动社交网络中的用户关系尤其是信任关系为建立用户特征模型提供了新思路.推荐系统可以基于移动用户的社会化关系对新加入项目进行自动推荐与传播[57],也可以利用相似场景下的好友偏好来预测目标用户在类似场景下的行为偏好.大量研究者把情境数据引入推荐建模,以此获取更加精确的用户偏好,缓解推荐的数据稀疏性和冷启动问题.但目前基于情境挖掘与信任关系量化视角探讨个性化推荐服务的研究还比较匮乏,大数据异构移动社交网络情境化信任推荐的相关研究成为亟需解决的问题.此外,融合用户在不同网络平台上的数据可以建立跨领域信息融合的推荐模型,即利用多源数据融合的优势来挖掘用户的个性化偏好[58],以此克服单一领域信息挖掘的不足,同时缓解数据稀疏和冷启动问题.因此,移动社交网络多源、异构大数据挖掘的个性化推荐将是今后研究的一大趋势.

5.4 推荐系统社交属性信息的确定和计算

推荐系统社交属性信息是指能对用户偏好产生作用和影响的社会关系信息以及用户个体属性信息.其中,移动社交网络推荐系统中的个体属性信息相对较为明确,但虚拟网络环境下的社会关系则较为模糊,且其量化还没有形成统一的标准.在具体的研究过程中,有学者在移动社交网络推荐算法的参数学习与设置层面体现出用户信任关系[59],也有研究通过用户互动内容的语义来表征其信任程度,并通过用户互动频率及次数来对其信任值与社会关系进行量化[60].对此,可在用户存在少量初始信任关系的环境下,引入文献计量分析中的“聚合相关”与“同引相关”的思想,基于此定量挖掘移动社交网络用户间的潜在社会信任关系,从而使更多值得信任邻居参与到移动社交网络推荐过程中.

需要指出的是,当前对社交网络信任计算的研究多建立在用户信任关系可以进行传递的前提下,但要实现信任传递,只能在用户关注的领域内进行,其不关注领域是无法进行信任传递的.换言之,用户对邻居用户的信任值会随着关注领域、时间等的变化而改变,即情境会对用户的信任值产生影响,可通过融合情境信息来对用户的关注领域进行有效划分,以此计算出对应的信任值,从而探讨不同情境下用户对同一项目的信任推荐.此外,国内外社会化推荐的相关研究多着手于用户间的正面关系探讨,即基于用户的信任关系进行推荐,但在现实中还存在负面关系(不信任或不喜欢),有研究建立了社交网络的不信任概念模型[61],利用用户间的负面关系进行推荐,并指出负面关系推荐甚至比正面关系推荐更为重要.但当前对不信任的研究还处在初级阶段,如何有效地衡量用户之间的负面关系和不信任值还有待进一步的探讨.

6 结束语

大数据环境下的移动社交网络情境化推荐引起了国内外学者的广泛关注.如何有效挖掘移动社交网络大数据并利用用户间的社会化信任关系来缓解传统推荐系统面临的多源异构、动态冗余以及价值稀疏等问题成为研究的关键所在.本文系统梳理了近年来移动社交网络情境化推荐系统的研究成果,对其面临的大数据处理、情境推荐、信任挖掘等关键问题进行了文献综述,最后针对移动社交网络情境化推荐领域未来研究方向进行了展望.这对于厘清移动社交网络情境化推荐系统研究脉络、为后续研究提供参考、推进我国个性化信息服务的发展具有一定意义.

猜你喜欢
异构信任个性化
ETC拓展应用场景下的多源异构交易系统
试论同课异构之“同”与“异”
一种融合PageRank和PersonalRank的多层个性化推荐算法
坚持个性化的写作
多源异构数据整合系统在医疗大数据中的研究
吴健:多元异构的数字敦煌
嘤嘤嘤,人与人的信任在哪里……
上汽大通:C2B个性化定制未来
同桌宝贝
信任