韦智勇 周立广
【摘 要】随着全球信息技术的迅猛发展,信息数据呈现出爆发式增长的趋势,如何从海量的数据中找出有价值的信息,是一个迫切需要解决的问题。推荐系统是解决这一问题的有效途径,而如何把深度学习这项技术融入推荐系统,是目前的研究热点。文章分析了传统的推荐系统存在的问题,提出了相应的解决方法和对策,使系统模型与用户的需求结合更加紧密,用户的满意度得到进一步提升,并对基于深度学习的推荐系统的未来发展趋势进行了阐述。
【关键词】推荐系统;深度学习;神经网络;多源异构数据;上下文推荐
【中图分类号】TP391.3 【文献标识码】A 【文章编号】1674-0688(2022)02-0034-03
随着互联网技术的高速发展,每天都有大量的信息数据展现在我们面前,想从这些海量的数据中提取自己需要的信息是非常困难的,而且耗费大量的时间和精力,因此开发一个能根据用户需求自动推荐相关内容的系统,是目前人工智能技术研究的热点。该系统能解决信息过载问题,并且可以在工作、生活、娱乐、网上购物、信息检索等方面提供高效的服务。系统的推荐内容都是根据每个人的喜好和特点推荐的,不同的人有不同的推荐需求,而系统具有智能化特点。
近年来,深度学习技术在研究领域中逐步受到重视,例如在人脸识别、智能语音等都得到了广泛应用。该项技术可以使许多智能设备可以自适应各种环境,成为人工智能技术的研究热点;可以融入推荐系统中,把各种异构数据进行整合处理,这样建立的需求模型更加贴近用户的需求,使用户的满意度得以提升。因此,深度学习技术为推荐系统的发展提供新的研究思路[1]。
1 推荐系统概述
传统的推荐系统就是把用户的需求作为输入,系统通过需要把搜索到的数据信息汇集后发给用户的系统。随着网络技术的飞速发展,推荐系统已经在原有的基础上进行了扩充式的发展,系统把用户的兴趣爱好融入其中,更具人性化和个性化,推荐内容涉及的范围较广,包括影视、广告、购物和社交等,都在系统的服务范围中。传统的推荐系统按照推送方式分为协同过滤、内容信息和综合性推荐系统。
1.1 基于协同过滤的推荐系统
基于协同过滤的推荐系统,该算法的指导思想主要根据用户操作行为特征进行目标推测,把可能要搜索的相关内容罗列出来[2]。该算法主要包括两种类型,即基于用户和基于物品。在具体的实践中,基于物品的推荐比基于用户的推荐算法较为切合实际。该系统的算法的优点是在技术实现上较为简单,系统的精准性高,缺点是数据量缺乏,实时性差,同时随着运算的复杂度加大,系统效率低,推荐内容欠缺。
1.2 基于内容的推荐系统
基于内容的推荐系统,该系统的算法主要是根据用户相关物品的特征进行数据提取,通过用户的操作行为,把用户的喜好与物品进行关联,在这个基础上进行内容推荐,类似的物品也能推荐。该系统的算法的优点是系统运行效率高,缺点是特征提取过于单一,并且推荐内容缺乏新鲜感。此外,系统推荐的内容仍然需要之前的历史操作痕迹确认,如果是新用户则有时无法推荐。
1.3 综合性(混合)推荐系统
上述两种推荐系统都可以根据用户的特性进行推荐,但每个系统都存在一定的局限性,综合性推荐系统把单一化的推荐系统的优点集合,对原有的系统进行改进,该系统的算法主要是把各自的算法進行整合后产生新的推荐算法[3]。对于混合算法的策略,目前大约有7种,相应的设计思路分为整体式算法、并行式算法和流水式算法3种。
2 基于深度学习技术的网络模型
该技术解决了传统机械式的方法构造数据特征、运算能力差等问题,使系统具有智能化,深度学习技术能对数据进一步挖掘和分析,找出数据潜在的规律和特性。基于深度学习技术的网络模型主要包括深度神经网络模型、卷积神经网络模型和循环神经网络模型3种。
2.1 深度神经网络模型
深度神经网络模型是许多算法模型的基础,该算法可以通过分层进行特征学习,可对无法线性分离的数据信息进行归类。该模型主要通过反向传播算法进行训练,调整神经网络中的权值和阈值达到数据归类的精准率。
2.2 卷积神经网络模型
卷积神经网络模型属于一种前馈的网络模型,包含两个核心操作,即卷积和池化,其功能是把用户和项目进行潜在特征的提取操作。系统除采用局部感知的提取策略外,还可用权值共享的策略进行特征提取。这些策略的优点是减少网络模型的参数和降低模型的复杂度,防止过度拟合问题的产生。
2.3 循环神经网络模型
循环神经网络模型是在建模的过程中融入时序,把时间顺序与数据序列对应起来的网络模型。该模型的神经元节点含有元素的操作信息,这些节点通过隐藏单位的方式进行深度学习,显示出当前网络的状态信息。该网络模型解决了其他模型无法根据序列建立模型的问题,但该模型也存在梯度消失的问题。随着后续其他模型相继问世,例如长短时记忆网络模型、门限循环单元模型等,解决了梯度消失的问题。
3 基于深度学习的推荐系统概述
目前,深度学习技术在推荐系统中具有超强的生命力和广阔的发展空间。不少专业人士通过该技术模型解决了传统推荐系统的遗留问题,使整个系统的活力得以提升。目前,推荐系统一般主要包括4个层次,即用户层、算法层、推荐层和结果。推荐系统的主要技术架构如图1所示。
3.1 基于内容的深度学习推荐系统
推荐系统可以通过深度学习技术学习数据的特征和规律,解决了人工构造特征的不足之处。所以,深度学习技术在该系统的作用主要是用于特征表示的提取,同时用于解决冷启动和信息缺少等问题。CDL方法是一种深度学习方法,该方法主要通过用户喜爱图片的对比进行推荐,利用两个CNN把图像分为正负两类,即喜欢和不喜欢,分别计算用户特征的差距,采用交叉熵损失数模型进行训练,这样系统可以区分类似的图片,相比手工模型更具优势。除了CDL模型,还有DeePCoNN模型,该模型与之前模型不同的是,通过两个耦合的CNN对物品评论和用户特征进行深度学习,如果由于喊声原因导致干扰过大,则用模拟的方式生成用户提示[4]。经过长时间的测试,在信息缺乏时,用户评论中的有两个因子对推荐性能具有关键性作用,即语义因子和情感因子,该模型解决了冷启动和信息缺少的问题。
3.2 基于上下文的深度学习推荐系统
对于可以描述所有事物实体的数据信息,这种信息称为上下文信息。用户和应用程序之间的交互通过一种接口完成,该接口称之为实体,实体一般包括用户、地点和应用对象3种。基于上下文的深度学习推荐系统主要根据用户的描述信息(即上下文)进行推荐,利用环境场景的上下文特征进行推荐是目前该技术研究的主流方向。
基于上下文的深度学习推荐系统通过捕获图像的时间、位置、视觉和用户上下文表示后,通过交叉熵损失函数将多标签问题转换为单标签问题,该系统与旧版本的标签推荐系统不同之处主要是根据时间、位置、视觉和用户上下文关系,结合标签特征进行标签推荐处理。实践结果显示,用户用何种方法标记图像的关键因素是上下文信息,通过上下文内容的整合后,可以使标签预测效果得到进一步改善。基于上下文的另一个应用是在基于会话的推荐系统中,用户互动信息具有连续性特点,因此时间上下文因素对推荐系统是非常关键的。系统主要根据用户的兴趣爱好的动态性进行抓取,并且结合时序变化的数据预操作,兼顾了用户兴趣爱好的长期性和短期性。随着系统的不断改进,在后期的系统版本中,有一个PL-RNN模型,该模型不以用户的兴趣爱好为主,而是以用户对物品的关注权重和操作时序相结合后,得出用户的用意与上下文之间的关联。该模型既解决项目的独立操作问题,又解决多项目协同操作的影响问题。
在多层次上下文的系统应用方面,系统主要通过穿戴设备对人眼进行状态预测,可检测出人体的疲劳程度数据,以此作为上下文内容对用户的兴趣爱好进行评价和分析,使推荐准确率得以提升。此外,HCA-GRU模型在原有的基础上进行了改进,该模型是在长期和短期的兴趣爱好方面融入注意力机制,能更真实地体现用户的兴趣爱好。
3.3 基于深度学习的推荐系统的优势分析
基于深度学习的推荐系统具有明显的优势,主要表现在以下几个方面。
(1)数据特征学习。深层次的神经网络模型能够建立各种数据信息的特征表示,减少了手工操作,并且可以整合大量的数据信息(包括各种类型结构的数据),这样可以有效解决信息缺乏和冷启动的问题。
(2)非线性数据转换。深度学习系统可以通过非线性函数对数据进行建模,数据中包括线性和非线性数据,这样系统可以处理一些复杂程度较高的交互模型。
(3)新型建模方式。基于深度学习的推荐系统的建模方式是序列建模,该建模方式可以根据时间的变化和用户的操作特征进行数据分析,这样对长期或短期建模的用户都是非常重要的。基于深度学习的推荐系统提高了工作效率。
4 基于深度学习的推荐系统的技术发展探讨
根据近几年的调查研究发现,基于深度学习的推荐系统逐步受到学术界的高度重视,成为热点研究的课题,但就目前而言,深度学习的推荐系统的研究依然在初期阶段,遇到的问题和挑战仍然较多,将来会逐步解决这些问题。
4.1 深度算法将融入新技术
旧版本的推荐系统在算法上无法深度进行特征学习算法,但它具有结构简单和解释性强的优点,把新的深度学习算法融入其中,可以取长补短,达到理想的效果。当前,新的推荐系统已问世,例如基于神经网络的协同过滤算法模型、稀疏数据预测算法模型和xDeepFM深度算法模型,这些算法模型解决了之前仅能单一模式交互的缺陷,同时解决了信息缺乏和冷启动方面的问题,所以该研究方向仍是学术界的研究热点[5]。
4.2 多重任务推荐算法优化和改进
目前,推荐系统一般都要同时处理多项目标任务,因此可通过任务设置中表达的方式找到处理多个目标任务的途径,主要根据任务之间的关联因素处理多重任务。例如对抗序列的分解法和多任务学习框架法都有共同的特点,就是把多任务学习和深度学习有机融合,提供各方面的渠道信息,解决了信息缺乏的问题,通过辅助任务从另外一个方向反映推荐内容,使整个系统的解释性得以提高,可实现系统的跨区域性。
4.3 推荐系统可解释性的功能扩展
“黑盒性”是制约推荐系统解释性的关键因素,为了解决这一问题,引入一个注意力机制的概念。所谓注意力机制,就是推荐算法模型在运算时,把用户的操作行为与推荐结果的影响效果联系起来,观察它们的对应关系。注意力机制可以提升用户兴趣爱好长期的可持续性和短期的过渡性,并且可以根据当前状况提取最高价值的特征和最优的推荐结果。
4.4 新场景和新领域的推广及创新
随着互联网技术的不断发展和成熟,推荐系统不断融入工作、学习、生活、娱乐、商业、服务业等。目前,推荐系统仍在其他新的领域不断扩展。深度学习技术在數据表征方面,可以在原有推荐系统的基础上,将数据融入模型构建当中,这样不仅解决了旧推荐系统遗留下来的问题,而且对新场景的应用和创新增添了新的活力[6]。随着问题的深入研究,未来新的推荐场景还可根据各种环境的需要动态地转化,对深度学习技术不断进行更新和完善。
5 结语
基于深度学习的推荐系统具有高效、优越的特点,提高了用户的满意度。深度学习技术的发展将为推荐系统领域带来新的机遇,也产生新的挑战。本研究对传统的推荐系统进行了概述,在原有的基础上引入深度学习技术的概念,对几个典型的深度学习系统进行了分析,对深度学习推荐系统的技术发展进行了技术探讨,这为后续的研究提供了参考文献。今后的研究重点是将在原有系统的基础上,融入人工智能和大数据技术,系统将自动感应当前的情境,自动识别用户的长期和短期兴趣爱好,不断提高系统的推荐效率,丰富推荐内容,提升用户的满意度。
参 考 文 献
[1]黄立威,江碧涛,吕守业,等.基于深度学习的推荐系统研究综述[J].计算机学报,2018,41(7):1619-1647.
[2]刘青文.基于协同过滤的推荐算法研究[D].合肥:中国科学技术大学,2019.
[3]杨文龙.基于动态集成方法的混合推荐系统研究[D].济南:山东大学,2018.
[4]龙虎,李娜.基于深度学习的个性化学习资源推荐系统研究[J].电脑编程技巧与维护,2020,35(2):128-130.
[5]蒋伟.推荐系统若干关键技术研究[D].成都:电子科技大学,2018.
[6]孙志远,鲁成祥,史忠植,等.深度学习研究与进展[J].计算机科学,2019,43(2):1-8.