国内数字化学习资源推荐算法研究热点、趋势和启示*

2022-06-06 14:10宋银李孙瑜
关键词:热点个性化数字化

宋银李, 孙瑜

(云南师范大学 信息学院,云南 昆明 650500)

1 引言

推荐算法在数字化学习资源中的应用在一定程度上能够较为高效地推送学习资源.国外在20世纪90年代兴起推荐算法研究,而国内研究者从2000年才开始关注信息推荐技术,最早在2002年将推荐算法引入网络远程教育领域[1].研究者基于数字化学习资源推荐算法研究现状、应用趋势、利弊及推荐服务中的推荐效果等视角,对其进行文献梳理[1-3],然而在推荐算法的研究进程、热点发展趋势及算法研究内容等方面的系统性研究并不多.因此,本文采用CiteSpace及VOSviewer可视化软件,基于关键词共现分析及关键词突现分析方法,以CNKI核心数据集为文献数据来源,从多个维度透视数字化学习资源中推荐算法的最新研究进程和热点,剖析其研究动向与发展趋势,综合得出未来国内数字化学习资源推荐算法研究的相关启示.

2 数据来源与分析

2.1 数据来源

以CNKI数据库核心合集(北大核心、CSSCI和CSCD)为数据来源,选取“数字化学习资源” “网络学习资源”“在线学习资源”“学习资源”“推荐算法”“推荐技术”和“推荐方法”为检索主题词,检索时间为2007-2021年,共检索到1 012篇相关文献;对检索结果进行除重并删除会议、个人学术成果介绍、书评及与数字化学习资源无关的文献,最终得到论文594篇.文献发表情况如图1所示.

图1 2007-2021研究论文刊载情况

2.2 研究方法

VOSviewer与CiteSpace是对研究主题进行文献计量统计分析的重要工具,VOSviewer在关键词共现聚类技术方面有较为明显的优势[4].CiteSpace能够显示当前某一研究主题的研究热点及过去产生的热点,从而分析未来该领域的发展趋势,对演化进程及发展趋势有较好的预判优势[5].由此,本文通过VOSviewer关键词的共现聚类图分析数字化学习资源推荐算法的研究热点,通过CiteSpace突现关键词来研究数字化学习资源中推荐算法的发展趋势.

3 研究结果分析

3.1 数字化学习资源推荐算法的研究热点

基于VOSviewer关键词共现聚类对研究热点进行分析,将594篇文献导入VOSviewer中共出现1 225个关键词,关键词合并处理后使用Network Visualization(网络可视化)模块来进行关键词的共现分析,得到关键词共现网络图,并通过共现网络图分析得到高频关键词的聚类.

图2是近15年国内数字化学习资源推荐算法关键词共现网络图.图中节点越大代表关键词频次越高,节点间连线越粗则表示关键词间联系越紧密.

如图2所示,经过VOSviewer的关键词共现处理,将关键词整合为协同过滤、推荐算法、推荐模型、推荐系统及个性化推荐等5个聚类簇.为了便于理解与分析,特将各聚类簇的关键词进行合并整理成表1.根据图2与表1中相关热点分析,可看出国内数字化学习资源推荐算法研究主要集中于模型构建、算法实现及算法应用等方面.

图2 基于VOSviewer关键词共现网络图

表1 数字化学习资源推荐算法热点词汇列表

通过对数字化学习资源推荐算法热点词汇的分析,归纳出以下研究热点:

(1)推荐算法中协同过滤技术的应用

通过关键词汇总分析可以看出,在协同过滤技术的成熟应用、用户相似度计算精准度的提升和基于深度学习的协同过滤技术不断发展的条件下,基于主题模型、混合推荐、基于知识图谱协同过滤等研究均得到学者的广泛关注[6-10].

(2)学习资源推荐算法的优化和改进

学习资源推荐算法的改进与优化具体指推荐精准度的提升及算法与技术的融合优化等方面的研究.该聚类关键节点普遍较大,说明研究热点关注度较高.根据表1可知,当前VIKOR及tf-idf等新兴算法开始应用于学习资源推荐算法中.从推荐效率提升方面来看,矩阵分解、评分预测、信任度和张量分解等是研究热点[11-13].在算法不断发展,技术不断加强的条件下,基于标签推荐、社会网络、聚类、神经网络、深度学习、知识图谱、混合推荐等技术与算法的多维度融合使用是学者关注的热点[14-16].

(3)推荐模型中推荐算法的策略设计

推荐模型中推荐算法的策略设计主要是指推荐算法在推荐模型中是如何进行推荐策略的设计,如何根据推荐机制来选取算法从而构建出符合需求的推荐模型.从表中可以看出推荐模型的构建围绕用户属性和用户偏好挖掘、学习者特征分析、智能推荐及多元模型构建等方面为研究者完善推荐模型的构建与推荐策略的设计提供了参考依据[17-21].

(4)推荐系统中推荐算法的效果评价

推荐系统中推荐算法的效果评价是指推荐算法在推荐系统中是怎样实现的,又是如何应用及推荐效果如何进行评价等方面的研究.当前,推荐系统中基于用户学习行为、学习者特征的数据挖掘、基于深度学习的推荐效果评价、推荐模型的改进、推荐算法的优化应用与测评等方面是学者研究的热点[22-25].

(5)个性化推荐中推荐算法的嵌入使用

个性化推荐中推荐算法的嵌入使用是指推荐算法在个性化推荐中如何嵌入使用、使用时融合了什么方法与技术以及针对不同的推荐对象如何使用等方面的研究.根据关键词可得,目前基于关联规则、情境感知、用户画像、相似性度量、社会化标签与标注等技术与方法的嵌入使用能够提升个性化推荐算法适用性.针对不同对象的推荐即基于学习资源推荐、知识推荐和好友推荐等方面的混合推荐是学者个性化推荐算法研究关注的热点[16-30].

3.2 数字化学习资源推荐算法的研究趋势

对所搜集的594篇文献通过CiteSpaces关键词突现图谱分析出每个时期突现的关键词并对其进行汇总,根据突现关键词的汇总结果,归纳出推荐算法的研究趋势.

突现关键词主要是表示该课题在相当长的时期内因其所涉及的研究课题而受到较高关注,反映其在该阶段具有很强的发展潜力与科学研究价值;通过探索数字化学习资源推荐算法关键词的突现分析,在一定程度上,可以揭示该研究领域主题的发展趋势,同时挖掘出潜在的、有价值的研究方向[31].本文对关键词进行分析,得到突现关键词图3和表2,图3展示了排名前24位的突现词,其通过时间顺序来进行排列,表2则划分出不同的时期突现的关键词.

图3 数字化学习资源中推荐算法关键词突出视图

表2 数字化学习资源中推荐算法关键词突现统计表

从表2中可以看出:

(1)2007-2009年的萌芽初创期,该阶段的推荐算法在数字化学习资源中还处于初探阶段,其研究主要关注学习过程中,用户属性、评论文本、卷积神经网络及tf-idf算法等在数字化学习资源中的初次使用情况,该阶段主要是针对一些算法的使用状态与适用性进行探究.

(2)2010-2012年的探索规划期,推荐算法开始集中于学习资源、个性化推荐、相似性等方面的探究.可以看出该阶段推荐算法针对学习资源这一研究对象,将推荐算法与教学理论、知识点进行相似度的关联,提升算法在学习资源推荐中的适用性,从而促进数字化学习资源的个性化推荐.

(3)2013-2015年的应用发展期,数字化学习资源推荐算法开始关注于标签、本体、社会化标签、社会网络、个性化、服务推荐等几方面的应用,其中标签的突现强度最强,可以看出在该阶段,标签作为一种有效的信息表征方式,其在用户偏好、资源特征表示方面均有一定的准确性,社会化标签、社会网络则进一步完善标签描述的准确性,让大众均参与其中,完善用户学习行为及学习资源特征数据,基于标签、社会化标签、社会网络方法改善单一推荐,算法优化应用及提升学习服务推荐等方面是该阶段研究的热点.

(4)2016-2018年的深入拓展期,学习资源推荐算法聚焦于贝叶斯网络、好友推荐、兴趣点推荐及排序学习等视角,在传统推荐算法的基础上分支出不同类型的推荐算法,基于传统贝叶斯网络改进推荐算法预测精度,优化推荐效率,基于兴趣点和用户特征混合推荐,优化推荐算法的单一性,基于好友推荐和排序学习特定的推荐以改善推荐算法的数据稀疏及推荐准确性等是研究的一大关注点.

(5)2019-2021年的融合创新期,学习资源推荐算法呈现出丰富多元的局面,开始融合一些新的算法与技术.其更多关注数据稀疏、混合推荐、深度神经网络、神经网络和用户画像等方面的研究.从突现强度可以看出算法存在数据稀疏性、冷启动、算法固化及算法维度单一等多方面问题,不断改进与优化算法是当前较为关注的内容,与其他算法与新技术的融合并提升算法的推荐效果与精准度也是研究关注的方面.

综上所述,从突现关键词的演变,可以看出数字化学习资源推荐算法中推荐对象、教育理论的融合、推荐的技术提升、推荐的维度及推荐情景感知是未来研究关注的重点领域.

4 思考与启示

通过对国内核心期刊近15年刊载的594篇数字化学习资源推荐算法研究文献进行了系统性的梳理,较为全面地展示了该研究领域的发展概貌.基于数字化学习资源推荐算法研究热点与演化趋势,结合当前数字化学习资源推荐算法的研究现状,对未来数字化学习资源推荐算法研究发展做如下思考.

4.1 从教育的视角来优化与改进学习资源推荐算法,促进个性化学习的发展

在线学习快速发展的背景下,面对海量的数字化学习资源,如何从网上获取优质学习资源显得尤为重要.在初探阶段,数字化学习资源推荐算法更多关注算法的实现与应用,大多采用了电子商务、新闻推荐等领域应用较为成熟的推荐算法与技术,不过在使用过程中出现推荐准确度低及适用性差,推荐资源不满足学习者需求等问题.这主要是因为教育领域与其他领域的差异性,从教育的视角来优化与改进算法,融入教育原理能为学习者提供个性化的学习资源推荐服务,进而更好地促进个性化学习的发展.

4.2 从算法推荐策略-推荐内容-学习真实情景等多维度结合,提高学习资源多元推荐服务水平

当下,教育领域学习资源推荐常用基于内容、协同过滤及基于知识等三种推荐方法.不过在不同的推荐情形下,仍然会出现数据稀疏、冷启动、推荐内容单一等问题[32].从不同维度对学习资源推荐算法进行混合使用就显得尤为重要[33-34].学习资源、学习伙伴和学习路径的推荐分别从推荐算法、学习情景及推荐内容等多个维度进行融合,有助于学习资源多渠道推送.因此从算法推荐策略、推荐内容及学习真实情景等多个维度进行结合,更好地提高多元化学习服务的水平是未来研究的一大要点.

4.3 融合混合推荐、深度学习、社会化标注及情景感知等新兴技术,提升推荐算法的应用成效

以往的在线学习中数字化学习资源推送主要有Top-N推荐、关键字查询及最新资源推荐等三种方式.其方式推荐效果不明显,在后期的发展中融合个性化推荐技术,并细分为基于关联规则的推荐、内容过滤推荐及协同过滤推荐等三种技术[35].三者结合使用,能根据用户的个性化特征,如学习兴趣、偏好及学习需求等主动地向用户推荐适合其学习需求的资源与信息.目前,越来越多的技术开始在学习资源推荐中融合使用,在一定程度上能够提升推荐算法的精确度[36-40].如何根据学习者个性化特征、知识构建程度、学习需求及技术的科学合理性来进行融合,融入一些科学、适用及创新的技术以提升推荐效率,以便更好地推动数字化学习资源推送服务的发展,仍是未来需要解决的问题.

4.4 加强算法、模型和系统间动态联系,推动资源建设与发展

推荐算法、推荐模型及推荐系统三者存在密不可分的关系.推荐模型能够验证推荐算法的推荐效果;而推荐系统能够实现与检测推荐模型的合理性及推荐算法的准确性;推荐算法直接或间接受到推荐模型及推荐系统的影响,当前的数字化学习资源推荐中反映出学习资源推荐模型缺少对学习资源及信息内容本体结构的关注[41],算法推荐效果不明显、推荐精准度低及推荐内容单一化;推荐系统中数据稀疏及冷启动,推荐策略固化,未能很好地满足学习者按需推送的诉求.因此,应加强算法、模型和系统间动态改进与应用的关系,促进推荐策略适用性,提升推荐系统的推荐效率与精准度,从而进一步推动数字化学习资源的建设与发展.

猜你喜欢
热点个性化数字化
热点
家纺业亟待数字化赋能
坚持个性化的写作
高中数学“一对一”数字化学习实践探索
热点
高中数学“一对一”数字化学习实践探索
新闻的个性化写作
结合热点做演讲
上汽大通:C2B个性化定制未来
数字化制胜