职业教育领域教学个性化视频智能推荐研究

2022-02-20 01:25刘振栋罗群

电脑知识与技术 2022年34期

刘振栋　罗群

摘要：文章采用教学视频标签化标注视频知识点、类别等信息，职业教育知识图谱以视频知识点为中心，基于在线教育平台大数据构建画像模型勾画目标推荐用户，分析在线教育领域推荐场景，研究基于视频关联网络以“数据驱动+知识驱动”为理念的视频推荐模式和算法。

关键词：在线职业教育；知识图谱；学生画像；个性化视频推荐

中图分类号：TP273 文献标识码：A

文章编号：1009-3044（2022）34-0104-03

1 概述

当今，随着云计算技术迅速发展，移动设备、智能终端的普及，教育信息化应用更加广泛。在线开放课程就是教育现代化的要求，依靠信息技术、智能终端和云平台技术而进行的具有科学性、多样性、开放性和创新性的一种教学方式[1]。在线开放课程学习方式灵活多样，同时可满足不同层次、不同年龄、不同兴趣等广大学习者的需求。2019年以来，线上教学方式趋于常态化，在线课程资源的建设显得尤为重要。

随着硬件计算能力的快速提升和数据量呈爆炸式增长，深度学习成为研究焦点。在推荐系统领域，相关的推荐算法也相应增多[2]。目前，推荐算法包括基于图文、用户以及协同过滤、混合推荐等推荐算法。在线个性化教学视频推荐，是从学生的角度出发，以基于用户的协同过滤式算法将在线学习用户作为分析对象，在学习用户之间找到相似用户，这样就可以面向目标用户、相似用户和集中感兴趣用户结合知识结构逻辑推荐没有接触过的视频内容，形成推薦[3]。在众多推荐算法中，AutoRec算法是基于自动编码器（AutoEncoder）的推荐算法，在视频推荐过程中，该算法可根据输入用户访问视频信息数据矩阵来重构新的矩阵，然后根据用户访问数据从大到小进行推荐。2016年，Google发布了Wide & Deep算法，该算法将宽度模型与深度神经网络进行联合训练，结合Wide & Deep算法优势，形成与AutoRec算法的有益补充，可解决推荐系统等大规模的带有稀疏输入的回归或分类问题。

此外，有文献提出了一种通用框架，即可以表示和扩展矩阵因子分解算法，并且能够与深度神经网络相结合。基于深度神经网络的推荐算法可以学习出在线学习用户和视频之间的非线性关系，而不像矩阵因子分解算法只能学习在线学习用户和视频潜在特征的点乘关系。然而，基于深度神经网络的推荐算法网络架构难以改变，也就难以结合其他的信息改进推荐效果[4]。因此，矩阵因子分解算法仍是推荐系统的一把利器。近年来，与深度学习相关的推荐算法正逐年增多，同时华中科技大学根据收集到的用户历史行为信息，建立一个基于标签的视频流行度预测模型。通过这种方式可以为目标用户预分配一些流行度高的视频资源，这不仅能够提高用户的体验效果，而且也能有效地解决新用户的冷启动问题[5]。基于以上众多研究成果和日益成熟的推荐算法，加上神经网络、深度学习等算法的自学习属性，使得在复杂场景自学习的智能视频分发机制的研究上也有了充分的科学意义。

2 智能视频分发机理分析

视频作为承载信息量最丰富的数据传输形式，无疑是学生学习知识的重要途径。面对海量教学视频资源和未来线上教育发展、学生学习途径网络信息化的大势所趋，研究目标是通过智能视频分发机理，完善学生学习的个性化路径，辅助分析并帮助学生直达适当的学习视频资源，实质上为各类学生、各类需求量身打造个性化视频推荐系统。从学生个人角度来看，提高学生学习的主动性、积极性以及学习效率，帮助学生一步一步学习掌握知识技能；从建设智慧教育的角度来看，使教育搭载上科技发展智能化的动力系统，进一步完善“智慧教育”这个大课题，提高优质教学视频资源的利用率；从社会经济发展的宏观角度来看，能够推动社会基础建设的教育工作，帮助完善社会发展和社会人才教育培养体系。目标通过为学生提供更完善好的学习服务，逐渐扩大来完善智慧教育的建设和人才培养体系，最终助力社会现代经济和智能科技的蓬勃发展。

随着社会互联网等科技的快速发展和国家对于智能科技深入教育行业的支持，学生对于获取各类知识和自学方式发生了很大的变化，关于建设智慧教育的建设成果不断涌现，出现了很多优质在线教育平台，例如科大讯飞的博思智慧学习平台。针对在爆炸式增长的教学视频资源和一般推荐机理在大规模的视频信息和数据基础上开展视频推荐业务表现不足的现状，结合学生各类实际学习场景的需求，发现对学习教育这一复杂应用场景的教育视频分发机理研究的必要性和实用性，进一步调研挖掘从技术角度验证了这一研究的可行性。目前在线教育的发展处在快速发展阶段，关于智慧教育的建设工作还没有很完善，随着技术的不断进步，将催生越来越多的基于人工智能和大数据的教育业务。

对智能视频分发机理在教育复杂场景下的应用设想是一个全新的发现，同时也是一个全新的挑战。相信依托发展教育培养人才的重要性和有关人工智能、大数据等科学技术的基础积累，攻克这一难题将只是时间问题。

3 智能视频分发因素分析

笔者针对在线教育复杂场景下教学视频资源，根据不同学生的专业学习路径、认知能力、兴趣偏好和自学行为路径等，分析设计各类学习视频推荐场景，充分挖掘大数据相关技术处理海量视频数据，全方位开展复杂场景自学习的智能视频分发机理的研究。

通过前期的教育类复杂场景设计和技术调研工作，发现关于教育场景自学习的智能视频分发机理与普通的智能视频分发机理有很大不同，主要从原理、方法和规律上进行论述。

从原理上，教育视频推荐算法原理明显由纯数据驱动转向“数据驱动+知识驱动”，原因主要体现在视频数据、用户画像和推荐场景的巨大差异上。

视频数据方面，对一般视频来说，其本身巨大的信息量被浓缩成几个标签，例如“生活类”“体育类”“舞蹈类”等。而教学视频的属性标签分析将会复杂得多。与普通视频相比，教学视频本身所承载的知识点的关系错综复杂，受众层次和知识深度差异大，视频分类要求严格等。

用户画像方面，现有的互联网相关视频产业的视频推荐中，用户画像是清晰易构建的；而教育场景下要构建较高完整度的学生画像，需要分析大量的学生个人数据、专业路径和学习行为等，最终系统表现的优劣与构建学生画像的质量成正比。

推荐场景方面，教学视频的推荐场景除了常见的包括进入平台后启动、观看完视频后等场景外，还有例如平台上答错题目启动，学习完某知识点和课程后和完成某学习任务后等诸多较为复杂的场景，为了完善系统的专业性，需要充分考虑并设计相关复杂场景。

从方法上，由于教育类学习资源的特殊性，需要整合基于知识图谱的學习资源，包括制定职业教育领域知识图谱标准、建立统一的知识点图谱，积极填充教学资源和建立知识图谱与课程的对应等。另外由于学生画像和推荐场景的复杂程度，不同于普通的视频推荐，需要额外分析学生的认知能力和学习行为以及交互模式等。在一些通用的视频推荐系统中主要考虑的目标是：准确度、新颖度、多样性。而在教育视频推荐系统中，还需要考虑很大难度的匹配性。

从规律上，教学视频的属性与普通视频差异大，所以在一些普遍推荐的规律，例如加大同类型视频、同作者视频等权重外，还需要重点考虑视频中知识点的关系以及视频的分类，例如是否同属于一门课程，知识点是否重叠，是否跨专业等因素。教学视频的特殊性，使得视频之间也比一般视频具有更多的关系和规律，都将在系统中被挖掘分析。

4 智能视频分发总体设计

总体设计步骤如图1所示，第一步：视频标签预测；第二步：复杂场景分析；第三步：构建学生画像；第四步：构建基于知识图谱的视频关联网络；第五步：实现视频推荐模式及算法。

其中，视频标签预测主要包括构建知识点标签、难度标签。复杂场景分析包括以题推题场景、以视频推视频场景、搜索场景等。用户画像包括：基础数据、行为数据构建数据标签，基于学生作业构建学生能力及用心程度标签（进行学生作业相似评价，生成用心程度标签），学生职业素养、岗位能力标签等。基于知识图谱的视频关联网络包括构建知识点图谱（包括通识课程知识点、专业基础知识点、专业方向知识点等）与视频集之间的关联关系。视频推荐模式及算法包括自适应学习算法、适应性学习算法，自适应学习包括错题推题、错题推薄弱知识点、学习路径规划等，适应性学习是指根据学生兴趣爱好和习惯来进行推荐，贯穿学习过程当中。

5 智能视频分发实施路径

实现智能化视频推荐，需要解决以下两个问题：一是如何构建基于职业教育领域知识图谱的教学视频关联网络；二是如何依据视频关联网络进行个性化视频推荐。为了解决第一个问题，首先引入教学视频标签化研究，解决如何给视频进行标注知识点、类别等信息，然后引入职业教育知识图谱将以视频为中心的资源关联起来，同时阐述各个视频知识点的关系。为了解决第二个问题，首先引入项目组已完成的学生画像研究工作，基于在线教育平台大数据构建画像模型勾画目标推荐用户，然后分析在线教育领域推荐场景，接着研究基于视频关联网络以“数据驱动+知识驱动”为理念的视频推荐机制，包括推荐模式和算法。

1）职业教育领域教学视频标签化

分析描述教学视频的属性，比如所属学科、视频类型、教学老师、视频知识点等。教学视频的特殊性，知识点是否重叠，是否跨专业等因素使得视频之间也比一般视频具有更多的关系和规律，都需要被挖掘分析，并进行标签化。

2）基于知识图谱构建视频关联网络

职业教育知识应具备体系性、全面性。本研究以博思智慧学习平台提供的丰富自学课程数据为基础，包括课程页任务、视频任务、试题任务、知识图谱、错题集等。其中通过视频任务，学生可直观地了解到老师需要讲授的知识点，是最有效的自学途径之一，因此需要所有资源以视频为中心进行关联，研究如何利用知识点图谱模型的方式对视频进行表示关联，图谱上的点代表阐述该知识点的视频，同时需要阐述各个知识点的关系。

3）引入基于平台大数据构建学生画像

在线学习平台实现课堂全过程常态化应用，并将产生大量的数据构成了包括教师、学生、管理者在内，涵盖课前、课中、课后教学全过程多个环节的多维教育大数据[6]。

基于上述数据，将已经研究的学生画像成果引入，包括围绕学生的三个层面（事实层、模型预测层、认知模型预测层）标签，目的是引入平台教与学的行为和活动过程状况和学生偏好、认知能力等标签。

4）分析在线教育复杂推荐场景

学习是由人参与其中的社会活动，而具有生命和智能特征的系统都是复杂系统。在研究教育领域时候，教育系统内部学生、老师、知识的关系非线性，因此，要充分考虑学习的复杂性问题。同时在线学习系统应具有引导性，发现在学习时需要哪些场景触发推荐算法。例如平台上答错题目时，学习完某知识点和课程后，或者完成某学习任务后等诸多较为复杂的场景。

5）智能视频推荐算法研究

结合视频关联网络，针对不同学校不同层次的学生，研究如何智能引导学生学习视频学习资源，建立知识体系，培养学习习惯，帮助学生一步一步学习掌握知识技能。

6 结论

通过在线教育这一复杂场景下自适应智能视频分发机理研究，提出用 “数据驱动+知识驱动”的特色视频分发机理，采用视频关联网络构建与智能视频分发方法，解决将合适的教学视频资源分发给需要的学生的问题，在整个智慧教育个性化推荐的建设中具有相当的创新性，也给智能驱动学习方式变革赋予积极的意义。

参考文献：

[1] 陈亮，戴孝林，文斌.在线开放课程的微项目化探究[J].纺织服装教育，2021，36（6）：583-585.

[2] 周瑞环.基于视频流行度及视频分类标签的Top-N推荐[D].成都：西南交通大学，2018.

[3] 展渊，王宇.基于用户行为分析的视频推荐算法研究[J].电子测量技术，2017，40（4）：39-42.

[4] 周瑞环，赵宏宇.结合物品流行度的列表级矩阵因子分解算法[J].计算机应用，2018，38（7）：1877-1881.

[5] 柯伟兵.基于标签的视频流行度预测和推荐算法研究[D].武汉：华中科技大学，2016.

[6] 刘邦奇，李鑫.智慧课堂数据挖掘分析与应用实证研究[J].电化教育研究，2018，39（6）：41-47.

【通联编辑：唐一东】