贡国忠 吴访升 杨淑芳 景征骏
摘要:在“互联网+”环境下,职业院校积累了海量数据,亟需提高大数据服务水平。从大数据融合、大数据分析、软硬件设施的角度分析职业教育大数据应用面临的挑战,提出基于人工智能的职业教育大数据应用模式,以机器学习、知识图谱、自然语言处理为核心技术,结合开源云计算平台,为学生提供个性化学习服务、知识服务等智慧服务,促进职业教育大数据服务的进一步发展,助力职业教育走向智慧职教。
关键词:职业教育大数据;人工智能;个性化学习;知识服务
中图分类号:G712 文献标志码:A 文章编号:1673-9094-(2018)09C-0019-05
一、职业教育大数据研究进展及现实挑战
(一)研究背景
近年来,随着职业院校信息化进程的迅速推进,以及物联网、移动互联网、社交网络等技术在学校教学和管理中的广泛应用,职业院校的教育数据在很大程度上具备了大数据的4V(variety、volume、velocity、value)特征,主要体现在:(1)职业院校数据种类繁多,包含图书、多媒体课件、教学视频等教育资源数据,个人信息、考试成绩、学习过程记录等学生数据,以及因浏览、观看、下载和维护管理而产生于日常教学服务环节的各类异构数据等,这些数据中既有传统的结构化数据,更多的是半结构化非结构化数据;(2)数据体量浩大,汇聚了海量教育资源数据,往届及在校学生数据,教师和管理人员数据;(3)职业教育数据流量增长迅速。近年来,学校师生在工作、学习、日常交流中广泛使用手机、平板、社交媒体等新平台,移动设备产生的浏览、搜索和下载数据,以及QQ、微博、论坛等社交媒体产生的非结构化数据飞速增长,这些数据具有增长迅猛、时效性强的特点,及时分析才能有效利用;(4)职业教育数据的价值巨大但密度较低,海量的数据隐含着巨大的价值,但由于其中包含许多无用的信息,也呈现出低价值密度的特点。如何利用职业教育大数据为职教事业服务是一个值得研究的课题。
(二)研究进展
职业教育大数据服务的需求受到了学界的广泛关注。孙钰林[1]从职业教育系统论的角度,探讨了大数据在职教理念、专业设置、课程开发等10个维度的应用,构建职业教育的大数据应用路径。南旭光[2]认为,与传统教育相比,大数据时代的教育呈现出个性化辅导、自主学习、弹性学制、关注个人成功等特质,大数据的价值在于让教育者真正读懂学生,成为“智慧教育”。王梦君等[3]探讨了大数据时代职业教育革新趋势,包括智能化教学和泛在学习的趋势,全体数据的“多向相关性”研究思维趋势,服务型管理和以数据为基础的决策趋势,以及多元维度的教学评价趋势。胡伏湘[4]探讨了基于大数据的智慧职教,提出依托大数据的教育信息化平台是智慧职教的支撑载体,依托智慧职教平台可以实现翻转课堂、云班级教学等创新教学模式。杨雪平等[5]提出采用物联网、云技术和大数据等新技术构建智能化教学环境,整合教学资源、实现资源共享和提升管理水平,实现智慧教学和智慧管理。
学界对职教领域的大数据服务开展了探讨,提出了有价值的应用方法和服务策略。但是,当前的研究尚处于初级阶段,特别是还缺乏有关高中职院校大数据具体应用模式、实现路径的研究。党的十九大报告提出,完善职业教育和培训体系,深化产教融合、校企合作。职业教育是国民教育体系的重要组成部分,职业院校肩负着培养高素质技能技术人才的重任,有必要对职教大数据应用进行深入研究,使之更好地服务于职业教育,助力职业教育走向智慧职教。
(三)现实挑战
目前,高中职院校的教育大数据应用正处于起步阶段,开展大数据服务在方法、技术、资金等方面都存在现实困难,面临着挑战。
1.职业教育大数据具有多源异构的特点,给数据整合和存储带来了挑战。异构数据具有不同的类型,其存储格式和存储方式迥异,不同数据库之间的关联方式和关联程度也有很大差别。如果只是将来源各异类型多样的数据简单地堆砌在一起,将难以进一步进行有效的数据挖掘和知识发现,极大地阻碍职业教育大数据展现价值。此外,整合后的海量数据需要合适的存储,以供实时分析和访问。传统的数据整合和存储方式不能满足职业教育大数据的管理和应用需求,需要新的技术对数据进行统一管理。
2.职业教育大数据展现数据智慧,给大数据分析带来了挑战。职业教育既有教育的一般规律,也有不同于高等教育、初等教育等其他教育的特殊性,职业院校开展大数据服务需要结合职业教育的理念、内容、方法,以及学生的特点来进行。与基础教育和成人教育相比,职业教育对于人才的培养更为注重技术技能,强调理论实践一体化,更突出“以学生为中心”。因此,需要有先进的大数据分析方法和应用技术应对方案,提供特定教学和学习场景下的支持服务。
3.有限的资金投入和落后的計算设备也给职业院校开展大数据服务带来挑战。随着职业教育数据量的急剧增加,所需要的存储和计算规模也随之剧增。普通职业院校,尤其是中职学校受经费限制,无法投入大量资金来购置服务器硬件设备和软件设施,必须另辟蹊径,寻求有效的解决方案。
二、人工智能和职业教育大数据
(一)人工智能解读
2017年国务院印发《新一代人工智能发展规划》,2018年李克强总理再次在两会政府工作报告中提及人工智能,要求“实施大数据发展行动,加强新一代人工智能研发应用”。大数据蕴含价值,而人工智能则使大数据展现数据智慧,发挥价值。1956年达特茅斯学术会议上,美国计算机科学家约翰·麦卡锡首次提出“人工智能”一词,标志着“人工智能”学科的正式诞生。人工智能领域的专家学者致力于提高机器解决复杂任务的能力,经过60多年的努力,取得了很多成果。棋类人机大战尤其引人注目。1997年,IBM公司的深蓝超级计算机击败国际象棋世界冠军卡斯帕罗夫。2016年,谷歌公司的AlphaGo击败围棋世界冠军李世石。近年来,人工智能技术进步迅速,在教育、医疗、交通等各个领域显示出广阔的应用前景和巨大的经济潜力,成为新的国际竞争焦点。
人工智能是一门关于知识的学科。[6]《人工智能标准化白皮书(2018版)》将人工智能(Artificial Intelligence, AI)定义为“利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统”[7]。人工智能分为感知智能和认知智能,感知智能使机器具有听觉、视觉的功能,认知智能使机器能理解人类的语言和知识。机器学习(Machine Learning,ML)、知识图谱(Knowledge Graph,KG)和自然语言处理(Natural Language Processing,NLP)是构建智慧大脑的三项核心人工智能认知技术。
(二)人工智能在职教大数据应用中的优势
人工智能对于分析海量职业教育大数据进而获得洞察力有独特的优势,结合开源云计算平台,为構建职业院校智慧大脑,赋能智慧职教提供了方法和技术上的支持。
1.规整和融合职业教育大数据的优势。通过自然语言理解、深度学习,对文本、课件、教学视频等非结构化数据进行分析和挖掘,提取知识和实体。通过机器学习在教育资源、师生信息中发现关联关系。将海量职业教育数据转化为以实体关系为主体的语义网络,构建知识图谱表征实体及其相互之间的联系,实现非结构化数据和结构化数据相互融合。
2.分析和挖掘职业教育大数据,提供智慧服务,助力智慧职教的优势。采用人工智能技术,可以充分挖掘职教大数据的潜力,提供智慧服务,实现“以学生为中心”的教育和管理,为职业人才培养服务。培育学生善于学习的智能型素养、人机协同的创造型素养,促进学生从工具型人才向智慧型人才转变。[8]以混合式教学而言,该教学模式融合传统教学与网络教学的优势,对职业院校培养学生综合素质有重要意义,有助于学生成为高效的学习者,更好地适应社会。[9]人工智能为课堂教学和在线学习的有机结合提供了新的技术手段,对混合式教学有良好的促进作用,将促使教学向个性化、精准化和智能化方向发展。[10][11]
3.开源云计算支持平台的优势。利用开源云计算支持平台,职业院校可以以较小的资金代价搭建高性能集群计算环境,开展大数据服务。Hadoop是目前应用最广泛也最成功的开源云计算平台,它由Apache基金会开发,核心功能是分布式文件系统HDFS(Hadoop Distributed File System)和分布式计算框架MapReduce。MapReduce是一个设计精良的并行计算框架,能自动完成大数据的并行化处理,HDFS具有高容错性的特点,能够在价格低廉的硬件上应用。MapReduce是批处理引擎,而UCBerkeley AMP实验室开发的类MapReduce通用并行框架Spark擅长流处理,能快速处理动态大规模数据,为机器学习等人工智能技术提供了更为优越的框架。
三、基于人工智能的职业教育大数据应用模式
(一)职业教育大数据应用模式框架
以机器学习、自然语言处理和知识图谱为主的人工智能技术是促进职业教育大数据价值演化的关键。多源异构大数据进行采集、清洗、转化,加载到大数据平台后,转换成各类有用的信息。将信息进一步提炼,通过知识构建与管理的手段,信息转化为知识,在一系列知识图谱的基础上,可以开展知识计算。最终应用场景模型结合知识计算的能力,以及对大数据平台的数据进行机器学习的能力,形成职业院校的智慧大脑,提供面向智慧职教的大数据智慧服务。本文设计的基于人工智能的职业教育大数据应用模式框架如图1所示。
(二)数据收集、存储和计算
职业教育大数据按产生对象分,主要有三类:教育资源数据、学生数据、教师数据。职业院校要应用大数据,首先需要一个大数据平台对海量多源异构数据进行统一管理。以自然语言处理、机器学习和图数据库为主要人工智能和数据库技术建立职教大数据的Hadoop云计算基础支持平台,对数据进行收集、存储和计算。通过自然语言处理技术进行实体挖掘、关系抽取、属性提炼,并用机器学习技术提高这一处理进程的效率和结果准确度。通过知识图谱保存提炼出来的具有关系特征的各种数据。知识图谱是基于图的数据结构,目前工业界普遍采用图数据库存储知识图谱。图数据库可以直观高效地存储千百亿个节点和关系,为知识推理、知识快速查询、图实时计算等知识图谱上层应用提供支持。
(三)知识构建与管理
运用知识管理理论和构建手段,建立职业教育知识图谱,其流程大致分为4个阶段:知识建模、知识获取、知识融合、知识计算。
1.知识建模。建立知识图谱的数据模式,对整个知识图谱的结构进行定义。以资源、学生、教师、课程知识点等实体为主体目标,实现对多源数据进行映射与合并。利用属性全面描述不同数据源中的实体。利用关系表示实体之间的关联,从而支持关联分析。利用实体链接技术对实体的多种类型数据进行关联存储。
2.知识获取。从不同来源和结构的数据中提取知识。职教大数据中有大量的文本信息,比如试卷、试题练习、课程PPT、电子教材和图书、文献资料、社交文本等。采用自然语言理解技术对文本深度分析和理解,进行实体识别和关系抽取。采用深度学习技术分析和理解图像、音频、视频等多媒体教育资源,实现资源信息到知识的转换。深度学习技术中,卷积神经网络和递归神经网络应用最为广泛。深度学习不同于传统机器学习技术,具有自动提取特征的能力,可以将慕课、微课等大量教学视频音频资源转换为语义表示。
3.知识融合。对获取的知识进行知识融合,构建知识图谱,实现来源形态各异的海量职教数据的整合。知识融合主要包括数据模式层融合和数据层融合。前者包括概念合并、概念上下位关系合并等,后者包括实体合并、实体属性融合等。当今科学技术的发展日新月异,要培养满足企业需要的技术技能型人才,职业院校需要不断改革教学内容和知识。对于职业教育大数据而言,不仅需要高效融合已有的海量数据,还需要实时融合新增知识。
4.知识计算。在建立的知识图谱上进行知识计算,实现知识挖掘和知识推理。知识计算主要包括图挖掘计算和推理计算。图挖掘计算采用基于图论的算法对知识图谱进行探索和挖掘。知识图谱是一种网状的图结构,呈现了实体之间复杂的关联关系,对知识图谱进行分析和挖掘可以得到宏观互联特征,比如学生之间、教师之间、师生之间的人群社交拓扑特征,学习资源之间、学科知识之间、学生和知识之间的关联拓扑特征等。推理计算包括基于本体的推理和基于规则的推理,通过推理发现新知识,例如发现学生的隐性兴趣和需求。
四、智慧服务探讨
应用人工智能技术,使职教大数据展现数据智能,提供智慧服务,进而实现智慧职教是职业教育的发展趋势。近年来,针对学生的个性化学习服务和知识服务是教育研究的两个重要主题,本文围绕这两个主题探讨职教大数据服务。[12][13]
(一)个性化学习服务
职业院校强调学生专业技能和實践能力的培养。近年来,理实一体化教学、混合式教学、探究性教学、翻转课堂等新的教学理念和教学模式不断提出,在职业院校得到了广泛应用,为提高职业教育教学质量提供了新的有效途径。学生成为中心,教师则通过讲授和组织协作来满足学生的学习需要,促成其个性化学习。高质量的个性化学习将极大地激发学生的积极性,提高学习效果。
对学生的全面了解是为学生提供个性化学习服务的前提。不同学生的学习情况千差万别。例如,有的学生有很高的学习热情,有的学生学习积极性不高;对于同一门课程,有的学生对理论知识掌握得较好,但是实践能力欠缺,有的学生则相反。大数据记录了学生在使用教育资源和学习活动过程中的数据,人工智能使得提取数据智能,实现数据驱动的个性化教育成为可能。从学生学习、行为、社交等各类数据中发现其知识水平、学习风格、兴趣偏好、资源需求等,构建学生知识图谱,对学生画像,把学生画像的必备要素条理化、标准化、结构化、动态化,根据学生画像为学生提供个性化学习支持和服务。例如,对于学习热情不高的学生,为其提供趣味性强的音频视频等学习资源,激发其学习兴趣;发现学生某一方面知识水平低,则为其提供定制学习,让学生进入特定的知识学习环境,帮助学生补齐短板。
(二)知识服务
职业教育培养和提升学生的职业能力,而能力以知识为基础。传统上,学生的知识获取来源于教师传授,互联网平台只是提供信息服务而非知识服务,如今大数据和人工智能为知识服务提供了资源和技术支撑。利用人工智能技术对原始知识资源进行深度加工,提炼出知识精华,提供方式智能化、内容智慧化、覆盖泛在化的知识服务。[14]在混合式教学、探究性教学等教学过程中,为学生提供知识服务,深入知识探究、整合和应用过程,促进知识理解,激发知识创新。
利用机器学习和图挖掘技术,分析和挖掘学科知识图谱,可以提供知识检索、知识问答、知识导航、知识推荐等知识服务。知识检索识别查询关键词所涉及的知识实体或属性,返回与查询实体相关的知识卡片;可视化知识导航显示知识之间的关联,立体化地展示知识结构,方便学生在脑海中建立知识网,全面、整体地掌握知识;智能化知识问答在准确理解学生意图的基础上给出提问的准确回答。情景化知识推荐感知学生所处的学习内容、时间、地点、设备等情景,满足学生特定情景下的知识需求。例如,在软件项目综合开发实训阶段,学生需要综合运用多方面的知识和技能才能完成企业级项目设计和开发,推荐契合情景的知识,完善学生的知识链和技能体系,促进知识到能力、知识到智慧的转化。
五、结束语
本文针对职教大数据应用面临的数据整合、数据分析、职业院校资金受限三个主要挑战,提出以人工智能方法和技术,结合云计算平台,挖掘大数据价值,赋能职业教育,并构建基于人工智能的职教大数据应用模式,以自然语言处理、机器学习、知识图谱为核心技术,融合职教大数据并从中提取智能,提供个性化学习服务、知识服务等智慧服务。本文的研究对职业院校利用人工智能,开展基于大数据的智慧服务,进而实现智慧职教有一定的参考价值。
参考文献:
[1] 孙钰林. 大数据在职业教育中的应用[J]. 中国高教研究, 2017(4).
[2] 南旭光. 大数据驱动职业教育人才培养的价值逻辑与创新路径[J]. 教育与职业, 201(20).
[3] 王梦君, 张璐. 大数据时代职业教育革新趋势与策略[J]. 教育与职业, 2017(12).
[4] 胡伏湘. 基于大数据的智慧职教——内涵、平台设计与应用[J]. 中国职业技术教育, 2017(3).
[5] 杨雪平, 陈光海, 韩晋川. 基于大数据的职业教育智慧云平台教学环境构建[J]. 职教论坛, 2018(7).
[6] 唐晓波, 李新星. 基于人工智能的知识服务研究[J]. 图书馆学研究, 2017(13).
[7] 中国电子技术标准化研究院. 人工智能标准化白皮书(2018版)[EB/OL]. [2018-01-24]. http://www.cesi.ac.cn/201801/3545.html
[8] 鲁石. 人工智能视角下的高校职业素养教育[J]. 教育与职业, 2018(7).
[9] 刘俊玮, 马勇. 混合式教学对职业教育学生综合素质的影响研究[J]. 职教论坛, 2016(29).
[10] 吴永和, 刘博文, 马晓玲. 构筑“人工智能+教育”的生态系统[J]. 远程教育杂志, 2017(5).
[11] 戴永辉, 徐波, 陈海建. 人工智能对混合式教学的促进及生态链构建[J]. 现代远程教育研究, 2018(2).
[12] 单永刚, 张吉先, 尹学松, 虞江锋, 陈东毅. 基于元模型的知识服务模式的研究与实现[J]. 中国电化教育, 2017(7).
[13] 杨卉. 教师在线实践社区知识服务模式研究[J]. 电化教育研究, 2016(4).
[14] 柳益君, 李仁璞, 罗烨, 黄纯国, 曹凤雪. 人工智能+图书馆知识服务的实现路径和创新模式[J]. 图书馆学研究,2018
(10).
责任编辑:谢传兵