董晓晓 周东岱 黄雪娇 顾恒年 李振
[摘 要] 教育领域知识图谱是教育人工智能需要优先开展的基础性工作。知识图谱模式是图谱构建的核心,但既有研究中欠缺对图谱模式的关注。文章提出了一种以学科核心素养发展为导向,根据教育领域知识进行目标分解、子领域划分、应用需求和边界确立,融合知识组织与教育教学原理规律来定义实体类型、实体属性和实体关系的教育领域知识图谱模式构建方法。基于该方法,构建了面向学科知识体系的高中物理学科知识图谱模式,并以高中物理 “电磁场与电磁波初步”知识模块给出了学科知识图谱的示例,该图谱在实际教学应用中取得了良好的效果。
[关键词] 学科核心素养; 教育领域知识图谱; 知识图谱模式
[中图分类号] G434 [文献标志码] A
[作者简介] 董晓晓(1993—),女,山东临沂人。博士研究生,主要从事教育知识图谱研究。E-mail:dongxx336@nenu.edu.cn。
一、引 言
2012年,Google知识图谱(Knowledge Graph)作为知识组织和知识表示的最新技术,实现了大量无序资源信息的有序化组织与结构化重构,成为新时代知识表示最具潜力的发展方向[1]。《新一代人工智能发展规划》将知识图谱构建与学习技术视为新一代人工智能的关键共性技术之一,并提出要构建涵盖数十亿实体规模的多源、多学科和多数据类型的跨媒体知识图谱[2]。任友群认为在人工智能时代背景下,面向不同层次教育的知识图谱是实现个性化授导的基础,是教育人工智能领域需要优先开展的基础性工作[3]。
知识图谱在教育领域的研究由来已久,早期可视化表征教育前沿、热点以及发展趋势时提及的知识图谱为“科学知识图谱”[4]。现阶段,伴随人工智能在教育领域的快速融合发展,教育领域所提及的知识图谱主要指Google知识图谱在教育领域的融合发展,伴随出现的有教育知识图谱、学科知识图谱等概念[5-6]。知识图谱模式(Knowledge Graph Schema)是对领域内概念、概念属性及概念间关系的抽象表达与存储,确定知识图谱模式是知识图谱构建的核心[7]。梳理分析教育领域知识图谱既有研究发现,研究者多从技术角度关注教育领域知识图谱的构建,欠缺对教育领域知识图谱模式构建的关注,少数涉及教育领域知识图谱模式的相关研究,也没有在方法层面给出相应阐述。通用知识图谱和其他领域知识图谱的模式构建虽具备一般性,但缺少教育领域特征地融入与细化,难以对教育领域知识图谱模式的构建提供有效指导。鉴于此,我们在系统梳理分析的基础上,深入探究满足教育教学需求的知识图谱模式构建方法,以期进一步推动教育领域知识图谱的应用与发展。
二、教育领域知识图谱模式构建研究综述
教育领域知识图谱模式构建的目标是对教育领域知识图谱实体、属性及关系进行明确界定,对其可行的范畴加以明确说明[8]。当前,研究者们普遍采用本体来管理知识图谱模式层[9,7],通过七步法、骨架法、TOVE等方法定义本体的概念类、概念类属性和概念类关系,也就是定义知识图谱模式的实体类型、实体属性和实体关系[10-13]。在全面检索既有教育领域知识图谱相关研究的基础上,我们遴选了与图谱模式高度相关且有代表性的文献,按照图谱模式构建方法与结果进行梳理分析,见表1。
分析发现存在以下几方面问题:(1)既有教育领域知识图谱模式构建对其目标定位、边界或应用范围界定不够明确也不尽相同,未有效落实学科核心素养发展的教育理念,据此构建的图谱亦不能有效满足当前教育教学的实际需求。(2)教育领域知识图谱与非教育领域知识图谱相比有其独特的目标定位和应用需求,其构建需要教育领域知识的融合与指导,但已有构建中都少有相应的体现,存在融合切入点不明晰、缺少抓手问题。(3)既有教育知识图谱模式中实体类型、实体属性和实体关系的确定缺乏显性依据和系统考量,多是简略提出依据“学科教学规律”“教学大纲”等笼而统之的主观认定,欠缺科学性和准确性保证,且不同程度的存在实体类型和实体属性区分不清晰、属性定义不明了,以及实体关系定义与教育领域特征欠适配等问题。
三、学科核心素养发展导向的教育领域
知识图谱模式构建方法
目標是要达到的境地或标准。核心素养是我国教育方针的具体化,要解决当前教育领域知识图谱尚不能满足教育教学实际需求的问题,首先需要以学科核心素养发展为导向对教育领域知识图谱进行教育目标价值定位和应用需求分析,明确其构建目标与应用范围;其次,要根据教育教学基本原理,将教育领域知识图谱的总体目标定位与应用范围进行有效分解与逐级精化,突破教育领域知识融合切入点不清晰、缺少抓手问题;此外,还需充分融合知识组织领域及教育教学领域的原理规律,系统定义实体类型、实体属性和实体关系,以保证模式的科学性和准确性。基于此,我们提出以学科核心素养发展为导向,根据教育领域知识进行目标分解、应用需求和边界界定、子领域划分,融合知识组织与教育教学原理规律来定义实体类型、实体属性和实体关系的教育领域知识图谱模式构建方法,构建流程如图1所示。
(一)学科核心素养发展导向的教育领域知识图谱模式构建目标及应用需求分析
正确理解与明确教育教学目标是教育领域知识图谱模式构建的第一步。培育学生发展核心素养已成为我国新一轮教育教学改革的基本理念和价值追求,核心素养回应了教育教学中“培养什么样的人”以及“如何培养人”的根本核心问题,要“沉浸”到具体学科,通过确定各学科核心素养得以落实[23]。因此,满足学科核心素养发展的价值追求是当下教育领域知识图谱模式构建的总体目标。
在学科核心素养发展目标导向下进行图谱应用需求分析的主要目的是在归纳用途的基础上,厘清图谱的边界或应用范围。通过分析表1,可将教育领域知识图谱的用途大致归纳为面向知识表征(类别一)、面向资源组织(类别二)和面向自适应学习系统应用(类别三)三类。类别一侧重对知识内容的组织表达,具备知识内容的语义信息即可满足需求,但由于缺乏学习资源、学习活动等的语义信息,难以满足类别二或类别三的应用需求。类别三侧重在知识内容表征的基础上,实现对学习资源、学习活动的适应性推送,其图谱模式不仅需要知识内容的语义信息,还需要附加与之相关的学习资源、学习活动等语义信息才能满足应用需求。由此可见,不同应用需求的边界不同,需要知识图谱包含的语义信息也不同。遗憾的是,既有研究大多忽略了对图谱构建应用需求和边界的关注。因此,在模式构建之初,需在学科核心素养发展目标导向下,根据应用需求界定模式构建的边界范围,破解缺少目标定位和应用需求分析、边界不清晰的问题。
(二)学科核心素养发展导向的教育领域知识图谱模式构建目标分解
学科核心素养发展涉及教育者、受教育者和教学内容等多方面要素,因此构建以学科核心素养发展为导向的教育领域知识图谱不能胡子眉毛一把抓,需要将总体目标和应用需求有效分解成各个组成部分,形成系列目标体系[24]。
信息系统分析设计中常采用层次体系结构的方法对复杂问题进行分解,将一个复杂问题分解成一个增量步骤序列。一般而言,教育者、受教育者、教学内容和教学手段是教育构成的四要素,教育内容指用于教育教学的知识体系和资源,教育手段指组织教育教学的活动。教育领域知识图谱的范畴包括对教育领域知识、资源、学习活动等的组织表征,不直接涉及教育教学的主客体(教师和学生)。因此,综合目标分解和层次体系结构原则,根据教育领域知识图谱范畴在教育基本构成要素上的反映,把发展学科核心素养整体目标分解为学科知识子领域、学习资源子领域和学习活动子领域(如图2所示),在每个子领域再根据教育相关原理和规律为模式增加应用所必需的语义信息。
具体而言,学科知识子领域侧重对学科知识内容语义描述;学习资源子领域在第一层基础上附加对学习资源媒体、难度、类型等属性的语义描述;学习活动子领域在前两层基础上附加对学习活动时间顺序、组织策略等属性的语义描述。三者之间存在层级递进的逻辑调用关系。此方法在达成符合教育教学基本原理并适应学科核心素养发展需求的同时,解决了既有研究融合教育领域相关原理和规律切入点不明晰、缺少抓手的问题。
(三)学科核心素养发展导向的教育领域知识图谱子领域图谱模式构建
学科核心素养发展导向下的子领域图谱模式构建是要将学科核心素养的内涵与发展学科核心素养的教育教学需求投影到具体子领域,在各子领域边界内,融合知识组织与教育教学原理规律定义适应于学科核心素养发展的实体类型、实体属性和实体关系。
1. 学科核心素养发展导向下的子领域图谱实体类型定义
实体类型是具有相同特点或属性的实体集合的抽象[25]。为此,在界定学科核心素养内涵结构和实现路径的基础上,明确各子领域支撑学科核心素养发展的核心内容和关键过程,再从中识别抽取符合实体组成部分的名词性关键词,明确实体类型。下面以学科知识子领域为例说明实体类型定义过程。
学科知识体系通常隐藏着“价值旨趣+问题+方法(论)+研究结论”的顺序结构,暗示着支撑学科核心素养发展的学科知识体系主要由学科基础知识与基本技能和学科特有的价值观方法论构成[26]。由此确定学科知识子领域的实体类型主要包括基础知识与基本技能以及表征学科特有价值观和方法论的知识。
根据知识组织的学科性原则[27]和粒度原理[28],知识体系要基于学科规律按照粒度的不同分级处理,并细化到知识表征的最小粒度—知识元[29]。新一轮基础教育课程改革重视以学科大概念为核心,促进学科核心素养落实发展[30]。因此,针对学科基础知识与基本技能确定了学科知识体系的最大粒度(学科大概念)和最小粒度(知识元)。鉴于这两种粒度差距过大,为保证知识组织与教学的平滑过渡,还需在二者之间进一步细化知识层级。我国课程标准采用层级化的知识组织方式,如普通高中物理课程标准按照知识模块、组成模块的知识单元组织学科知识。由此,我们提出以学科大概念为抓手,引入知识元,将基础知识和基本技能知识划分为“学科大概念—知识模块—知识单元—知识元”不同粒度的知识等级,在此基础上定义学科大概念、知识模块、知识单元和知识元4种实体类型。
学科特有价值观和方法论知识(学科核心素养)同样存在内在体系,也要根据各学科核心素养内涵结构明确亚类,将学科核心素养亚类落实到具体学科内容并进行多层次细化,再定义相应实体类型。图3-a和图3-b给出了学科核心素养发展导向下学科知识子领域图谱模式的实體类型概念图和基于Protégé建立的实体类型本体图。
2. 学科核心素养发展导向下的子领域图谱实体属性定义
属性是实体的伴随物,需要依附实体而存在,不能独立存在且不可再分,因实体而得以显现[31]。实体属性的定义是对实体语义信息的补充完善,其覆盖度和精准度一定程度上影响图谱模式表达信息的准确性。但既有研究存在实体和属性区分不清、属性定义不明等问题。为此,我们首先依据属性不可再分的本质特性对实体与属性进行区分,然后为了能够融合知识组织理论和教育教学原理与规律来有效支撑实体属性定义,进一步把实体属性分为通用基础属性和领域特有属性两类。即首先从知识组织的常识性、专业性等原则出发,确定实体的基础属性,然后根据教育教学原理规律确定实体的领域属性。下面以学科知识子领域为例说明实体属性的定义。
首先对已确定的实体类型进行属性检验,检验它们归属于实体类型还是实体属性,然后对确定的实体类型进行属性定义。以知识元实体类型为例,依据知识组织的有序性、常识性、完整性、实用性等原则[32],确定知识元的序号、名称、描述、特征4个基础属性。然后根据认知科学与认知心理学中知识表示的基本原理[33],确定知识元的类型属性;根据学科知识体系层级结构,明确知识元在学科知识体系中的具体位置,定义知识元的层级属性;根据学科核心素养亚类在具体知识元的内容表示,确定知识元所承载的学科核心素养信息。综上,定义知识元实体类型的序号、名称、描述、特征、类型、所处层级、所承载的学科核心素养信息7个属性。图4-a和图4-b给出了学科核心素养发展导向下学科知识子领域图谱模式中知识元的实体属性概念图和基于Protégé建立的实体属性本体图。
3. 学科核心素养发展导向下的子领域图谱实体关系定义
关系是指人与人、人与事物及事物与事物之间相互作用、相互影响的状态,实体关系体现了不同实体之间的内在联系,是知识图谱构建的重要环节。已有教育领域知识图谱的实体关系多由领域专家在本体基础关系上确定,缺少对教育教学领域特有逻辑关系的考虑,存在难以满足教育教学实际应用需求的问题。
学习本质上是一种蕴涵顺承、因果、调用等关系的活动,能够有效揭示学习活动演化规律与逻辑。教学逻辑是教师基于对学科教学与学生发展关系认知基础上形成的关于教学内容与教学活动序列安排的构想,合理的教学逻辑要契合学科知识的结构逻辑和学科知识认知逻辑[34-35]。因此,为了在学科核心素养发展导向下确定既契合学科知识结构逻辑和学科认知逻辑规律,又彰显学习活动演化规律与逻辑的实体关系,我们从知识的基本关系和领域特有关系两个角度定义实体关系。
以学科知识子领域为例,首先依据学科知识结构逻辑和认知逻辑,初步明确知识之间的父子、包含、兄弟、平行4种基本关系,然后依据教学逻辑和学习活动演化的规律,补充前驱后继、因果和调用返回关系,最终确定7种实体关系,见表2。
(四)学科核心素养发展导向的教育领域知识图谱子领域图谱模式融合
融合指不同个体或群体在一定的碰撞或接触之后融为一体,子领域图谱模式融合就是针对上述每一子领域图谱模式定义的实体类型、实体属性和实体关系进行融合,形成一个完整统一的知识图谱模式。
在图谱模式构建过程中,获取的实体类型、关系和实体属性通常会产生大量的冗余信息。比如,根据基础教育教学资源元数据规范[36],学习资源子领域中课程内容属性指该资源与国家课程标准内容框架的对应关系,其与学科知识子领域中知识元的来源属性指向同一个属性,则需要在图谱模式融合阶段进行聚类归并处理,以降低图谱模式的冗余度。此外,实体关系的确定既要考虑同一层级实体类型之间的语义关系,也要考虑不同层级实体类型之间的关联关系。比如,学科知识子领域、学习资源子领域和学习活动子领域三者之间存在层级递进的逻辑关系,故要在不同子领域之间考虑添加调用返回关系。
因此,子领域图谱模式融合主要包括两方面工作:一是结合教育领域知识,通过对各子领域图谱模式的消歧和共指消解进行融合;二是基于教育领域知识对各子领域知识图谱模式中的实体关系进行补全处理。
(五)学科核心素养发展导向的教育领域知识图谱模式校验
为保证图谱模式满足实际教育教学的应用需求,需要对其进行评估与校验,但此前尚无系统的模式评价标准和评价方法。既有教育领域知识图谱模式多通过专家校验方法确定,主观性强,且针对性不足[37]。为此,我们在所提出教育领域知识图谱模式构建方法和实践基础上,提出图谱模式校验的三个基本原则:一是对学科核心素养发展目标的一致性进行校验,保证学科核心素养发展目标贯穿图谱模式构建始终;二是对边界范围是否符合应用需求进行校验,保证图谱模式的实用性;三是对图谱模式是否符合教育教学规律进行校验,保证图谱模式的科学性和准确性。
四、学科核心素养发展导向下的教育领域
知识图谱模式构建案例
我们基于本文方法构建了面向高中物理学科知识体系的图谱模式,选取“电磁场与电磁波初步”模块给出了高中物理学科知识图谱的构建结果示例并进行了教学实验。
(一)高中物理学科知识图谱模式构建
依据上文提出的图谱模式构建方法,确定了面向高中物理学科知识体系图谱模式的实体类型(如图3-a、图3-b所示)、实体属性(见表3)和实体关系(见表2),并基于Protégé构建了高中物理学科知识体系的图谱模式,如图5所示。
(二)高中物理学科知识图谱构建示例
依据定义的实体类型,确定了“电磁场与电磁波初步”模块上属的学科大概念和下含的5个知识单元和18个知识元。依据普通高中物理课程标准(2017年版2020年修订),确定了物理学科4个学科核心素养和14个学科核心素养亚类,并将其映射落实至知识元。依据表3对实体进行属性定义,赋予相应属性信息。
在实体关系定义上,以实体类型所在层级为基础,综合考虑层级内部与层级之间的关联,确定了大概念与知识模块的父子关系,知识模块与知识单元的包含关系,知识单元与知识元的父子关系、包含关系,知识单元和知识元内部的兄弟关系、平行关系、前驱后继关系,学科核心素养及亚类之间的父子关系以及知识元与学科核心素养亚类之间的调用返回关系。
在上述基础上,运用Neo4j实现了高中物理学科知识子领域图谱的构建与可视化。如图6所示,包括56个实体,145条关系。
为检验所提图谱模式构建方法的有效性,将高中物理学科知识体系图谱用于实验区展开教学应用实践。该图谱主要用于教师专题备课和学生课后专题复习,教师基于图谱的知识内容和知识间关系全面把握专题内容和结构,并选择适合的知识内容开展专题教学设计,学生按照图谱组织的知识内容和关系完成专题知识体系的梳理,及时查漏补缺。经检验,该图谱教学效果良好,师生反馈效果积极,有效促进了学生知识迁移能力与问题解决能力的发展。
五、结 語
近年来,知识图谱作为支撑人工智能从感知智能向认知智能进阶的重要基础,得到了各大领域的广泛关注。立足教育领域,借助教育领域知识图谱的拓展应用,也为落实学科核心素养发展提供了前所未有的发展空间。本文率先提出了对标学科核心素养构建教育领域知识图谱模式,以及一种以学科核心素养发展为导向,根据教学领域知识规律进行目标分解应用需求和边界确立、子领域划分,融合知识组织与教育教学原理与规律来定义实体类型、实体属性和实体关系的教育领域知识图谱模式构建方法,在一定程度上丰富和完善了当前教育领域知识图谱相关研究,希望为相关研究工作和实践开发提供参考。
[参考文献]
[1] 姜强,药文静,赵蔚,李松. 面向深度学习的动态知识图谱建构模型及评测[J].电化教育研究,2020,41(3):85-92.
[2] 国务院. 新一代人工智能发展规划[EB/OL]. [2017-11-28]. http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.html.
[3] 任友群. 人工智能何以驱动教育变革[J].教育家,2017(44):12-13.
[4] 陈悦,刘则渊. 悄然兴起的科学知识图谱[J].科学研究,2005,23(2):149-154.
[5] 余胜泉,李晓庆. 区域性教育大数据总体架构与应用模型[J].中国电化教育,2019(1):18-27.
[6] 李艳燕,张香玲,李新,杜静. 面向智慧教育的学科知识图谱构建与创新应用[J].电化教育研究,2019,40(8):60-69.
[7] 刘峤,李杨,段宏,刘瑶,秦志光. 知识图谱构建技术综述[J].计算机研究与发展,2016,53(3):582-600.
[8] 张莹莹. 基于知识图谱的舌像诊疗系统研究与构建[D].成都:电子科技大学,2019.
[9] STUDER R, BENJAMINS V R, FENSEL D, et al. Knowledge engineering: principles and methods[J]. Data and knowledge engineering, 1998, 25(1): 161-197.
[10] TROUILLON T, WELBL J, RIEDEL S, et al. Complex embeddings for simple link prediction[J]. International conference on machine learning, 2016, 48(3): 2071-2080.
[11] XU BF, WEN Z, LUO X, et al. Based on ontology: construction and application of medical knowledge base[C]. International Conference on Complex Medical Engineering. China:Beijing. 2007:1586-1589.
[12] 杨玉基,许斌,胡家威,仝美涵,张鹏,郑莉. 一种准确而高效的领域知识图谱构建方法[J].软件学报,2018,29(10):2931-2947.
[13] 刘仁宁,李禹生. 领域本体构建方法[J].武汉工业学院学报,2008,27(1):73-77.
[14] 周炫余,唐祯,唐丽蓉,李璇,卢笑. 基于多源异构数据融合的初中数学知识图谱构建[J].武汉大学学报(理学版),2021,67(2):118-126.
[15] 祁晓慧. 多模态课程知识图谱构建与应用研究[D].长春:吉林大学,2020.
[16] 姜宛彤,王翠萍,唐烨伟,张艳婷. 构建基于知识地图的微课程研究[J].电化教育研究,2016,37(12):93-98,105.
[17] 劉红晶,谭良. 基于教师视角的SPOC课程知识地图构建方法研究[J].电化教育研究,2017,38(9):64-70.
[18] 王亮. 深度学习视角下基于多模态知识图谱的MOOC课程重构[J].现代教育技术,2018,28(10):100-106.
[19] 万海鹏,余胜泉. 基于学习元平台的学习认知地图构建[J].电化教育研究,2017,38(9):83-88,107.
[20] 李振,周东岱. 教育知识图谱的概念模型与构建方法研究[J].电化教育研究,2019,40(8):78-86,113.
[21] 李振,董晓晓,周东岱,童婷婷. 自适应学习系统中知识图谱的人机协同构建方法与应用研究[J].现代教育技术,2019,29(10):80-86.
[22] 黄焕,元帅,何婷婷,吴林静. 面向适应性学习系统的课程知识图谱构建研究——以“Java程序设计基础”课程为例[J].现代教育技术,2019,29(12):89-95.
[23] 余文森. 从三维目标走向核心素养[J].华东师范大学学报(教育科学版),2016,34(1):11-13.
[24] 李葆萍,杨开城. 教学设计理论中亟待研究的几个问题[J].教育理论与实践,2001(12):44-48.
[25] 刁丽娟. 通用本体学习方法及其应用的关键技术研究[D].上海:华东师范大学,2015.
[26] 李润洲. 学科核心素养的遴选及其关系辨析—一种知识结构的视角[J].南京社会科学,2019(4):138-144,156.
[27] 冯儒佳,王忠义,王艳凤,马彬. 科技论文的多粒度知识组织框架研究[J].情报科学,2016,34(12):46-50,54.
[28] 李耀昌,姚伟,刘建准. 基于知识层次的知识组织层次模型[J].情报理论与实践,2010,33(5):10-13.
[29] 索传军,戎军涛. 知识元理论研究述评[J].图书情报工作,2021,65(11):133-142.
[30] 李刚,吕立杰. 大概念课程设计:指向学科核心素养落实的课程架构[J].教育发展研究,2018,38(Z2):35-42.
[31] 亚里士多德. 物理学[M]. 张竹明,译. 北京:商务印书馆,1982:195b30-31,196b11-13,196b34-197a1.
[32] 王知津,王璇,马婧. 论知识组织的十大原则[J].国家图书馆学刊,2012,21(4):3-11.
[33] 洛林·安德森. 布鲁姆教育目标分类学(修订版)[M]. 蒋小平,张琴美,罗晶晶,译. 北京:外语教学与研究出版社,2009.
[34] 董静,于海波. 教学逻辑的价值追求与二维结构的运演[J].中国教育学刊,2015(8):24-29.
[35] 历晶,郑长龙. 课堂教学逻辑的构建[J].东北师大学报(哲学社会科学版),2013(6):278-280.
[36] 中华人民共和国教育部. 教育部关于发布《基础教育教学资源元数据》系列教育行业标准的通知[EB/OL]. [2017-11-01]. http://www.moe.gov.cn/srcsite/A16/s3342/201706/t20170622_307711.html.
[37] 黄恒琪,于娟,廖晓,席运江. 知识图谱研究综述[J].计算机系统应用,2019,28(6):1-12.