王丹 邓谦 李俊 肖琴
摘要:在教育深入改革的推动下,学习评价由单一的考试成绩到通过学习过程构建数据综合性的评价模型,而学习评价模型涉及的数据存在权威来源不确定、分散性、质量低、共享性差等问题。文章提出从数据集成与存储、数据治理、数据服务、数据开发4个方面构建一种新的数据治理体系,从底层解决一数多源、采集数据转换成标准化数据,使用数据管理中心统一管理和共享数据。文章通过国内外数据治理的研究,结合笔者实际工作经验,在数据中台建设和实际应用实践中表明,完成校内数据资产梳理和构建管理、业务数据集中转换统一标准数据管理和数据标准化交互共享,能有效地推进高校数据治理工作。
关键词:学习评价;数据治理;数据服务;数据资产
中图分类号:TP301 文献标志码:A
0 引言
2020年10月,中共中央国务院印发了《深化新时代教育评价改革总体方案》,将改革学生评价,促进德智体美劳全面发展列为重点任务之一,构建多元化学生评价体系,完善学生综合评价体系,深化学生评价改革,促进学生全面发展[1]。基于学习评价的改革,许多研究者针对学习评价进行了深入的研究,如刘进等[2]从大数据库建设、新模式开发、研究成果利用等角度,提出大学生学习评价方法论的转向策略;黄涛等[3]提出构建符合度空间数据特征的综合评价框架,完善过程性数据采集与共享机制。但之前的研究者主要关注学习评价的模型、算法等方面的构建和优化,忽视了底层数据质量对学习评价效果的影响,针对学习评价底层数据治理的研究较少。本文在大学生学习评价视域下,针对支撑学习评价的基础数据的治理进行了深入研究,构建了完善的数据治理体系,并通过实践证实,本文构建的数据治理体系可以有效提升支持学习评价的底层数据的数据质量。高校的教学培养方式和学生学习生活方式,在智慧校园建设的驱动下不断地改革创新,替代以考代评的教学方式,为构建多元化和综合性的大学生评价体系提供重要的数据支撑。
1 研究现状
1.1 学习评价的研究现状
学生学习评价作为高等学校教育教学工作的基本组成部分,学生学习评价对于学生学习的督促、学生管理的加强、教学质量的检查和教育教学改革的推动,都有着重要的指导和现实意义。对学习评价进行研究,是高校推进创新人才培养、促进学生发展的关键。而教育教学评价工作,则对学生学习发挥诊断、反馈、改进、激励、强化等功能[4]。当前的学习评价的研究主要是针对学习评价模型、学习评价工具标准和前沿技术应用的改进,如杨院[5]提出通过学生学习过程、学习成果以及职业能力评价实践活动,突显学生主体性、客观性、就业能力;桑德拉·米丽根等[6]提出开发学习评价工具的测量分析标准,确保学习评价工具的信效度;张家华等[7]通过多维度全面采集和分析学习过程动态数据,构建多模态学习评价。但这些研究往往忽略了学习评价底层数据的权威性、准确性、分散性和完整性。因此,如何集成和使用数据,利用现有的校内数据资源为学习评价提供数据分析支持,数据治理工作如何有效地开展,已成为当前高校数字化建设中亟待解决的一个重要问题。
1.2 高等学校数据治理研究现状
随着高校信息化的不断建设发展,业务数据呈多元化,高校对数据不再仅仅局限于简单的管理与主题分析,更迫切希望通过数据的深度挖掘,推动高校精准化与高效化的管理与决策。《省教育厅关于印发推进高校教学数字化指导意见的通知》(苏教高〔2023〕1号)要求推动信息技术与教育教学融合创新,推进高校数字化转型,提升学生数字化学习能力与数据治理能力[8]。实现数字化校园建设,加强推动高校相关部门数字化建设、教学生活相关数据分析、建设长周期与多维度的学生画像、业务流程、数据挖掘等师生服务与教学办公应用建设。数字化校园建设过程中,数据在不同系统之间流转,所以数据的沉淀和共享在数字化校园建设过程中起到了“穿针引线”的作用,是整个数字化校园的闭环核心点。当前主要的数据治理工作更关注平台或者全域,如刘雅琴等[9]提出基于“一张表”平台推动面向高校教师的数据治理,完善数据资产,提升数据质量;张辉等[10]提出围绕数据全生命周期的业务逻辑,构建数据治理体系建设三层次模型、递进式框架和分段实施路径,助力高校数字化转型和现代化教育模式建设,但缺乏针对学习评价这一垂直领域的数据治理研究。
近年来,高校的信息化建设过程中,形成了以“人、财、物”为服务对象的各种业务应用管理系统,同时积累了以“人、财、物”为核心的业务数据。但由于早期的信息系统建设缺乏统一的业务规划,各业务厂商建设水平、参考规范和开发技术不同,相关数据分散在各业务部门系统或数据文档中,呈现交互共享性低、信息标准不统一、数据冗余、数据孤岛、数据录入质量低、历史数据不完善等问题,致使数字化校园建设在底层数据通道方面存在不少“障碍”。随着教育部对现代高校数字化校园建设的进一步要求和规范,需解决数据“聚”“治”“通”“用”的问题,形成高校在数据治理建设过程中的数据采集、清洗、治理、存储、管理、共享、使用等充分闭环的数据生态,保证数据的处理能力与管理水平。
2 学习评价视域下数据治理体系构建
2.1 数据治理体系
从数据的采集、治理、存储、数据挖掘分析、共享及应用整个数据生命周期,构建数据治理平台体系架构,如图1所示。数据治理架构体系由数据存储层、数据治理层、数据服务层、数据开发层、数据应用层组成,除数据应用层外,其他构建形成了一个数据中台。
2.2 数据存储层
根据高校行业特性,参考其他企业数据标准规范,数据存储库分为贴源层(ODS)、标准层(DWD)和应用层(ADS,DM),数据治理数据存储流程如图2所示。
通过批流一体式数据集成技术将数据按照原始数据形式采集存储到ODS层,同时将数据同步到数据湖中,在数据湖中将存储备份与业务源头结构和类型一致的数据信息。原始数据存在标准和规范等问题,按照国家标准或教育部标准,结合学校实情,对原始数据进行清洗、转换、规范化,形成统一、标准、规范的数据,存储至数据标准库。数据应用库作为上层数据应用建设的支撑分为主题数据库和标签指标库。主题数据库用于创建教学、科研、学工、图书、资产等各类数据分析主题、迎新和离校推文等应用专题;標签指标库是用于存储将师生的基础数据、业务数据、行为数据抽象成具有特征标识的标签化数据,主要用于综合分析、师生画像、学生学习评价等。
2.3 数据治理层
数据治理层是数据治理架构体系中的重要组成部分,通常为了解决数据质量、安全,包含元数据管理、标准管理、质量管理、数据安全管理、运行监控管理等功能。
元数据管理由元数据驱动数据治理,关联数据业务源,数据湖、标准层和应用层独立管理。在元数据管理推动下,数据建设围绕全业务和数据仓储从数据理解、元数据识别、模型定义等实现统一管理口径。标准管理包含代码标准管理和数据标准管理,用于统一规范校内代码标准、业务数据接口标准、数据集成标准和数据模型标准。
数据质量管理是基于数据指标、质量检核、发现问题和问题监控追踪的完善的数据质量管理体系,发现和解决数据问题。建立“谁产生、谁维护、谁负责”的数据质量监督评价机制,督促业务部门承担数据质量把关责任,确保源头数据的真实性、准确性、完整性和及时性。数据安全管理是在数据达到统一管理且质量提升时,保证共享数据的安全性,有效地规避因数据获取方管理不善而造成的数据外泄,避免数据应用侵犯师生隐私等情况。数据监控管理围绕数据集成、数据血缘、数据开放、审计检测、数据资产量、数据治理绩效、数据应用关联、数据影响性分析、底层数据库性能监控等。
2.4 数据服务层
数据服务层是校级数据中心面向各类用户(师生普通用户、信息管理中心、业务部门、第三方厂商)的展示使用平台。数据服务平台为业务部门、业务厂商提供数据共享开放入口,推送业务数据到新业务系统库,实现数据的快速使用。业务部门可在平台查看、上报、管理部门数据资产,申请查看其他业务部门数据资产,能够快速检索和定位所需数据项,掌握部门数据的来龙去脉,了解数据质量问题,明确数据权责。
2.5 数据开发层
数据开发从关系型数据、大数据、消息数据等读取数据进行计算处理,通过机器学习、数据挖掘、统计分析进行数据建模,具有全场景、高安全的数据资源开放与共享接口开发、注册和監控功能。数据开发平台对数据接口进行封装,可提供各类业务、主题的相关数据接口,利用并行计算完成计算密集型任务支撑上层应用,计算模型可供多个应用共享。计算模型包括数据业务模型API、分析接口、计算模型API、数据上报API、主题分析API等,为应用开发提供统一、标准的数据支持。
2.6 治理后的应用
针对学生学习成绩制定的学习评价是单一的、不准确的,无法体现学生的学习过程,应着重从“德智体美劳”5方面综合制定学习评价体系。学习评价所需的数据是学生在校内学习和生活过程中产生的,主要分布在教务、学工、团委、科研、图书、后勤等。通过数据中台数据通用集成开发模块对涉及学生数据系统进行采集,同时将满足入数据湖的业务系统数据同步到数据湖中,实现实时读取使用,如图3所示。
数据进入贴源数据库和数据湖后,将对接数据进行清洗转换成标准的数据信息存储到数据标准库,数据标准管理将校内所有数据划分成八大域,分别是公共服务域、行政管理域、教工数据域、学生数据域、科研数据域、财务数据域、教学数据域和资产数据域,其中学生数据主要分布在公共服务域(图书、后勤公寓、网络、校园卡、门禁等),学生数据域(包含从入学到离校全生命周期数据)、科研数据域、教学数据域(教务、第二课堂)、财务数据域。通过数据质量管理可实时监控数据集成情况、是否有违规数据和代码标准率,如图4所示。
根据业务需求,从标准库中读取数据,构建学生成绩排名、图书借阅、消费、上网行为等主题信息并存储到主题库,支撑主题数据应用分析、数据报表输出和学生从到校到离校整个生命周期记录。主题库的支撑数据分析展示比较明确,但往往业务部门希望看到的是多方面的数据分析,例如学生学习评价、教师综合评价。标签体系的数据可有助于数据自由组合并形成一个比较多方面且完善的数据分析,从标准库中读取数据信息,通过算法模型、指标模型和计算模型计算,按照基本属性、能力属性、行为属性等进行标签化的划分,形成一个指标库。
2.7 应用结果分析及建议
通过数据治理体系在学校学习评价中的应用,明确学生学习、图书借阅、消费、上网行为、公寓管理等数据的权威来源,依据数据标准管理要求对采集数据进行统一的清洗、转换,形成标准的数据存储到数据库中,构成统一的数据管理与共享库,提高底层数据质量,解决数据交互共享和标准不统一等问题。因高校业务复杂,数据来源多样化,数据管理体系需进一步优化,提升数据质量和数据安全,同时,需建立、健全应用系统部门的数据质量考核和评价机制,以保证底层数据的准确性、及时性和规范性。
3 结语
大学生的学习评价是现在高等教育的研究热点,是体现现代教学效果的重要标志。大学生学习评价体系的构建,需要校内大量的基础数据作为支撑,但高校数据存在着相关数据分散在各业务部门系统或数据文档中、交互共享性低、代码标准不统一、数据质量参差不齐、历史数据不完善等问题。本文通过聚焦学习评价这一重点领域,分析学习评价需要的底层数据特点,构建针对性的数据治理体系,通过实践,可以得出本文构建的数据治理体系可以有效地提升学习评价的底层数据质量,提高学习评价的精准性,减少数据预处理的时间,为大学生学习评价的进一步研究提供了夯实的数据基础。
参考文献
[1]中共中央国务院.深化新时代教育评价改革总体方案[EB/OL].(2023-01-16)[2023-06-01].https://www.gov.cn/gongbao/content/2020/content_5554488.htm.
[2]刘进,高胜寒,林松月.从标准化到数据化:基于大数据的大学生学习评价研究方法论转向[J].现代教育技术,2022(9):31-37.
[3]黄涛,赵媛,耿晶,等.数据驱动的精准化学习评价机制与方法[J].现代远程教育研究,2021(1):3-12.
[4]牛虧环.大学生学习过程评价的现状、问题及对策——基于全国16所本科高校的调研[J].大学教育科学,2017(6):42-49,121.
[5]杨院.大学生学习评价的逻辑、实现与优化[J].中国高教研究,2015(8):107-110.
[6]桑德拉·米丽根,张忠华,等.大数据、人工智能与学习评价方式[J].北京大学教育评论,2019(4):45-57,185.
[7]张家华,胡惠芝,黄昌勤.多模态学习分析技术支持的学习评价研究[J].现代教育技术,2022(9):38-45.
[8]江苏省教育厅.省教育厅关于印发推进高校教学数字化指导意见的通知[EB/OL].(2023-01-16)[2023-06-01].http://jyt.jiangsu.gov.cn/art/2023/1/16/art_77619_10727462.html.
[9]刘雅琴,毛文卉,吴驰,等.基于“一张表”平台推动面向高校教师的数据治理实践[J].现代教育技术,2022(1):118-126.
[10]张辉,李健明,杨强.大数据视角下高校数据治理体系研究与实践[J].中国高等教育,2022(增刊2):16-18.
(编辑 沈 强)
Practice of underlying data governance from the perspective of college students learning evaluation
Wang Dan1, Deng Qian1, Li Jun2, Xiao Qin1
(1.Informatization Construction And Management Of Center, Jiangsu University Of Science And Technology, Zhenjiang 212000, China; 2.Network Operation and Maintenance Center, China Telecom Zhenjiang Branch, Zhenjiang 212000, China)
Abstract: Driven by the in-depth reform of education, learning evaluation has changed from a single test score to a comprehensive evaluation model of data built through the learning process. However, the data involved in the learning evaluation model has problems such as uncertain authoritative sources, decentralization, low quality, and poor sharing. This study proposes a new data governance system architecture constructed from the four aspects of data integration and storage, data governance, data services, and data development. It solves the problem of multiple data sources from the bottom layer, converts collected data into standardized data, and uses the data management center to uniformly manage and share data.Based on the research on data governance at home and abroad and the authors practical work experience, this research is applied to the construction of data center platform of Jiangsu University of Science and Technology. Practice results show that: this study can complete the sorting and construction management of data assets on campus, unified standard data management and data standardization,interactive sharing of business data centralized transformation, and effectively promote the data governance of universities.
Key words: learning evaluation; data governance; data service; data assets