面向区域教育的大数据公共服务模型探究

2022-02-22 22:05郑志宏方海光孔新梅洪心
中国教育信息化·高教职教 2022年1期
关键词:教育大数据数据服务

郑志宏 方海光 孔新梅 洪心

摘   要:随着中国进入教育信息化2.0时代,各类教育公共服务平台的建设逐渐完善,数据服务是平台建设和维护不可或缺的部分。为了推动区域内教育大数据互联互通,提高教育数据服务质量,该研究提出了教育大数据公共服务模型。该模型明确了教育大数据服务主体和数据服务类型,梳理了服务主体与数据服务类型的供给关系和三种数据服务平台应该提供的数据服务。此外还分析了国家、区域和学校三个层面的平台应用案例,说明大数据公共服务模型可以通过数据服务对接其他教育服务平台,形成更加融合的数据互联共同体。

关键词:教育大数据;教育公共服务;数据服务;DaaS

中图分类号:G434  文献标志码:A  文章编号:1673-8454(2022)01-0018-13

一、问题的提出

技术的发展不断推动着教育向前探索,互联网技术的应用给教育体系的完善提供了更多的选择。互联网技术给人们带来了颠覆性的变革,教育信息化已成为推动教育发展的重要动力。[1]中国从“教育信息化1.0时代”走向“教育信息化2.0时代”,这是面对新时代教育发展的新要求, 教育信息化在发展理念、建设方式上的一次跃升。[2]互联网技术在教育上的应用为最终的教育目标服务。今年为了应对疫情,教育部发出“停课不停学”的通知,集中国家和各地区的力量与资源为广大学生提供学习资源和学习支持服务。[3]

目前,推动建立数据公共服务体系已经成为各国公共服务发展的趋势。澳大利亚在2013年发布了 “澳大利亚公共服务大数据战略”(The Australian Public Service Big Data Strategy),推动了大数据在该国公共服务中的应用。[4]在我国,各级政府相继建立了不同规模的数字教育资源公共服务平台。教育资源公共服务模式也逐渐从以上传下载资源为主的单一模式,走向以网络学习空间为主要载体的整合、交流、共享。[5]中国大学MOOC也在努力从构建开放教育资源平台转变到构建终身学习公共服务平台。[6]

有学者预测,我国未来移动学习的发展将经历基础环境建设、知识体系化建设和学习服务建设三个阶段。[7]大数据有助于发现真实公共需求、提高公共服务水平。[4]在教育大数据背景下,学习者的在线学习活动和学习行为可以得到全面的跟踪和记录,通过学习者学习行为能够深度挖掘学习者信息,并由此形成立体化数据模型,为学生提供个性化服务。[8]目前已有一些关于大数据公共服务模型的探究,刘邦奇等[9]提出了教育大数据规划的三个关键要素;余胜泉等[10]剖析了区域教育大数据的技术架构,提出构建区域大数据开放生态系统等,但是已有研究未彻底实现当下运行的各类教育服务平台的数据互联互通,平台间仍需要一个协调机制作为各级各类教育服务平台的沟通桥梁。

二、相关概念

(一)数据服务

数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、抽象的符号。[11]服务是为客户提供价值的一种手段,使客户不用承担额外的成本和风险就可获得所期望的结果。[12]数据服务作为一种服务模式,就是为客户提供数据价值的一种手段,使客户不用承担额外的成本和风险就可获得所期望的数据。

数据即服务原本存在于云服务架构中,后来将数据存储和数据处理拆分并实现服务化。数据即服务(Data as a Service, DaaS)是指与数据相关的任何服务都能够发生在一个集中化的位置,如数据聚合、数据质量管理、数据清洗等,再将数据提供给不同用户和平台,而无需考虑数据源。

本研究结合以上两种观点,从数据生命周期角度出发,界定数据服务范围。从某种角度来看,数据服务是指提供数据采集、数据传输、数据存储、数据处理、数据交换、数据销毁等数据各种生存形态演变的一种信息技术驱动的服务。换个角度来看,数据服务就是为客户提供数据价值的一种手段,使客户不用承担额外的成本和风险就可获得所期望的数据。

(二)教育公共服务

公共服务是公共部门提供给整个社会的服务,包括政府提供的公共服务和非营利机构提供的服务。[13]教育公共服务可以解释为由政府主导、惠及社会公众与满足社会教育共同利益需求的公益性服务,教育公共产品可以分为公共产品、准公共产品和私人产品。[14]

世界银行在1989年描述非洲可持续发展危机的报告中首次提出治理理论(governance)一词,该理论在政治和管理领域获得了极大的发展。在治理理论中,管理者与被管理者、统治者与被统治者界限逐渐模糊,认为面对公共服务事务,所涉及的各个主体需要沟通、协调、资源交换等,把除了政府外的其他社会组织纳入到公共服务中来。我国在2013年將公共服务供给事项放入市场当中,从此越来越多的公共服务项目由政府部门、公共组织、私营部门等共同完成。由政府提供、社会各部门参与生产的教育公共服务,可以促进政府职能转变、提高公共服务效率和质量、激励社会组织规范发展、推动教育服务均等化。

教育公共决策决定了教育公共服务的走向,近年来教育公共服务逐渐形成公开透明、多元协商、多元参与的新模式。起促进作用的因素有:行政管理方式的改革和服务导向的政府的建立,建立起良好的公民教育权利表达机制;教育公共决策的反馈机制逐渐发挥作用,政府能及时了解当下所需,尽早改善服务;教育市场的多元竞争,丰富了教育产品的种类,扩大了公民选择的范围。目前,教育大数据公共服务越来越受各地政府重视,提供优质的教育数据公共服务、提升服务质量和教育管理效率等也是政府职责所在。

三、教育大数据公共服务基本架构

(一)服务主体

服务主体是大数据公共服务的主要部分,关涉提供服务的主体和服务的对象,包括政府部门、教育机构、其他组织和个人。

政府部门主要包括教育部、教育厅和各级教育局。政府部门主要职责包括研究拟订教育方针、政策,起草教育相关的法律等;研究提出教育改革与发展战略、发展规划;研究提出各类学校的设置标准、教学基本要求、教学基本文件;负责组织审定各级学校的统编教材等。

教育机构广义是指进行各种教育工作的场所和教育管理机关,狭义指各级各类学校。[15]一般认为,教育机构主要包括学校教育机构和教育培训机构。其中学校教育机构根据办学经费是否属于国家财政性经费可以划分为公立学校和私立学校。学校主要分为五种:幼儿园、小学、初中、高中和大学。根据国家教育统计指标的标准,教育培训机构与学校最主要的区别是是否具有颁发国家承认的学历文凭的资质。相关报告显示:至2017年底,中国共有超过10万家K-12课外辅导服务商,中国城市学生每周平均花费10.6小时参加课外辅导。

其他组织指除了政府和教育机构,参与大数据公共服务的其他社会群体。其他组织主要负责公共服务的基础建设、技术支持等,在教育数据公共服务建设中扮演重要的角色。如国内三大电信运营商为大数据公共服务提供通讯服务支持、相关厂商为智慧校园建设提供硬件支持和软件服务等。

个人指有教学实践参与的个体,包括学生、教师、家长、教育管理者、教研员和领域专家等。个人是教育大数据公共服务的主要服务对象。不同的个体享受不同的服务,如学生可以获得个性化学习资源推荐、形成性学习评价结果、适配学习风格的学习规划等服务;教师可以获得学生学情分析、学生成绩分析报告、知识点分析等服务;家长可以获得学生进校门时间推送、校园消费数据和消费模式分析、学生成绩分析等服务;教育管理者可以获得学员和教学资料等信息和教育管理软件等服务支持,以便更好地完成教育管理工作;教研员可以获得全校学科知识点掌握情况、阶段性检测数据分析等服务;专家可以获取相应的教育大数据验证提出的理论等。

(二)数据服务类型

数据服务,也称数据即服务(Data as a Service, DaaS),是面向数据的一种服务模式,涵盖数据生命周期的全过程。数据生命周期是特定数据单元从最初生成、采集、最终存档、在其使用寿命结束时删除的一系列阶段,数据生命周期的各个阶段可以衍生出不同的数据服务形式。联合国教科文组织教育信息技术研究所出版的《在线教育平台个人数据安全技术指南》将数据生命周期分为数据收集、数据传输、数据使用、数据存储和数据销毁5个阶段。数据采集是按照一定的数据标准,将所需的数据从数据源收集汇总。数据传输是按照一定规程,将数据从数据源传输到数据终端。数据使用是根据需求,对数据进行清洗、处理等操作,以满足对数据的需要。数据存储是将数据存储在可靠的介质上,防止数据丢失,并提供可靠的访问性能。数据销毁是出于保密的需要或者数据失去价值,对数据进行彻底删除,并無法复原。

根据教育数据的使用情况,可以延伸为数据采集服务、数据交换服务、数据处理服务、数据分析服务、数据存储服务、数据安全服务等数据服务类型。而数据来源分类、数据质量、数据标准等可以延伸为数据来源分类服务、数据质量提升服务、数据标准服务等服务类型。各种数据服务根据服务自身的特点、使用场景、技术、权限等,可以由数据服务提供商或数据服务平台提供。如表1所示。

数据采集服务。数据采集服务是其他数据服务的前提,数据采集是否规范、是否符合既定标准决定了其他数据服务的质量和效率。根据应用场景不同,数据采集的方法、应用的技术、数据格式各有不同。一般来说,数据采集包括人工采集、业务数据采集、消息采集、物联网设备采集、文件采集、日志采集、消息采集等。数据采集服务是建立在数据采集技术之上的一种数据服务形式,数据采集服务提供者应将所涉及的各种技术和硬件进行封装,提供方便好用的服务产品。数据采集服务应该尽可能满足服务对象的采集需求,数据采集的过程尽可能公开透明,数据采集的结果尽可能可视易懂,采集到的数据应具有良好的数据可迁移性,便于数据进一步处理与使用。

数据交换服务。数据交换涉及网络通信芯片、模块、基站、平台、应用层等软件建设和硬件建设,就要在不可信的链路中建立可靠的连接,为用户完整地传输数据。伴随着TB、PB级的数据跨区域传输需求越来越多,用户对链路稳定性和数据可靠性的要求也越来越高。截止到2020年6月,我国建成5G基站超过25万个,可见的未来数据规模将越来越大。为更大规模的数据提供高质量数据交换服务,异构数据源之间如何交换、链路中断如何快速恢复、数据迁移与数据同步等都是数据交换服务需要解决的问题。

数据处理服务。数据处理服务是影响数据质量的重要因素,好的数据处理方式可以提供更高质量的数据,减少无效数据的比例,提高数据利用率和效能。由于数据的来源、采集技术、数据采集标准等各有不同,数据处理是数据使用的必要环节。数据处理包括数据清洗、数据转换等。数据清洗是将不符合数据标准的缺失数据、错误数据、重复数据等无效数据进行处理,以满足数据要求。这一过程既可以在数据采集过程中进行,也可以在数据采集后进行,处理工具既可以集成在数据采集工具中,也可以是单独的脚本程序。数据转换是将不同格式的数据按照一定规则进行规整,以便数据的再使用。数据转换包含统一不同平台编码的数据编码转换、统一不同平台粒度的数据粒度转换与统一不同平台规则的数据规则转换。数据转换常见于不同数据库数据合并等场景,是打破“数据孤岛”的重要方法之一。

数据分析服务。数据分析服务包括大数据分析、数据挖掘和可视化等,是体现数据价值的关键, 涉及统计分析、算法、程序编写等。大数据分析和数据挖掘都是通过适当的算法提取数据中的有用信息并形成结论的过程,可视化是将结果以更加直观的形式展示的过程,可视化也是数据分析和展现数据分析结果的关键技术。常见的数据分析方法和数据挖掘方法有趋势分析、对比分析、分组分析、漏斗分析、留存分析、分类分析、聚类分析、预测分析、关联分析、决策树等。常见的数据的可视化展示图包括折线图、饼图、柱形图、散点图、雷达图、热力图、仪表盘、画像、知识地图等。提供数据分析服务的主体就要灵活运用各种数据分析方法,使用恰当的数据可视化技术,清晰明了地展示数据结果,以便服务对象获取服务信息。

数据存储服务。数据存储服务,也称存储即服务(Storage as a Service, SaaS),是一种专门提供数据存储技术专业知识和存储空间的数据服务模式。与传统数据部署与交付方式不同,数据存储服务将业务应用与存储架构组件分离,容量、性能、数据容错级别等都是服务级别的考量指标。使用数据存储服务,可以降低数据存储的经济成本和人力成本,简化存储环境,减少各种数据受损的风险,提高数据的使用效率。提供数据存储服务的主体,要对存储数据进行设计,保证在整个数据生命周期内数据的可用性,保证数据资产的完整性以及保证数据存取过程的性能,提升用户体验。此外,还需要考虑服务成本,选择设计合适的数据存储环境,降低数据受损风险,建立经济高效的数据保护和维护机制。

数据安全服务。数据规模的激增也放大了数据安全和隐私等问题,数据安全服务是一种解决数据安全问题的服务,包括平台运行安全、数据安全和隐私安全。[16]大数据平台安全是指对大数据平台数据传输、存储、运算等资源和功能提供安全保障;数据安全是指在平台上对支撑数据流动安全所提供的安全功能;隐私保护是指利用去标识符、匿名化等加密技术将个人数据进行处理,防止数据流转过程中泄露个人隐私信息。数据安全服务对大数据的良好发展具有重要意义。目前的数据安全问题涉及大数据产业的各个环节,有平台内部的风险,也有平台外部的风险,有技术导致的风险,也有管理导致的风险。因此提供数据安全服务主体要提升大数据平台安全保护,确保数据从采集到销毁各个环节的安全性,保障平台安全、数据安全,防止隐私外泄。

数据来源分类服务。数据来源分类影响数据采集、数据存储等多个过程,数据来源分类是否合理、分类边界是否明晰、分类标准是否完善都决定了最终数据服务的质量。现有的数据分类方式还尚未统一,从数据结构化程度来划分,可以分为结构化数据、半结构化数据和非结构化数据;就数据产生的环节而言,可以分为过程性数据和结果性数据;从主体划分,可以分为个体数据、学校数据、区域数据等;而杨现民将教育大数据分为基础层、状态层、资源层和行为层。数据来源分类服务将为服务对象提供统一的数据分类标准,为其他数据服务提供支持。

数据质量提升服务。数据质量提升服务是在数据采集、数据处理等阶段对数据进行预处理,根据数据质量的各项指标对数据进行规范的过程。数据质量包括数据的规范性、时效性、可访问性、一致性、完整性和准确性。数据质量的高低影响数据处理的效率和效果。数据质量提升服务将对数据进行判断、打分,根据数据质量指标评判标准给出对应的分数。其他数据使用者可以根据评分快速筛选出高质量的数据。数据质量提升服务能够激励用户采集高质量数据,对教育大数据的质量提升具有重要作用。

数据标准服务。数据标准是大数据驱动教育信息化建设和发展的参考依据和實施准则,是促进数据互联互通的有力保障,对教育数据平台具有重要的作用。数据标准服务为服务对象提供统一的教育大数据标准,该规范对接国际上的ISO、IEC、JTCI、IEEE,我国的CELTSC等组织的大数据相关标准和规范,对提升数据服务质量具有积极的作用。

(三)国家数据服务平台

国家数据服务平台是教育大数据和教育支持服务的主要载体。作为各个服务对象公开获取教育相关服务的门户,国家数据服务平台的构建将影响教育管理、教师教学、学生学习的诸多方面,也是教育大数据在智慧校园领域的重要应用之一。作为教育公共服务的主要载体,政府在国家数据服务平台建设方面发挥引领作用,其他社会组织提供技术支持和承担开发工作,形成政府提供、社会各部门参与生产的教育公共服务模式。国家数据服务平台的主要功能是为各个主体提供教育数据服务。如对接已有的各类教育平台、提供其需要的数据资源与数据服务。国家数据服务平台包括功能集成化的中心、数据治理架构和平台基本架构。

中心包括数据汇集中心、数据存储中心、数据交换中心、数据处理中心和平台服务中心。数据汇集中心是平台数据汇集的统一入口,负责从不同数据源获取数据。数据采集方式包括主动从网络中爬取数据、从信息化平台主动获取数据、采集其他平台提交的数据等,实现平台间的数据互联互通,保证数据的规范性。数据存储中心是数据存储服务的交易场所,通过统一的数据仓库建设标准和数据规范,为各个主体提供统一完善的数据存储服务,用户可以根据需求自由选择合适的数据存储方案。数据交换中心是主体间数据交换的服务场所,主要为海量数据的远距离传输提供服务支持和安全保障,确保数据的完整性与安全性。数据处理中心是数据处理方案的交易场所,使用者可以在中心选择已有的数据处理方案来处理教育数据,也可以根据自身需求,发布个性化的数据处理订单,寻求个性化的数据处理方案。平台服务中心是平台为各个主体提供的数据相关服务的场所,提供数据标准服务、数据分类服务、数据安全服务等,保证其他服务的正常进行。

数据治理架构包括:①标准,包括涉及数据的各类标准与管理规范,如数据分类标准、主数据、数据模型、技术工具标准等。②安全与提升,包括数据安全的规范、数据质量管理与提升的各类规范,数据安全规范、数据质量指标,数据质量改进等。③组织,包括数据治理的组织管理等相关细则,涉及规划与责任、培训与教育、规划与优先级、组织变革管理等。

平台基本架构包括存储层、开发层、服务层、网络层、用户层和业务层。存储层负责平台数据的存储,包括SQL数据库和NoSQL(not only SQL)数据库。开发层包括平台开发框架、服务器配置等,负责平台功能的开发与拓展。服务层负责支撑平台的各项功能,包括消息队列、服务中心、配置中心等。网络层负责平台网络的负载均衡和内容分发网络等,保证网络性能与可用性。用户层主要负责用户管理与权限设置等。

四、数据服务的供给关系和平台数据服务

面向数据的公共服务需要依据数据服务的具体内容、服务性质,明确数据服务边界,确立服务内容框架,既便于服务提供者发挥自身优势、深入垂直领域、提升服务质量,又便于服务对象从容选择合适的数据服务、优化自身平台、降低成本等。本研究将数据服务提供者分为两类:服务主体参与的数据服务和平台提供的数据服务。

(一)服务主体与数据服务的供给关系

服务主体与六类数据服务的供给关系如图2、表2所示。

服务主体包含政府部门、教育机构、其他组织和个人四类,提供服务的主体称为服务提供者,使用服务的主体称为服务使用者。每一个服务主体都将至少扮演服务提供者和服务使用者中的一个角色,部分服务主体将扮演双重角色,既提供服务,也会使用来自其他主体的服务。多主体协同提供教育公共服务。政府作为教育公共服务的提供者,其他组织负责生产公共服务,教育机构和个人使用公共服务。

根据现实教育数据的采集、使用情况,本研究描述一个数据服务的一般场景。

在数据采集阶段,政府部门、教育机构、专家等共同拟定数据采集技术标准和规范,为数据采集服务提供理论框架。根据标准和规范,相关组织研发生产数据采集设备,开发数据采集平台,数据接口与数据服务平台对接,保证数据的规范性和一致性。教育机构和个人使用数据采集软件和硬件进行数据采集,如新冠肺炎疫情期间,学校使用传感器采集学生体温数据;教师使用在线问卷采集学生问卷数据等;学生使用拍照软件采集学生作业数据。

在数据传输阶段,政府负责监管工作,可靠的数据交换服务由专门的数据交换服务提供者提供。不同主体对数据交换有不同需求。如:学校内教师为了学习优秀班级的管理策略,访问其他班级的班级管理数据,这样的数据交换借助教育管理软件就可以完成,小规模数据的短距离传输不需要使用数据交换服务。如果省、市一级的教育局要访问学校一年内的学生学习数据,用于学校教学评估等,这样大量的数据的远距离传输就需要使用数据交换服务。

在数据使用阶段,政府、教育机构需要对数据进行数据处理与分析,数据处理与分析所涉及的技术、算法、程序编写可以由政府与教育机构独立完成,也可以根据分析难度和数据的不同,购买其他组织的数据处理和数据分析服务。如某学校要对全校学生的学习行为进行分析,寻找有助于成绩提高且与学生学习风格相匹配的学习习惯。这样的数据分析任务特点是数据量大,涉及数据类型多,分析耗时较长,分析的模型需要定制设计,一般的学校很难完成这样的分析任务。此时就可以选择购买其他组织的数据处理服务和数据分析服务,能省时省力地得到想要的分析结果。

在数据存储阶段,教育机构的教育数据在本地和云端混合存储。经常调用的数据和重要的学校数据保存在本地,占用更多存储资源的教学资源数据、学生行为数据、监控数据等保存在云端。云服务由其他组织提供、政府监管、社会监督。如:一名新生入学,入学时采集的学籍信息、身份信息、健康数据等保存在本地数据库,并在云端备份。学生自主学习时,视频、VR教材等学习资源从云端数据库获取,还可以访问专属的校本课程资源库,学生学习过程中的行为数据、过程性评价数据在云端保存,教师、学生、家长可以随时访问。

个人一般不扮演服务提供者的角色,即个人只使用教育公共服务,不提供教育公共服务。主要有以下原因:①价值角度。个人会采集自身或者小规模的数据,数据量较小,对于更高层次的教育服务而言价值较低。②技术角度。个人提供的教育服务竞争力不强。个人包含的学生、教师、家长、教研员等缺乏处理大数据的技术、能力,难以提供高质量的教育服务。③需求角度。相比政府、机构与组织,个人没有提供教育公共服务的现实需求。

(二)教育大数据来源分类服务

教育大数据来源分类服务是国家数据服务平台提供的数据服务之一,该服务将支撑其他数据服务。本研究在其他教育大数据分类研究基础上,结合教育数据采集、使用等现实需求,提出一个教育大数据分类方案,为教育大数据来源分类服务提供支持。如图3、表3所示。

人与技术共同参与的教育实践活动是教育大数据的主要数据来源,根据教育活动的性质和类型,可以分为教学活动、评价活动与管理活动。教学活动包括师生面对面的课堂教学活动、线上教学活动和自主学习活动等,教学活动产生的數据包括课堂学习行为数据、在线学习行为数据、教学行为数据、学生和教师互动数据等。评价活动包括学生学习过程中的形成性评价、总结性评价,对教师的教学评估、对学校的评估活动等。教学评估数据包括学生期末成绩数据、教师职业测评数据、学校教育质量评估数据等。管理活动包括学校管理和教育行政管理等。学校管理数据包括招生数据、科研成果数据、经费情况数据等,教育行政管理数据包括教育政策数据、人事调动数据、教育规划数据等。

基本信息能够表明数据产生的主体等信息,明确数据所属与所在环境,目前的基本信息研究也会以画像的形式呈现。基本信息包括学生基本信息、教师基本信息、班级基本信息、学校基本信息等。学生个人信息包括个人信息数据、学籍数据、课程数据、学习行为数据、网络社交数据、校园生活数据等。教师基本信息包括个人信息数据、职称信息数据、授课课程数据、科研数据、校园生活数据等。班级基本信息包括班级内设备信息、人数、当前课程名等。学校基本信息包括教师数量、学生数量、智慧教室数量、资产信息、地理位置等。

教学资源,主要包括教学材料、教学环境及教学支持系统。教学材料包括各种数字化的素材、教学软件、补充材料等,教学环境是学习者运用资源开展学习的具体情境,教学支持系统是支持学习者有效学习的内外部条件。教学材料所涉及的数据包括用于教学的演示文本、视频、音频、VR/AR资源等各类多媒体资源数据。教学环境所涉及的数据是指教学环境产生的与教学相关的数据,如光照强度、空气质量等。教学支持系统产生的数据包括操作日志等数据。

(三)教育大数据标准服务

教育大数据标准服务是国家数据服务平台提供的数据服务之一,教育大数据标准服务的质量取决于标准体系是否完善、所提供的标准是否与使用场景契合等。标准体系是一定范围内的标准按其内在联系形成的科学有机整体。目前教育大数据的标准体系主要参考国内外大数据的各项标准,结合教育行业自身的需求与环境的变化不断发展和更新。大数据标准体系框架包含基础标准、数据标准、技术标准、平台/工具标准、管理标准、安全和隐私标准、大数据治理标准和行业应用标准等。[17]对于一般性的数据标准,在教育领域的应用需要结合教育数据的使用现状和数据特征,对这类标准的对接工作是教育大数据标准服务的内容之一。对于针对教育数据的相关标准,标准的归纳、更新等工作也是教育大数据标准服务的范畴。

本研究以教育大数据质量评价指标为例,将《GB/T 36344-2018 信息技术 数据质量评价指标》这一国家标准在教育大数据上的应用加以解释,以描述教育大数据标准服务的一般应用。

《GB/T 36344-2018 信息技术 数据质量评价指标》于2019年正式实施,该标准将数据质量评价指标分为六个维度,分别是规范性、完整性、准确性、一致性、时效性和可访问性。

规范性:指的是数据符合数据标准、数据模型、业务规则、元数据或权威参考数据的程度。针对教育数据,可以举例:《GB/T 33782-2017 信息技术 学习、教育和培训 教育管理基础代码》中定义10表示升学、11表示本科、12表示高职(专科)。

完整性:指的是按照数据规则要求,数据元素被赋予数值的程度。针对教育数据,可以举例:《GB/T 36345-2018 信息技术 通用数据导入接口》规范要求,进行登录操作和文件传输操作时,用户名、密码、目标地址、端口、返回结果是必选项。

准确性:指的是数据准确表示其所描述的真实实体(实际对象)真实值的程度。针对教育数据,可以举例:电子课本元数据用于描述电子课本整体时,标识符是电子课本的唯一标号,只能填写正确的标识符。

一致性:指的是数据与其它特定上下文中使用的数据无矛盾的程度。针对教育数据,可以举例:学生的身份信息与学籍信息是否一致,身份证号码与学籍记录是否匹配。

时效性:指的是数据在时间变化中的正确程度。针对教育数据,可以举例:电子课本进行了内容更新,关联的相关资源也相应进行了更新,这类资源是否可以及时得到更新。

可访问性:指的是数据能被访问的程度。针对教育数据,可以举例:教学资源数据在需要时的可获取性以及在设定有效生存周期内的可使用性。

(四)教育数据质量提升服务

高质量的教育数据影响后期数据处理、数据分析等操作的效率,教育数据质量也将决定其他数据服务的质量,提供高效便捷的教育数据质量服务也将大大增加数据平台的吸引力,目前数量巨大、标准不一的教育数据导致数据分析结果,难以支持教学活动、给教育决策提供有效参考已经能说明这个问题。低质量的教育数据会增加数据分析成本、降低分析效率,从而阻碍教育数据的应用和发展。因此,教育数据质量提升服务对数据平台的服务对象具有重要的意义。

教育数据质量提升服务包括数据质量评估框架与数据质量改进流程两部分内容。本研究参考IMF的数据质量评估框架,结合教育大数据的数据质量评价指标和数据特征,形成教育数据质量评估框架(Education Data Quality Assessment Framework,EDQAF)。教育数据质量评估框架包括测量维度、测量类型和特定的数据三个主要内容,评估方法是通过测量类型对数据质量的六个维度进行量化,评价特定数据的质量。维度、测量类型和特定的数据这三个层次,从上到下来看是抽象逐渐过渡到具体的过程, 降低了数据质量维度的抽象程度,更接近数据,从而评估具体数据的质量。从下往上看,提高理解和解释测量结果的能力,使教育数据质量评价能够尽可能覆盖大多数的教育数据。如图4所示。

数据质量评估框架是一个具有高度可操作性的质量评估框架,可操作性源于其中的测量方法,即测量类型。测量类型通过计算百分比的方式可以得出要测量数据的质量结果,每个值集的有效范围存储在另一个标准表上,通过比较数据质量结果与标准表上值集的有效范围即可确定数据的有效性。

教育数据质量提升服务是按照一定的流程,通过教育数据质量评估框架EDQAF对教育数据的规范性、时效性等质量指标进行评价并提升的一种数据服务。该服务有准备、数据质量提升和数据交付使用三个阶段。如图5所示。

在准备阶段,数据质量管理組织的构建、数据规范的完善和评价指标的确定是提升数据质量的前提。数据质量管理组织主要负责人事的管理,保证数据质量提升服务的有效进行。数据规范包含相关数据标准,是数据质量的参考性文件。评价指标包含教育数据质量的维度等,如规范性、时效性、可访问性、一致性、完整性、准确性等。

在数据质量提升阶段,数据质量提升包含四个阶段。在Plan(计划)阶段,根据数据的类型和用户对数据的需求等,制定数据提升的目标,用户需求可以采用问卷等方式进行调查。在Do(实施)阶段,根据目标和需求,按照一定的方法、步骤,设计具体的方案和计划,并对方案和计划进行实施。在Check(检查)阶段,总结计划实施的结果,看是否得到期望的数据并满足用户的需求。在Act(行动)阶段,对检查的结果进行处理,如果数据满足用户需求,则将数据交付使用,如果不满足,则进行下一轮的数据质量提升。

在数据交付使用阶段,将处理后的数据提交给用户,如果数据交付后不满足用户需求,数据将再次进行质量提升,直到满足需求或者更换其他数据为止。

五、支撑多领域教育服务平台的数据服务

随着教育信息化的不断推进,面向各种教育场景的服务平台越来越多,在国家层面,有中国大学MOOC、国家开放大学学分银行等公共平台;在区域层面,各级教育部门建设了各类教育平台,如北京市中小学学籍管理云平台、上海教育资源库、广东省的粤教云、天津市和平区教育云数据中心等;在学校层面,许多学校根据自身的需求,建设了为校园内师生服务的服务平台,如北师大实验中学的精细化管理与大数据服务平台等。本研究以国家开放大学学分银行、天津和平区教育系统平台和北师大实验学校大数据平台为例,从国家层面、区域层面和学校层面三个角度出发,结合案例的平台特点,提出的教育大数据公共服务模型为案例提供数据服务支持。

(一)国家层面:国家开放大学学分银行

“学分银行”就是在终身学习理念的推动下,在不同类型教育间(包括不同形式学历教育、非学历教育的不同课程) 以学分认定、累积和转换为主要内容的一种新型的学习制度和教育管理制度。[18]从服务主体来看,国家开放大学学分银行涉及平台、教育机构和学习者三类主体。从服务类型来看,国家开放大学学分银行提供学分认定、学分累积、学分折算和学分兑换等服务。

当前学分银行的平台提供的服务可以分为四类,其中数据服务DaaS包括数据组织、数据交换共享平台、数据存储、数据源、数据管理等内容。如图6所示。

作为面向全国的公共服务平台,国家开放大学学分银行根据职能定位的不同可以分为多个层级,分别是国家学分银行、学分银行省级中心、学分银行分中心和学分银行认证受理点。目前相关的数据服务由学分银行平台提供,随着终身学习理念的不断深入,社会对学分认证的需求也将大大增加,经过认证的学分也将在更多教育平台呈现。伴随学分银行的普及,用户数据、学分数据等数据数量会大大增加,访问频率和频次也会激增,平台的数据处理、数据交换等能力将面临挑战,根据需求提供数据服务将成为必要环节。面对不断增加的数据服务需求,数据服务平台可以对接学分银行的数据服务DaaS,为学分银行提供定制的数据服务,以满足学分银行业务增长的数据服务需求。

(二)区域层面:和平区教育云数据中心

和平区是天津市中心城区核心区,和平区教育云数据中心为区内28所中小学、20所幼儿园提供教育服务。在和平区教育局的推动下,和平区通过“开放平台+多种教育服务”构成的应用生态圈的模式,构建教育信息化生态系统,该区的智慧教育应用还两次被评为教育部基础教育信息化应用典型案例。

和平区教育云数据中心的数据服务包含数据收集模块、数据处理模块、数据展示模块和数据资源中心等。如图7所示。目前的和平区教育云数据中心的数据服务涉及数据采集、数据处理、数据分析、数据交换、数据安全等多種数据服务类型,未来教育云数据中心的架构也有利于根据需求兼容其他数据服务,形成优化已有数据服务、增加数据服务类型、扩展数据服务范围的数据服务生态环境,为深挖教育数据价值、更好服务于整个区域的学校师生和教育管理者提供数据支撑。

和平区现有的教育数据来源于多种场景,能够产生丰富的过程化数据,多维度的教育数据的数据分析、数据处理过程更为复杂,分析结果也能够为各个教育场景提供更好的支持。作为教育部基础教育信息化应用典型案例,和平区涉及教学、科研、管理数据等数据的采集、分析和处理服务,可以共享到教育数据服务平台,为其他区县级教育数据平台建设提供数据服务支持。也可以根据数据类型扩充等现实需求,从教育数据服务平台获取其他数据服务。

(三)学校层面:北师大实验学校精细化管理与大数据服务平台

北师大实验学校大数据服务平台是为北师大实验中学数字校园云平台提供数据管理和数据服务的大数据服务平台,涉及学校管理、教学、学习、师生等多领域数据,大数据服务平台对提升学校治理水平、促进协同办公、实现科学决策和精准服务具有重要作用。

北师大实验学校大数据服务平台以数据中台和业务中台为框架,利用数据中台技术对学校核心业务的流程和逻辑进行梳理,在对核心业务数据聚合、挖掘、分析的基础上,形成可靠的数据服务,为学校各个业务和应用场景服务,形成以用户需求为驱动力的数据服务模式。在管理业务方面,该平台根据学校岗位的职责划分,提供精准的数据服务,推动各项管理标准化、工作规范化、业务协同化。在教学方面,该平台为每一位教职工提供业务主题数据服务,教职工可以查看学生基础数据大屏、对权限内各项数据进行管理、访问学生画像等。在学习方面,该平台能为每一位学生和家长提供学习相关数据,如考试后为学生推送个人考试成绩和成绩分析结果,让学生和家长准确掌握学情。

北师大实验学校大数据服务平台是一个典型的学校层面的教育数据服务平台,该平台为学校的开放式数字校园云平台提供数据服务。教育数据服务平台建设的目标是促进从数字化校园向智慧校园的转变。学校的数据服务要伴随智慧校园的建设不断提高服务质量,通过对接国家数据服务平台,可以降低数据服务的研发成本,缩短研发周期,减少学校运营成本,及时让最新的数据服务直通到学校,服务到个人。

本研究选取了三个平台案例,涵盖国家层面、区域层面和学校层面,对每一个案例的服务架构进行解析。研究发现:数据服务作为平台中不可或缺的组成部分,平台的数据服务与国家数据服务平台的对接,可以有效减少重复开发、充分利用资源、缩短其他平台的数据服务建设成本和运营成本,实现多平台数据互联互通、数据服务的资源共享。

六、优化教育大数据数据服务的建议

鉴于数据在教育领域发挥着越来越重要的作用,数据将是未来学校最重要的资产,如何充分利用教育大数据、兼顾发挥数据价值与保护数据权益是一个重要的举措。本研究提出的大数据公共服务模型,是一个维护各方数据权益,以数据服务的互通共享为出发点,为各方平台提供高效好用的数据服务的公共服务模型。关于该模型的未来发展有如下展望。

(一)加快推进国家数据服务平台建设

大数据公共服务模型的提出梳理了服务主体与数据服务间的关系,各教育服务平台的对接需要国家数据服务平台实体的支撑,教育大数据来源分类服务、教育大数据标准服务和教育数据质量提升服务需要平台支持来实现。由政府主导、学校支持、社会组织参与的国家数据服务平台将会给多领域的平台提供数据服务,形成多方参与、共同建设、成果共享的数据服务协同共同体,最终实现不同平台间的数据互联互通和数据服务流通,提高数据的使用效率和效果,降低学校、教育部门等机构的数据服务建设成本。

(二)提高数据服务在教育资源服务中的地位

随着信息化的不断深入,需要更多的数据分析方法和分析角度处理与日俱增的教育大数据,得到想要的分析结果来服务教育中的各个主体。作为一种特殊的教育资源服务,数据服务是诸多教育信息服务的前提,数据服务的质量也将影响最终教育服务的效果。推动数据服务建设科学化、规范化,发挥教育大数据在教育教学、管理等领域的支撑引领作用,利用优质数据服务提高学校管理水平、教学水平,形成以数据服务促学校发展、教师提高、学生进步的良好局面。

(三)优化教育领域数据服务的供给机制

高效可用的数据服务源于数据提供主体,合理的数据服务供给机制促进数据服务流转、建立连接各个主体的交流通道,可以有效促进数据服务质量的提升,因此优化教育领域数据服务的供给机制至关重要。基于各个主体的数据服务需求,建立数据服务需求清单,提供数据服务的组织机构,根据清单内容,按照平台的数据标准和开发需求提供合适的数据服务。还需确立数据服务的服务界限,明确数据服务的主体责任,增加数据服务的供给透明度。

参考文献:

[1]祝智庭.互联网诞生50周年纪念专题:“互联网+教育”[J].浙江师范大学学报(社会科学版),2019(4):1.

[2]任友群.走进新时代的中国教育信息化——《教育信息化2.0行动计划》解读之一[J].电化教育研究,2018(6):27-28,60.

[3]祝智庭,郭绍青,吴砥,等.“停课不停学”政策解读、关键问题与应对举措[J].中国电化教育,2020(4):1-7.

[4]张序.促进大数据应用于公共服务[N].中国社会科学报,2020-04-21(007).

[5]林毅君,杨非,张纲,等.国家数字教育资源公共服务体系建设研究和实践[J].中小学电教(综合),2020(4):15-18.

[6]袁松鹤,刘选.中国大学MOOC实践现状及共有问题——来自中国大学MOOC实践报告[J].现代远程教育研究,2014(4):3-12,22.

[7]方海光,王红云,黄荣怀.移动学习的系统环境路线图——国内外移动学习研究与应用案例研究专栏综述篇[J].现代教育技术,2011(1):14-20.

[8]方海光,羅金萍,陈俊达,等.基于教育大数据的量化自我MOOC自适应学习系统研究[J].电化教育研究,2016(11):38-42,92.

[9]刘邦奇,张振超,王亚飞.区域教育大数据发展参考框架[J].现代教育技术,2018(4):5-12.

[10]余胜泉,李晓庆.区域性教育大数据总体架构与应用模型[J].中国电化教育,2019(1):18-27.

[11]王珊,萨师煊.数据库系统概率(第5版)[M].北京:高等教育出版社,2014.

[12]DAMA国际.DAMA数据管理知识体系指南(原书第2版)[M].北京:机械工业出版社,2020.

[13]李伟民.金融大辞典[M].哈尔滨:黑龙江人民出版社,2002.

[14]何鹏程,宋懿琛.教育公共服务的理论探讨[J].教育发展研究,2008(9):39-43,48.

[15]顾明远.教育大辞典[M].上海:上海教育出版社,1998.

[16]中国信息通信研究院.大数据安全白皮书2018[R].北京:中国信息通信研究院,2018.

[17]中国电子技术标准化研究院.大数据标准化白皮书(2018 版)[R].北京:中国电子技术标准化研究院,2018.

[18]郝克明.终身学习与“学分银行”的教育管理模式[J].开放教育研究,2012(1):12-15.

作者简介:

郑志宏、孔新梅、洪心,首都师范大学教育学院硕士研究生;

方海光,首都师范大学教育学院教授、通讯作者,邮箱: fanghg2013@163.com。

Inquirying on Big Data Public Service Model for Regional Education

Zhihong ZHENG, Haiguang FANG*, Xinmei KONG, Xin HONG

(College of Education, Capital Normal University, Beijing 100048)

Abstract: As China enters the education informatization 2.0 era, the construction on various educational public service platforms is gradually improved that the data service becomes indispensable in constructing and maintaining the platform. In order to promote the inter-connection of big data in educational region and to improve the quality of educational data service, this research proposes a public service model of education big data. This model clarifies the types in educational big data service subject and data service, while it sorts out the supply relationship between the service subject and the data service type, and the data service that the three-data service platform should provide. In addition, it analyzes the cases in platform application at national, regional,and school levels, showing that the big data public service model can connect to other education service platforms through data services and can form a more integrated data interconnection community.

Keywords: Big data in education; Education public service; Data services; DaaS

编辑:王天鹏   校对:王晓明

猜你喜欢
教育大数据数据服务
地理空间大数据服务自然资源调查监测的方向分析
基于数据中台的数据服务建设规范研究
数据服务依赖图模型及自动组合方法研究
基于云计算的高校大学生信息平台的研究
狭义教育大数据在英语教学中的应用模式
教育大数据在教育管理中的运用分析
如何运用税收大数据服务供给侧结构性改革
基于频繁子图挖掘的数据服务Mashup推荐
一种基于数据服务超链进行情景数据集成的方法*