张 聪
摘 要:数据标准是保障数据使用和交换一致性、准确性的规范性约束,对提升数据质量、促进数据互联互通、释放数据价值等起到至关重要的作用。然而,不少高校在教育信息化初期缺乏统筹规划,对数据标准的制定和落地造成严重障碍。文章依据国内外数据标准执行经验和笔者实际工作经验,探索符合高校实际的数据标准制定和落地方案。
关键词:数据治理;数据标准;编码规则;数据标准落地
中图分类号:G647;TP393 文献标志码:A 文章编号:1673-8454(2021)15-0048-04
一、引言
高校信息化是教育信息化的先锋队,对教育信息化起到引领和示范作用[1]。教育部2018年颁发的《教育信息化2.0行动计划》中指出,应继续深入推进实现“三通两平台”,促进教育资源和信息的交流与共享,达到提速增智、提质增效,促进教育资源公共服务平台和教育管理公共服务平台的融合发展[2]。
当前,借助信息化力量减少信息重复填报,便利师生校内的教学和生活,促进高校教学和行政改革,指导学校发展决策成为越来越多高校的共同需求,这对系统间的数据流转提出了高要求。然而,在信息化发展初期,许多高校开发信息系统由业务部门各自为战,缺乏统筹规划,造成一个个“信息孤岛”和“应用孤岛”,各信息系统中的数据定义、格式、规则等大相径庭,为数据的交换共享带来极大阻碍[3]。因此,探索一套符合高校实际的数据标准制定、落地方案,是一项紧迫而重要的任务。
二、高校数据标准发展现状
我国的教育信息标准化工作已进行多年。2002年,教育部成立“教育信息化标准委员会”,同年更名为“全国信息技术标准化技术委员会教育技术分技术委员会”,负责组织全国教育信息化的标准编制工作,并于8月6日发布《教育管理信息化标准》(教发[2002]27号)。2012年,教育部在此基础上,对各编码集进行了增加、修改、删除、归并等操作,发布了《教育管理信息 教育管理基础代码》,成为各高校信息系统信息代码依据的行业标准[4]。
2019年,中国信通院(CAICT)和大数据技术标准推进委员会联合发布《数据标准管理实践白皮书》(以下简称《白皮书》),结合国内外数据标准管理理论和实践的成功经验,对数据标准的制定、管理提出了实践建议,对相关行业的数据管理者具有一定的借鉴意义[5]。
随着高校数据深度融合的推进,许多高校都开始先后制定本校的数据标准[1][3]。但是部分高校的数据标准代码在制定时脱离实际情况,难以落地使用,成为空中楼阁。本文参考《白皮书》的理论和操作建议,提出一种符合高校实际的数据标准制定和落地的方法。
三、数据标准落地方案
1.数据标准管理组织架构
《白皮书》中指出,数据标准管理的组织架构是以推动数据标准化工作为目标,负责落实和监督数据标准化工作的组织体系[5]。高校应由校级层面成立统筹数据标准工作的数据标准制定执行委员会,负责统筹数据标准的调研、制定、执行和监督等各项事宜。其成员包括负责高校信息化的校领导,负责数据标准管理的组织和协调部门,数据提供和使用的业务部门,以及相关领域的专家等。数据管理组织依据工作职责划分为决策层、管理层和执行层。
(1)决策层
决策层是全局把握的决策组织,负责解决数据标准的政策制定、规章制度、执行监督等方面全局性、方向性问题,由校级领导及数据领域的专家构成。
(2)管理层
管理层是数据标准管理的组织协调部门,负责依据相关管理制度和操作规定,推进和监督数据标准的落地工作,定期向决策层汇报数据标准的落实情况、出现的具体问题,由数据标准管理部门(如负责信息化建设和管理的部门)的主要成员构成。
(3)执行层
执行层是负责数据标准落地工作的各数据源头部门,需依据制定好的数据标准政策和管理文件,全力配合管理层落实数据标准规范,由各数据源头部门和数据使用部门的负责成员构成。组织架构分层如表1所示。
2.数据标准制定原则
数据标准是统一数据平台(数据中台)进行数据交换的规范,应当由管理层负责数据管理的信息化部门进行制定,交由决策层修改、审核后通过。如前所述,在信息化建设前期,高校已建立许多信息系统,这些系统或是仍在使用,呈现一个个信息孤島的状态,或是虽然废弃,但产生了许多遵循一定代码标准的历史数据,且这些历史数据仍存在一定的使用价值,替代系统需要沿袭原系统的代码标准。在制定标准时必须考虑到高校使用数据的现状,尽量弥合不同系统中现存数据的标准差异。
在这样的情况下,在数据标准的制定过程中应坚持几个原则:
(1)对单源头的数据字段,应尽量采用数据源头部门的代码标准。数据源头部门的代码标准是数据源头部门正在使用的,随着数据进入数据共享交换领域,可最大程度减少数据改造可能带来的问题。
(2)对多个源头都在使用的数据字段,如存在标准不一致的情况,应以数据交换使用频率较高的数据源头标准为基础进行改造。对于一些常用个人信息字段(如性别、政治面貌、籍贯、国籍、学生类别等)信息,应尽量向国标、行标靠拢,以方便对接未来更多系统。
(3)如果某些数据需要自行建立代码标准,应首先研究是否可采用相应的国标、行标,如与本校情况差异较大需自行建立标准的,建立标准时应遵循一定的代码规范,尽量满足共享性、唯一性、稳定性、可拓展性、前瞻性和可行性等代码标准规范要求。如果数据存在层级结构,应当体现在代码上。
(4)指标类数据标准应当在基础类数据标准的基础上建立。基础类数据是指业务流程中直接产生的、未经过加工和处理的基础业务信息,指标类数据是指具备统计意义的基础类数据,通常由一个或以上的基础数据根据一定的统计规则计算得到[5]。对于指标类数据的定义、统计范围、统计方法等,应结合基础类数据的特点制定,以保证统计数据含义和内容的确定性、唯一性。
3.数据标准落地模型
在数据标准管理组织架构确定,人員就绪后,由负责数据管理的信息化部门负责数据标准情况的调研,形成初稿后征求意见,将征求意见稿交由决策机构进行讨论、修改、审核,最终通过并予以发布。流程如图1所示。
标准文件发布后,数据管理部门和各业务部门按照相关规范进行数据采集、生产和清洗等工作。在一定时长的过渡期后,逐步让数据格式、内容等符合数据标准要求。
对于改动较大,无法满足数据标准要求的接入业务系统,需要由业务部门维护代码转换表。如果同时有数据的转入和转出,需要同时维护转入和转出表,如图2所示。
对于未来学校新上线的信息系统,强制要求需要的信息必须通过统一数据平台接入,以确保数据标准的一致性。
4.数据标准输出文档
数据标准相关输出文档包括管理规定、标准规范和操作指南。
(1)管理规定
规定高校数据标准制定、落地的工作办法,以及开展数据标准管理的组织架构、职责分工、审核汇报机制等。
(2)标准规范
规定各个业务域的数据字段标准,包括基础类和指标类数据标准。标准规范的格式和内容可参考国家标准《标准化工作导则 第1部分:标准化文件的结构和起草规则》进行拟定。
(3)操作指南
规定业务部门根据管理规定所制定的在本业务域开展数据标准化工作的具体实施方法。
四、数据标准制定和落地实例
笔者以深圳大学部门数据标准代码为例,阐述数据标准从制定到落地的全过程。
组织架构是高校核心数据之一,具有极高的流通价值,几乎是每个业务必需的字段。但是在人事、教务、研究生、科研、固定资产等业务管理系统中,相应的部门名称、分类等五花八门,对数据的交换流通和统计分析等造成严重障碍,统一标准迫在眉睫。
1.数据使用现状调研
要先就部门使用现状到业务部门调研,包括数据源头部门和数据使用部门。根据对各主要数据相关部门的调研,得到以下结论:
(1)多数业务部门对于业务系统更换部门代码和分类方式持否定态度,因为部门数据是业务系统的基础数据,更改部门代码表将影响业务正常运作和报表统计结果,可能造成不可预测的错误和后果。
(2)部分业务系统现有的部门代码有层次结构,部分没有。学校虽然有实际设立的一级部门和二级部门,但一些业务系统不需要区分,体现的是一种扁平化的组织架构;有一些业务系统进行了层级划分,但名字与层级设立与实际架构有差距。
(3)一些业务系统因为自身业务需要,无法与标准组织架构和部门名称完全匹配。例如因为组织架构的调整,出现一些部门更名、合并或撤销等情况,业务系统不能完全与部门现有标准名称一致,而需要逐步过渡。
2.数据标准基准选定
根据调研反馈结果和数据交换需求判断,最终决定选择以人力资源部的部门代码作为数据标准的基准表,理由如下:
(1)人力资源部掌管教职工数据,教职工数据交换的范围最广,几乎所有业务系统都会用到,标准落地难度最低。
(2)人力资源部对部门变更敏感,在学校部门调整时会迅速进行调整,其部门代码的时效性较高。
(3)人力资源部的部门代码有分层至二级部门,与真实组织架构较为吻合,且其代码较为规范。
3.数据标准的制定与审议通过
调研完成和基准表确定后,经过初稿形成、征求意见、交由数据标准决策机构审议、通过等步骤,最终以红头文件形式公布,成为校级标准,以后定期修订、迭代更新标准。部门代码标准如表2所示(节选)。
组织架构的标准名称由专门部门进行维护。在统一数据平台抽取信息后,参照组织架构的标准结构和名称进行部门数据的清洗,最终形成标准的部门代码和名称后用于数据共享交换。另外根据一些业务系统交换的需求,清洗前的部门数据也需要保留。
4.制定数据标准转换表
数据标准代码表确定后,即可逐步使用图2的数据流转模型进行数据抽取、清洗和交换工作,对于没有自己部门标准的业务系统,可直接将标准的部门代码表传送给业务系统使用;对于有自身部门标准的业务系统,则要制定代码转入和转出表,将标准的部门代码和业务系统自身的部门代码标准连接起来。其中如果业务既需要转入又需要转出数据,那就需要同时制定这两张表,原则上不能合并为一张。以教务部的部门转换表为例,转入和转出表(节选)如表3、4所示。
五、 结语
数据标准是进行数据标准化的主要依据,构建一套完整的数据标准体系是开展数据标准管理工作的良好基础,有利于打通各系统的“信息孤岛”,是促进数据互联互通,促进数据挖掘分析和价值发现的关键一步。本文在管理和技术层面提出了一套数据标准的制定和落地方案,在各自建业务系统存在各自的数据标准,满足各自系统数据完备性的情况下,构建起适合数据交换的全校性数据标准,以达到尽可能减少业务系统改造,让交换数据能平滑过渡到全校性标准的目的。
参考文献:
[1]王高梁.数字化校园统一数据平台关键技术研究[D].武汉:湖北中医药大学,2016.
[2]李华,刘波,龚艺,等.高校教育管理数据标准建设实践[J].安徽电子信息职业技术学院学报,2017(2):97-102.
[3]孙思.高校智慧校园信息标准的规划与设计[D].武汉:武汉轻工大学,2017.
[4]教技[2012]3号.教育部关于发布《教育管理信息 教育管理基础代码》等七个教育信息化行业标准的通知[Z].
[5]中国信息通信院云计算与大数据研究所.数据标准管理实践白皮书[R].北京:中国信通院,2019.
(编辑:王晓明)