基于业务驱动的高校数据治理应用研究

2022-05-05 01:57黄有福黄中伟
中国教育信息化·高教职教 2022年2期
关键词:数据治理数据共享数据服务

黄有福 黄中伟

摘   要:随着高校信息化建设的快速发展,数据治理成为智慧校园建设基础条件,也是智慧校园建设从“面向业务”转向“面向服务”重要保障。文章从师生最迫切的需求和痛点入手,以学校职称评审系统为例,通过制定校级数据标准、配置审计规则、提升数据质量,对现有数据中心的数据进行治理,同时建立相应的主题库和数据统一开放平台,完成数据的汇聚、清洗、转换等过程,并以职称评审业务为驱动,进行全方位的数据集成和高效数据治理,实现数据信息与业务的融合共享,推动高校治理体系和治理能力现代化。

关键词:数据治理;教育信息化;业务驱动;数据共享;数据服务

中图分类号:TP393 文献标志码:A        文章编号:1673-8454(2022)02-0111-06

一、引言

随着教育现代化步伐的加快,信息技术日益成为高校改革发展的新引擎,为高校深化教育教学改革、管理创新和提升人才培养质量提供了强有力的技术支撑。近年来,我国各类高校加大信息化建设力度,开展学校信息化标准体系建设和高效运行机制的探索,搭建学校应用服务系统的公共支撑平台。智慧校园建设由“面向业务”向“面向服务”转变,消除了原有业务系统之间的界限,实现真正意义上的数据共享,并构建了覆盖全局的信息化管理和服务系统,同时大力推动移动校园建设。可以看出,高校正逐步实现智能化、服务型数字化校园的建设目标,信息化建设对高校教育改革发展的推动作用也愈加显著。在高校信息化建设过程中,数据治理具有重要的意义,是智慧校园到智能校园演进过程中的必要條件,也是推动高校治理体系和治理能力现代化的必然要求。本文以广州番禺职业技术学院的数据治理实践为例,以业务驱动为突破口,探索高校数据治理的思路。

二、高校数据治理现状分析

2018年4月,教育部印发的《教育信息化2.0行动计划》指出,教育信息化是教育技术与信息技术的深度融合,信息化手段为教育信息化提供技术支持,为学校人才培养、教学科研、学科建设等核心工作提供更有针对性的支持[1]。但是,从许多高校的智慧校园建设情况来看,信息技术对学校的核心工作支持力度还不够。特别是部分高校已建设良好的基础设置,基本完成三大平台、一站式服务大厅等工作,但由于数据处理存在问题,导致业务系统的数据难以整合和有效共享交换,无法对核心工作进行多维度全方位的分析和研判。现阶段,各高校都在大力建设“数据+决策”的智慧校园,数据是智慧校园的重要资源,也是学校优化管理与提升服务质量的基础[2]。数据质量关系到所有业务与服务的质量。数据治理是以数据生产要素为对象,努力释放数据价值,确保数据安全,推动学校治理体系和治理能力现代化。当前我国高校信息化工作面临各种困难,主要有以下几个方面:

(一)缺少顶层推动和协调

数据治理是“一把手”工程,主管领导要高度重视、积极指导和参与,为信息化部门撑腰,解决遇到的各种难题。各部门按照要求积极配合,主动开展数据治理工作。而实际上,很多学校领导认为数据治理为纯技术性工作,所以关注少、指导少、参与少,导致数据处理缺乏必要的支持,部门间的沟通存在很大阻力,效率低下。

(二)缺乏明晰的管理职责

各业务部门要主动担当,把数据管起来,要完善数据,减少数据的重复采集和填报,建立数据管理长效机制。然而,很多业务部门往往以自身业务为出发点,只考虑部门使用需求,对数据质量不负责。

(三)缺少统一的数据监控管理体系

有些部门把数据当成自有资源,以数据安全、隐私数据等理由,不同意共享;有些部门不相信其他部门产生的数据,进行重复采集和维护。因此需要建立“一数一源”和“源头治理” 制度,规范数据的产生和使用,数据跨部门使用应完全通过公共数据平台进行共享和交换,所有数据纳入监管,实现跨部门共享[3]。

(四)缺乏有效的数据流转约束机制

目前,线下交换数据依然是很多部门或师生的常态方式,很多数据“躺”在管理员的电脑里,问题数据和安全隐患很多,致使数据治理工作不能有效开展。学校需要通过完善的信息化手段进行线上补充采集,使数据使用者、需求者以及建设者都形成数据共享公用的思维习惯。

三、高校数据治理应用与实践

数据治理是一项系统性工作,它包括了一系列互相关联、与数据的整个生命周期相关的流程[4]。下面,笔者以广州番禺职业技术学院数据治理过程为例,对数据治理流程进行阐述。

(一)完善数据制度,规范数据管理

要对所有数据进行摸底排查,明确“一数一源”,消除多头管理。另外,还要明确数据质量责任,谁产生谁负责。每个业务系统数据的来源、推送到的应用等数据流向都要了解,做到“源”可查、“路”明确。同时,在执行的过程中,要明确数据标准,严格按照数据标准管理数据,以防数据监管不足导致数据再次出现问题,同时对数据的管理过程也要做到有据可查。

(二)完善数据标准,构建数据仓库

通过对数据、服务、业务流程的整合,推进数据治理。数据标准的建设与完善是完成数据治理的基础性工作,也是构建数据仓库的前提。通过激活历史数据,对历史数据进行清洗、转换,提升数据质量,完成数据的整合,构建统一的基础数据体系。在基础数据体系的基础上,对学校的业务流程进行统一规划,改进现有的开发模式,建立学校统一的数据开发平台,统一使用权限,对数据进行管理。构建统一的数据管理平台,对现有业务系统的数据进行分析,结合教育部发布的数据标准和教育行业标准,以及学校主要业务系统的数据字典信息,完成校级数据标准的建设。在学校数据标准的基础上,整合人员信息、基础数据,构建数据仓库,为学校各类业务系统及应用提供数据共享与应用的支持。

(三)完成数据清理,构建数据仓库平台

通过建立数据标准和数据管理规范,对所有进入数据仓库的数据进行数据清理。这是数据治理工作的一个重要环节,主要内容为:首先对数据进行标准化处理,包括各字段值、数据类型、字段长度的规范化管理;其次完成数据的完整性检查,重要数据或必填数据需要进行完整性检查,还要对数据的一致性、重复性等进行检查;最后得出数据的检测报告,把数据反馈到业务系统,多轮治理之后,数据源的治理基本完成。通过联机处理、数据挖掘等方法对大量历史数据进行提取、转换和加载,构建数据仓库平台,解决数据的“一数一源”和“数据孤岛”问题,同时为数据分析打下基础,并为数据的全面应用提供决策支持。

(四)共享交换数据,提供数据服务

建立数据仓库的目的是为打通“数据孤岛”,让所有数据汇聚、共享,并对各业务的数据进行有效性标识。通过主题数据库的建设,如创建人事基本信息库、科研主题库、教学主题库等,为特定场景下的数据集市提供服务,也为数据的终端应用提供支持,满足学校各级单位的数据查询、分析等。如果采用面向服务体系架构(SOA),则包括运行环境、编程模型、体系结构风格和实现理论。

(五)建立校级数据中心

为支持业务系统更方便地使用数据,在数据服务集群之上,通过部署数据应用开发引擎、数据集成引擎、数据视觉引擎,构建一个支撑大数据科研、实训和快速应用开发的完整平台。该平台能够支持微服务、一站式服务大厅、双高指标展示、未来数据分析与呈现等。这些数据在使用后再反馈回来,实现数据的闭环管理。数据治理的应用与实践流程如图1所示。

四、高校数据治理案例分析

高校数据治理不是阶段性的工作,其过程贯穿于数据建设的各个階段,需要根据不同阶段的业务和技术特点,选择适合的切入点进行推动[5]。广州番禺职业技术学院在数据治理过程中,选择“职称评审”这个对数据要求高、涉及业务系统数据多的事项作为切入点。以下对学校数据治理工作的具体做法进行阐述。

(一)数据治理的目的

学校从2017年开始进行智慧校园建设,取得了一定成效:基本实现统一身份认证、统一服务门户和一站式办事大厅;已建立共享数据中心,数据中心汇聚包括人事系统、教务管理系统等多个业务系统数据。但也存在很多问题:数据标准不统一、数据不准确、数据缺失、多个系统数据不一致等。这些问题对于单独的业务系统来说,是可以正常使用的,但是联合起来就会出现数据“打架”,不知该以哪些数据为准。学校启用了职称评审系统,而职称评审对数据的要求比较高,数据必须准确、完整,且标准统一。

(二)数据治理的过程

以职称评审数据治理为契机,学校把数据治理工作分为两个阶段:第一阶段对已进入数据中心的数据进行存量数据治理,主要包括前期已对接进入数据中心的人事、教务、科研等数据。然后拟定规章制度、数据标准,设置重要数据字段的审计规则,对已有的数据进行初步清洗、转换、标准化。第二阶段对于新入库的数据进行增量数据治理,依靠学校制定的规章制度和数据标准,对所有进入中心库的数据进行标准检测,通过数据审计确定数据是否放行入库。具体执行策略如下:

第一步,主要以国家标准、教育部发布的教育行业标准为依据,参照业务系统的数据标准,制定学校的校级数据标准。主要流程为:首先是标准的规范定义,最终达成业务对指标认知一致性这一目标;其次通过行业标准来进行规范建模,从技术层面解决模型扩展性差、冗余多等问题并保障数据的一致性;最后结合教育部发布的教育行业标准,完成学校的标准制定,在通过学校各级审核后,发布校级的数据执行标准。以人事系统数据为例,在职称评审过程中,人事数据是主要数据源之一,包括教师的基本信息、学习经历、工作经历等。在处理教师的基本信息时,有很多字段需要标准化处理。如“性别的标准化”问题:在现有人事系统中,0表示“男”,1表示“女”,2表示“空白”;在国家标准中,0表示“男性”,1表示“女性”,2表示“未知的性别”,9表示“未说明的性别”;在教务系统中,1表示“男”,2表示“女”,3表示“空白”。综合考虑,我们使用并集规划,采用的校级标准为:0表示“男性”,1表示“女性”,2表示“未知的性别”,9表示“未说明的性别”。这就要求人事系统要补充没有包括的项,而教务系统需要修改相关的数据字典项目。对于其他数据项目,需进行标准化处理,制定校级数据标准,最后通过学校相关文件,发布校级数据标准。在制定的数据标准中,要确定相关的检测规则和工具,如完整性、空值、一致性、唯一性、手机号、邮箱、工号、身份证等20多个项目的检测规则,并对已入库的数据进行清洗、转换、去冗余,确保现有数据准确无误。数据审计规则如图2所示。

第二步,已进入数据中心的数据经过治理后,还是会出现新的问题。数据中心的数据每天都会更新,所以需要对新进入的数据进行监控。这一步主要通过审计的方法进行,以校级标准为依据,使用数据治理平台的工具和相关数据模型,保证数据的稳定性和准确性,同时控制数据质量。在职称评审过程中,需要对教务系统的教学数据、科研系统的教师科研数据进行汇聚。在原有的教学数据中,只有任课信息,而工作量、课时等信息缺失;在科研数据中,只有教师发表的论文、著作、专利、项目等信息。在科研数据的项目信息中,项目金额信息需要财务系统提供相关数据,数据中心对没有进入的数据,需要通过数据汇聚平台将数据对接进来,而新的数据没有完全标准化,这就需要使用审计功能。在审计过程中,每一条进入系统的数据都要进行检测,并将数据检测报告发回原业务系统,不符合数据标准的数据,提醒原业务系统进行修改,反复修改几次之后,数据基本符合要求。通过对新增数据进行常规化管理,定时对相关数据进行审计、反馈、修改,能够确保数据中心所有数据完整、准确,保证数据的质量。

第三步,在完成基本的数据治理之后,还要考虑数据如何使用、使用权限、使用后的反馈结果等问题。为完成职称评审系统的建设,我们把数据汇聚起来,创建了相应的主题库,同时采用数据统一开放平台,对所有数据进行资源目录化管理,并对所有数据进行分类、分级、分权限,通过资源申请平台,将数据共享给有权限的人使用。

五、高校数据治理的思考

提高数据质量是数据治理最重要的目标[6][7]。通过数据治理,优化数据资产,实现各组织和业务系统的数据资源共享,以统一的开放平台或标准接口提供各种数据服务。数据治理是一个不断循环的过程。作为数据治理的管理者,需要注意以下几个问题:

(一)加强数据治理制度和规范建设,建立常态化工作机制

数据治理需以制度规范行为,对学校的组织管理、职责分工、流程及业务的清晰要有相关的制度规范。通过对数据生产、流转、使用、归档、销毁全生命周期的了解,制定学校数据管理的规则和技术规范。以规范或管理规则为依据,推动业务部门自主有序地開展工作,以规范化、常态化的工作机制对数据进行管理。

(二)与领导及业务部门进行沟通,多方形成共识

作为信息化工作人员,要积极争取学校主要领导和各业务部门的支持;要勤于沟通,提高领导对数据治理重要性的认识;要促使学校各方形成合力,助力项目的持续发展。同时也要注重沟通的艺术,深入理解各业务部门在数据管理过程中所面临的困难,尽量满足其对数据使用、共享的诉求,争取将问题逐个突破,最终完成整个系统的数据治理。数据治理是一项复杂且而长期化的工作,各业务部门对数据的使用习惯不同,会导致不配合或拖延等情况的出现,因此需要建立常态沟通机制,在反复沟通的过程中解决问题,用真诚争取各业务部门的理解和支持。

(三)促进信息化建设归口管理,确保数据可管可控

要强化信息化办公室对信息化建设归口管理的职能,掌握主动权和监督权。对数据的管理要权责分明、有据可依、有迹可查。例如,学校宿舍管理数据由后勤管理处的学生宿舍管理系统产生,该系统也具有宿舍调整和申请等功能,各宿舍的门禁数据均来自于该系统。学工系统在升级时可以包含宿舍管理模块,但该模块的数据要来源于学生宿舍管理系统,如果学生宿舍管理系统的数据不准确,可以与后勤管理处沟通以保证数据的准确性,不允许学工系统再产生学生的住宿数据。学生处的辅导员可以查看同步数据,如发现错误,需要在后勤管理的学生宿舍管理系统中修改。而对于新建设的业务系统,要加强指导、规范和全过程管理,重点满足关键环节的要求。另外,对于不能满足数据治理要求的信息化项目不允许建设,还要加强软件资产的统筹管理,用审批环节约束软件项目建设。

(四)实现数据资源的开放和安全使用,确保数据有序流转

在数据的使用过程中全面掌握学校资产。如发现数据质量问题,需要及时反馈至数据中心,进而通过数据的血缘关系,推动数据治理工作的开展。通过“自上而下”和“自下而上”相结合的方式整理数据需求,理清各数据的血缘关系,不断完善数据资产目录[8]。建立完善的数据使用审核制度,数据的使用管理和个人隐私保护要对全面审核,以确保数据安全。

(五)完善数据质量监控和考核制度,不断提升数据质量

在数据质量方面,要利用数据质量监控平台对数据中心的综合数据进行实时监控,配置相应的数据质量监控规则(如数据的完整性、一致性、有效性等),通过相关规则,及时发现有问题的数据[9]。建设学校数据质量评价指标体系,以及数据质量改进制度与流程。通过数据中心的数据治理平台,定期向各部门反馈数据质量问题,并将数据质量审计报告推送给相关业务系统管理人员,再通过数据质量审计报告推动各部门、各业务系统管理人员、各类数据管理人员进一步提升数据质量。通过建立数据治理工作考核机制、绩效管理机制提高业务部门数据管理的自觉性。

六、结语

本文在对数据治理现状的分析中,阐述了高校在数据治理过程中面临的“缺少顶层推动和协调,由校级领导的统一部署”“缺乏明晰的管理职责,很多数据权责不清”“缺少统一的数据监控管理体系”“缺乏有效的数据流转约束机制,没有相应的开放与分级管理标准”等问题。广州番禺职业技术学院通过数据的标准化建设、数据审计规则的制定,以及数据清洗、转换等过程的治理,完成了数据中心的数据治理工作,盘活了数据资产,为数据价值的持续挖掘和一站式服务的流畅体验打下坚实基础。最后,笔者提出数据治理的几点建议:加强数据治理制度和规范建设,建立常态化工作机制;与领导及业务部门进行沟通,多方形成共识;促进信息化建设归口管理,确保数据可管可控;实现数据资源的开放和安全使用,确保数据有序流转;完善数据质量监控和考核制度,不断提升数据质量。

参考文献:

[1]新华社.中共中央、国务院印发《中国教育现代化2035》[EB/OL].[2019-02-23].http://www.gov.cn/zhengce/2019-02/23/content_5367987.htm.

[2]红星杨.政治局集体学习“大数据”[J].人民周刊,2018(1):10-11.

[3]杨子天,李涛.基于大数据技术的智慧校园数据服务平台设计与实现[J].求知导刊,2018(31):1.

[4]刘桂锋,钱锦琳,卢章平.国内外数据治理研究进展:内涵、要素、模型与框架[J].图书情报工作,2017(21):137-144.

[5]程永新.大数据时代的数据资产管理方法论与实践[J].计算机应用与软件,2018(11):326-329.

[6]章浩,刘波,邹恒华,等.高校数据治理的探索与实践[J].电子技术与软件工程,2017(21):3.

[7]余鹏,李艳.大数据视域下高校数据治理方案研究[J].现代教育技术,2018(6):60-66.

[8]董晓辉,郑小斌,彭义平.高校教育大数据治理的框架设计与实施[J].中国电化教育,2019(8):63-71

[9]范小春.智慧校园环境下高校大数据治理及应用策略[J].金陵科技学院学报,2018(4)243-244.

作者简介:

黄有福,广州番禺职业技术学院教育技术与信息中心助理研究员,邮箱:151417511@qq.com;

黄中伟,广州番禺职业技术学院副教授。

Abstract:With the rapid development of information construction of colleges and universities, data management becomes the foundation of wisdom campus construction success conditions and the wisdom campus construction from “business oriented” to “service-oriented”. This article obtains from the teachers and students of the most wanted needs and tender spots, taking the school's title appraisal system as an example, to establish university-level data standards, configure audit rules, ensure data quality based on the existing data center management, while it further supports that establish the corresponding subject database, unified open platform of data, complete data aggregation, cleaning, conversion and other processes, and drive the business based on professional title review to all-round data integration and efficient data governance. The integration and sharing of data information and business, along with the smooth experience of continuous mining and one-stop service for future data value will be realized, while the modernization of university governance system and governance capacity will be promoted.

Keywords:Data governance; Education informatization; Business driven; Data sharing; Data service

編辑:王晓明   校对:李晓萍

猜你喜欢
数据治理数据共享数据服务
地理空间大数据服务自然资源调查监测的方向分析
基于本体的企业运营数据治理
云端数据治理初探
如何运用税收大数据服务供给侧结构性改革
科学大数据的发展态势及建议
数字化迎新系统宿舍分配模块的设计与实现
贵州大数据产业发展战略理解和实施建议
基于频繁子图挖掘的数据服务Mashup推荐
大数据治理模型与治理成熟度评估研究
大数据时代城市治理:数据异化与数据治理