石玲玲,李敬兆
摘要:针对智慧校园建设中数据质量较差、数据共享缺少审批,数据安全保护不到位等现状,文章提出内生力+反驱动的安全循环数据治理方案,以数据中台、网上办事大厅、统一身份认证平台为支撑,推动数据治理和安全共享。利用该方案对学校智慧校园一期建设中教学、科研、管理及校园生活等数据进行了实践分析与研究。结果表明:业务需求是推进高校数据治理的内生动力,成功落地是实现数据治理闭环的关键。
关键词:智慧校园建设;数据中台;数据治理;网上办事大厅;安全循环治理策略
中图分类号:TP399 文献标识码:A
文章编号:1009-3044(2022)35-0084-03
安徽理工大学在完成基础网络建设和信息系统建设后,经历了数字化校园建设阶段,建立了公共数据交换平台,沉淀了部分教学、管理及校园生活数据,为智慧校园建设奠定了数据基础。该阶段的数据存在数据缺失、数据质量不高等问题,基于视图、中间表方式的數据交换不够灵活,没有严格的审批管理制度,对数据的使用缺少监督。
目前,学校已进入智慧校园建设阶段,针对前期数据的各种问题,本项目提出一种内生力+反驱动的安全循环数据治理方案,以数据中台、网上办事大厅、统一身份认证平台等三大平台为支撑,探讨如何从战略和技术两个层面为数据治理保驾护航;另外,数据治理不是某一个部门的事情,也不是个别人或者个别群体的事情,而是需要多部门、所有师生共同参与完成的,在数据治理的过程中,需考虑如何借助部门、师生力量推动数据治理。
1 高校数据治理研究现状
在高校教育信息化的背景下,越来越多的高校进行智慧校园建设,进行数据治理:胡锐[1]等人从数据治理的角度出发,着重阐述了数据中台的体系结构设计。陈锋[2]等人着重介绍了基于ETL的数据服务平台,从技术角度介绍了数据平台的建设,结合数据治理的要求对数据中台的体系结构进行了设计,但是并未涉及数据主题建设、数据共享及数据共享流程审批等功能。陈桂香[3]等人指出了高校数据管理不可避免地产生社会风险。王晓震[4]等人指出当前高校主要采用传统的网络信息系统防护手段应对面向数据的安全威胁;在数据中心软件及系统的运维方面,采用传统的安全运维方式;在系统容灾方面,防护手段比较欠缺。李超[5]等人介绍了浙江师范大学数据中心采用的数据备份机制,但限于同一个校区内的不同教学楼,未实现本异地容灾备份。刘颖[6]、刘雅琴[7]、张雷[8]提出了从“一张表”工程出发进行师生数据治理,解决师生重复填表的痼疾。蒋广学[9]以北京大学为例,基于高校数据现状和数据乱象进行分析,提出以管理能力提升为导向,立足技术手段,正确认知数据治理的难点与痛点。
本文提出建立一种基于Vertica的分布式数据库和Hadoop大数据全新技术架构的数据中台,完成结构化/非结构化数据的抽取(extract)、转换(transform)、加载(load)(即ETL过程)到数据中台,提供基于 Web 架构的可视化数据处理平台,严格的事务控制策略和数据工作流引擎保证数据的安全性和可靠性。针对数据治理难点,提出基于内生力+反驱动的安全循环数据治理策略,通过良好的数据生态创造更多服务于师生、学校的业务及流程服务,发挥部门、师生的主体力量,以数据服务及数据价值反驱动数据循环治理。
2 智慧校园实际建设中数据治理的重难点
1)信息系统建设落后,导致源头数据不全
学校管理、科研、教学等方面的信息系统建设落后,使用率低,导致数据没有来源系统支撑等问题。
2)信息系统数据标准不统一,给共享带来困难
在数据抽取、推送过程中,发现不同信息系统虽然参照了国标/教育标,但是没有及时更新版本信息,导致相同数据项在不同系统中编码不一致;没有标准参考的校内信息资产,各个信息系统中的数据编码完全不相干。
3)源头数据不能同时具备真实性、完整性、规范性和时效性
真实性,即各业务系统的数据必须真实;完整性,即各业务系统数据必须完整、齐全;规范性,即各业务系统主管部门在进行数据采集、录入、审核时必须保证数据的规范可用;时效性,即各业务系统主管部门必须在规定时间内进行数据更新,确保数据与实际业务同步,防止无效和过时数据产生。建设过程中,发现很多业务系统数据存在脏数据、维护不及时、不规范以及不能持久维护等问题,给数据共享带来很大困难。
4)业务部门对数据的重视程度不够,相关人员的信息化素养不高
很多业务部门对数据的认识还不能从思想上转变,比较依赖手工方式,数据治理部门对数据治理的执行力度决定了数据资产的质量和价值。
5)数据安全意识具备,数据安全保护策略不足
各业务部门和数据管理部门均具备数据安全保护意识,出台数据保密协议,从制度上保障数据安全;同时,数据管理部门制定了数据备份和恢复机制,具备本异地容灾备份功能。但是,实际过程中还存在不完善的地方:没有按照数据风险等级进行数据分级;数据接口如何保证安全可信地调用。
3 内生力+反驱动的安全循环数据治理方案及应用
3.1内生力+反驱动的安全循环数据治理方案
针对上述问题,本文提出内生力+反驱动的安全循环数据治理策略,主要包括以下内容:
1)制定校级统一的数据标准
在最新国标/教育标的基础上,数据管理部门联合教务、资产、后勤、学工等多部门制定了校级数据编码规则,并落地实施,采用映射及数据清洗方式统一规范已有信息系统数据,强制要求新建系统使用校级数据标准。
2)出台有效的数据管理、数据共享等制度文件
智慧校园建设启动之初,成立了由校领导挂帅的智慧校园建设领导小组,建立了智慧校园建设工作机制,出台了数据共享保密协议及数据使用管理办法,明确了业务部门对数据的主导地位及“谁产生数据,谁负责管理”的权责关系。
3)基于数据中台的全量数据中心
数据中台依照校级数据标准,形成符合要求的数据质量检查规则,完成源头数据的抽取整合,形成符合数据标准和数据质量要求的业务数据,存储至学校分布式数据仓库平台,开发数据模型,形成学校各领域主题库;通过api接口和数据共享流程,对智慧校园中各信息系统提供数据支撑;由数据可视化工具进行相关可视化数据分析、展示。数据中台的总体架构设计如下图1所示。
系统总体分为7层,从底至上依次是:数据来源层,数据采集层,操作镜像层,数据标准层,数据指标层,数据开放层,数据消费层。数据来源层,即产生源数据的业务系统,包含了一网通办系统、人事系统、教务系统、图书馆管理系统、学工系统、一卡通系统、招生、迎新、就业系统。数据采集层,通过ETL工具或数据填报工具来采集数据。操作镜像层,即ODS层。存放源业务系统的数据快照,保存了源业务系统的所有数据细节,操作镜像层基本保存和源系统数据结构一致。数据标准层,即FDM层。数据标准层是整个数据仓库的核心,它以强大的数据中台数据库引擎为基础,参考国标、教育部标准、校标生成数据模型,管理来自各种源数据系统的数据(包括当前及长期的历史数据),并为访问用户提供数据服务。数据指标层,即ADM层。即将已治理好的标准数据层中的数据进行加工整合,主要通过报表层数据表或API接口方式进行开放应用。数据开放层,是在数据标准层和数据指标层的基础上,将数据开放给下游的业务系统。数据消费层,是指需要通过数据开放层在平台进行数据使用的申请,最后通过在数据开放层的API接口获取数据标准层(FDM)和数据指标层(ADM)的数据应用产品和业务系统的抽象逻辑层。
4)重构业务流程,让部门、师生共同参与数据治理
在强有力的体制机制的保障下,强大的数据平台作为技术后盾的情况下,数据治理的内生力就是各类服务于师生的业务系统和业务流程,通过系统和流程的高频率应用,促使各类数据向下游系统流动,体现出数据价值。数据治理不仅是系统和部门的事情,应该充分发挥师生的作用力来驱动数据治理。
在建设过程中,通过流程平台,将覆盖面广、使用频率高的线下事务再造之后搬至网上办事大厅,让师生切实体会到“数据多跑路,师生少跑腿”,以此带动各个业务部门的积极性,主动形成更多的线上办事服务,让各部门、师生共同参与到数据治理过程中。
5)妥善处置再造流程数据。
再造流程产生的数据应当妥善处理,提出如下解决方案:
①业务流程有业务系统支撑,流程数据需要存储到业务系统。如果业务流程有相应的业务系统支撑,可以采取抽取业务模块嵌入网上办事大厅,形成一个服务事项,所产生的数据直接保存于业务系统,再通过数据中台抽取即可形成数据共享,不存在数据回写的风险。
②业务流程没有业务系统支撑。该类业务是网上办事大厅最常见的业务,线上审批结束后,流程数据会直接保存于流程平台。该类数据如何体现出价值。可以将流程按照业务形成主题,产生的流程数据根据主题建模,形成主题数据,供管理决策使用。
6)建立数据反馈整改制度,提升信息化意识和能力
部分业务系统在建设过程中,只着眼于满足当前的系统可以投入使用,对有质量问题的数据直接在末端系统修改,并未反馈给数据源头部门,造成数据治标不治本。应当建立数据反馈整改制度,反驱动数据治理的推动落实还需要依靠各业务部门信息化人员的推动,树立数据治理意识,同时,数据管理部门也应占据主导地位,对此类情况要以高标准、高力度协调好各部门推动数据源头治理。
7)加强数据安全保护技术应用
校内数据涉及师生敏感信息,应通过技术手段实现数据共享全程的安全保护,进行安全等级分类,根据安全等级匹配不同的数据权限,如访问权、管理权等。对下游系统的共享,要通过共享流程审批,原则上须经需求人或需求单位发起申请、所在二级单位负责人审批,数据管理部门负责线上审批,提供数据输出方式;原则上,数据管理部门审批同意,即代表数据产生方同意。数据中台通过https协议进行数据传输加密,实现数据安全共享。
3.2應用成果
根据校级统一数据标准,按照“一数一源”原则,建立了数据中台,逐步完成了全量数据基础建设。目前,已抽取校内18个主要业务系统数据,存储4182张数据表,包括8.5万条数据项的数据共享。在此基础上建设了主题库、指标库等,已完成学生、教职工、班级、课程、校园消费、房产等15类大主题、40个具体主题的建设。数据中台利用https协议进行传输加密,通过api接口为业务系统提供数据。已通过31个api接口为阳光跑、自助打印、网上办事大厅、智慧思政、智慧后勤等15个业务系统提供了2亿条数据的共享。
学校统一身份认证系统经历了三次更迭,近两年逐渐接入了办公OA,教务,图书自助借还以及CARSI联盟认证等系统,本次智慧校园建设将统一身份认证系统再次升级,与网上办事大厅打通,接入更多的业务系统,形成业务直通车,支持人员多重身份管理及全生命周期管理,支持多种登录方式和多因子认证方式,实现一个账号、多重身份的自由切换。该平台将作为学校众多信息系统登录认证的基础支撑平台,保障各类信息服务的在线使用。
在数据中台的基础上,充分利用网上办事大厅和统一身份认证平台,以网上办事大厅为入口,通过统一身份认证平台使用各项业务系统,办理线上事务。针对非校内教职工的临时人员,因其与学校存在工作关系,需要为其开通账号和相应权限,而学校往往没有专门的系统用于临时人员管理。我校就以临时人员相应权限申请流程为契机,以流程数据为源头,通过数据中台共享到相应系统,解决了临时人员管理问题,取得了非常不错的效果。
4 总结
通过本文提出的数据治理策略及应用成果可以看出,业务需求是推进高校数据治理的内生动力,成功落地是实现数据治理闭环的关键。通过本次数据治理,建立了统一的校级数据中心,完成了教学、科研、管理、校园生活等领域数据的有效治理,沉淀了一份覆盖全校各领域的校级数据资产,真正实现了安全可靠的数据共享。如何利用大数据分析全量数据并对学校现代化管理提供信息化支撑是日后的研究重点。
参考文献:
[1] 胡锐,芮忠.基于数据中台的高校数据治理系统的设计[J].电子世界,2020(12):187-1880.
[2] 陈锋.ETL数据治理在高校信息化建设中的研究与应用[J].中国教育信息化,2020(13):68-70.
[3] 陈桂香,洪林,吴刚.整体性治理:我国高校大数据技术社会风险的防范[J].教育学术月刊,2021(5):72-77.
[4] 王晓震,金培莉,陈瑛,等.高校数据中心数据安全风险分析及对策研究[J].北京联合大学学报,2021,35(3):53-59.
[5] 李超.智慧校园背景下高校数据中心研究与实践——以浙江师范大学为例[J].现代信息科技,2021,5(8):195-198.
[6] 刘颖.基于数据治理的智慧校园数据支撑顶层设计研究[J].信息记录材料,2020,21(11):149-150.
[7] 刘雅琴,毛文卉,熊鹰,等.基于“一张表”工程的高校教师数据治理实践[J].中国教育信息化,2021(3):48-51.
[8] 张雷.高校数据治理中提升数据质量的方法研究[J].信息与电脑(理论版),2021,33(14):250-252.
[9] 蒋广学.高校校务数据治理的实践探索与理论探讨——以北京大学为例[J].北京教育(高教),2021(4):8-11.
【通联编辑:王力】