庞飞
摘 要:数据治理工作是高校智慧校园建设的必经之路。數据服务是数据治理的终极目标,数据服务的拓展不断将数据治理工作引向深入。数据需求侧与供给侧之间的矛盾是当前数据治理工作需要解决的主要矛盾。数据治理工作由信息化管理部门牵头,但需要将数据管理责任落实到各个业务部门,数据治理工作强化了信息化管理部门的支撑引领地位,提升了学校综合治理能力。
关键词:高校;数据治理;数据服务
中图分类号:G647 文献标志码:A 文章编号:1673-8454(2021)15-0051-03
一、引言
随着大数据、云计算等技术的高速发展与普及运用,高校信息化进入新一轮的发展周期,很多高校都提出了“从数字校园向智慧校园迈进”的目标。“数据”作为新的生产要素,其价值得到了前所未有的重视与挖掘,但无论是哪所高校,无论其信息化发展到哪个阶段,都曾经历过或正经历着数据缺乏治理的窘境。“数据治理”任务像一座大山横亘在信息化发展的路途之中,“数据如何治理、数据治理要到什么程度”这些问题迅速成为高校信息圈的讨论热点。
中国石油大学(北京)从2017年开始进行大规模的数据整合工作,2019年开始全面进入数据服务层建设:以解决“教师填表难”问题为突破口制定教师个人业绩数据规范、打造个人数据中心;以学科评估、事业发展数据分析与展示等校情数据应用场景强化数据源管理责任;依托以数据驱动的“一站式服务平台”吸引组织部、人事处、保卫处、教务处、财务处、国际交流与合作处等多个管理部门的服务流程上线。我们逐渐进入了各部门优势互补、协同共进的良性发展轨道,形成了自己“以问题为导向、以服务促治理”的数据治理模式。
二、“以问题为导向”解决突出问题
“以问题为导向”就是要正视在信息化发展过程当中积累起来的各种矛盾。高校信息化不应是信息技术、设备的简单引入与堆砌,而是要解决突出问题,清除与信息时代发展格格不入的痼疾,推进学校治理体系与治理能力的现代化。
高校在信息化发展过程中,一方面信息系统越建越多、数据沉淀越来越多;另一方面,面向师生的数据采集却越来越频繁、数据填报越来越繁冗,数据多头采集、重复填报现象让师生不胜其烦。这些突出问题、突出矛盾如果不能通过信息化的手段加以解决,“以师生为中心”、“提升师生获得感”、“打造服务型高校”就会沦为空话、套话。
三、“以服务促治理”是目标导向
面对学校领导层提出的“能不能利用信息化手段解决‘教师填表难问题”,信息化管理处(原信息中心)于2019年启动数据集成、治理二期工程的同时,启动了以“个人数据中心”与“一站式服务平台”为核心的数据服务层建设,数据治理的目标从“消除数据孤岛”快速向“全面提供数据服务”层面转移。
长期以来,“消除数据孤岛”一直是数字校园建设的重点目标。实现主数据在各业务系统中的交换、共享,解决数据冗余、不一致问题固然相当重要,但如果数据交换只是发生在业务系统之间,无论是师生还是学校的领导层都对数据治理工作的必要性与长期性缺乏直观的感受,而一旦数据被汲取到服务层变为可见、可用,数据治理的必要性与紧迫性就更容易在最大范围内被理解与接受。“数据治理”是信息化管理部门推动的、容易引起数据源管理部门抵触的艰难而长期的工作,但在“数据服务”的语境下,“数据治理”得到了顺理成章的解释,“数据治理工作”也因为看得见、用得着的成效得到了更多业务部门的支持。以人事数据为例,随着一站式服务平台服务对象的不断扩展,多年来长期难以触及的退休人员数据在人事系统中得到了彻底的清理;因为服务流程节点需要精确到系(学院的下一级),人事处被迫将人员管理的精度调整到系与实验室级别;因为数据展示的公开化,人事系统中人员分类不科学的问题也迎刃而解。因为人事数据(包括组织架构信息)在整个数据供应链上的重要性,信息化管理处单独撰写了《人事数据管理规范》来指导人事系统管理人员的操作行为,包括明示不当操作对下游系统可能造成的冲击与影响。
“数据服务”不断拓展的过程,也是“数据治理”逐渐走向深入、细化的过程,“数据服务”才是“数据治理”的终极目标。
四、数据“需求侧”与“供给侧”之间的矛盾
一般来说,高校的数据集成是从“供给侧”即业务系统数据开始的。要集成哪些数据主要有三方面的参考:一是《高等学校管理信息标准》;二是业务系统开发厂商提供的数据字典;三是数据治理服务提供厂商在其它学校的实施经验,厂商在集成数据之前也会深入业务部门甚至深入业务系统进行调研。在没有开始数据服务层的建设之前,信息化管理部门对业务数据的理解是肤浅的,对于厂商而言,虽然有在其它院校治理实施的经验做参考,但因为高校之间业务系统的个性化差异非常大,底层数据结构的差异也比较大,厂商在理解数据结构、数据内涵方面也面临不小的困难。对于准确理解数据而言,数据集成只是囫囵吞枣的第一阶段,而从需求侧去逆向梳理数据才是学以致用的第二阶段。以教务数据的集成为例,如果没有为在线教学平台提供过数据支持,信息化管理部门可能永远都不会理解教务系统与研究生管理系统的教师开课信息、学生选课信息中众多字段的具体内涵。
从需求侧逆向梳理数据要解决三个问题:一是需要哪些数据;二是数据在哪儿;三是数据应该由谁来管理与负责。
为解决教师填表难问题,信息化管理处从职称评审、岗位聘任、年度考核三个维度入手梳理教师个人业绩相关数据并形成我校的《教师个人业绩数据规范》。随着时间的变迁、考核机制的调整,这个数据规范也一直处在动态的调整之中。这份基本反映教师个人教学、科研、管理工作全貌的数据规范在服务层构成了“教师个人数据中心”的主体内容框架。
通过仔细梳理,我们发现:对于教师个人业绩数据,只有约50%的数据项是通过业务系统来进行管理的,可以通过数据集成自动采集,但这部分数据中以科研成果数据为代表,亦存在比较大的遗漏(原因及解决方案后文有所提及);有接近40%的数据项是由主管部门通过文档来进行管理的,这部分数据普遍存在关键字段缺失(如工号)、分类不科学、格式不规范的问题,入库前需要进行集中的数据治理;还有约10%的数据项从来没有进行过格式化的管理,需要相关业务部门根据格式化要求进行补录。
至此,我们把数据“需求侧”与“供给侧”的矛盾列为信息化现阶段的主要矛盾之一。师生对优质数据服务的渴求与现存数据体量、质量供不应求形成鲜明反差。
可以说,数据 “需求侧”与“供给侧”的矛盾是信息化发展不均衡不充分的直接体现。有的部门长期耕耘业务系统建设,业务数据化程度高,数据管理能力相对较强;有的部门对信息化缺乏足够的认识,业务数据化程度低,缺乏科学管理数据的能力。需求侧与供给侧、数据管理与数据服务之间的长期脱节是造成矛盾的主要原因,业务部门在业务系统建设过程中考虑更多的是它的管理功能而不是服务功能,在业务部门各自为政的视野之外还存在大量的服务盲区,跨部门的数据调度与流程搭建是谁也不愿去触及的“危险”地带。而最终站在全局视角,承担衔接数据管理层与数据服务层、规范数据管理责任的只能是信息化管理部门。
五、明确数据管理責任是关键
表面上看起来数据治理是以提高数据质量为目的,实际上数据治理的关键是明确数据管理责任,即按“一数一源”的原则确定数据源管理部门。通常情况下,业务由谁牵头,产生的数据就应该由谁来管理并对数据的准确性负责。数据治理的正确方式应该是从数据源头上由数据管理部门完成治理,信息化管理部门可以帮助去发现问题(数据治理平台可以帮助更快更准确地发现问题),但真正解决问题还要靠业务部门自己。以前文提到的《教师个人业绩数据规范》为例,除了定义数据域、数据项、数据字段,更重要的是为每个数据项明确归口管理部门、管理责任。对于那些尚未实现系统管理的数据项,归口管理部门亦有责任按《规范》提供的标准格式进行文档管理并定期提交,将来通过业务系统功能的扩充逐渐实现业务的全面数据化。
打通校内数据循环大动脉的前提就是“一数一源”。可以预期,业务系统仍将是业务数据化的主要基站,信息化管理部门绕开业务部门(或苦于业务部门不配合或苦于业务系统不健全)以个人填报方式采集的数据,如果不能回流到业务系统中(部分数据回流非常困难),可能会削弱各业务部门持续改进业务系统的动力。
数据源一旦得以确认,数据源管理部门的责任一旦得以明晰,数据流通管道与数据流向一旦得以建立,数据源、数据源管理部门的权威性就必须得以坚决维护,任何有损这种权威性的割据行为就必须得以纠正,否则就会不断出现数据流通体系之外的数据孤岛现象,这也是信息化管理部门需要参与到业务系统建设中的原因之一。
对于很多高校而言,以科研论文为代表的科研成果数据既是事业发展层面的关注重点,也是教师个人业绩数据的重要组成部分,但科研管理系统在承担科研项目管理的同时能否发挥科研成果数据的采集功能这个问题,各个高校的答案不一。以我校为例,为便利考核,学院自建填报平台采集教师科研成果数据,客观上造成了教师在科研管理系统中认领或填报数据的积极性不高,损害了科研管理系统作为全校科研成果权威数据源的地位,业绩数据一次采集、一次审批、重复利用的初衷没有得到贯彻与体现。
为此,信息化管理处联合科技处等相关部门共同发文,明确学校将依托科研管理系统加强科研项目及成果数据的归口管理,凡职称评审、岗位聘任、年度考核、研究生导师评审与认定等场景涉及科研项目及成果数据,均以科研管理系统为准,其它来源的科研项目及成果数据学校管理部门不予认可采用。当然,科研管理系统为了将学校的科研成果数据应收尽收并且满足下游数据服务需求,系统本身也做出了相应改进,比如将学术论文分类扩展为“科技、本科教学、研究生教学、党建行政管理研究”四类。
六、结语与展望
数据服务是数据治理的终极目的,数据服务可以有效推动数据治理,数据服务场景的叠加不断将数据治理工作引向深入。数据作为公共资源取之于师生、用之于师生,在流通中不断实现质量与价值的提升。
“一数一源”是打通数据循环大动脉的前提条件。与平台建设同样重要的是机制建设、标准建设,如果不能通过机制来明确数据管理责任、通过标准来确立数据科学维护规范,由信息化管理部门牵头的数据治理工作可能难以为继。
数据治理过程是学校治理体系与治理能力的重塑过程,彻底改变了以往各部门、各学院各自为政的信息化建设格局,也突显和强化了信息化管理部门的支撑引领地位。信息化管理处借助数据服务推动数据治理工作,逐渐把自己升级成比业务部门更懂业务数据的部门,这对将来数据资产的整体开放、数据能力的整体释放起到了至关重要的作用,因为在这之前,还没有哪个部门具备这样的全局视野与业务能力。
业务系统间的数据耦合是业务层面实现不了彻底融合的产物,建立的数据连接越多,整个数据交换体系就越复杂、越脆弱。为了精准地调度数据、方便地处理数据、灵活地开放数据能力,强健的数据治理平台是基础,只有系统化才能驾驭复杂化,唯有智能化方能抵御脆弱化。
参考文献:
[1]于俊清,王士贤,吴驰,等.新时代高校信息化工作怎么做?[J].中国教育网络,2019(2):83-84.
(编辑:王天鹏)