郑苑 梁振辉
摘 要:高校开展大数据治理是解决当前教育数据管理实践不足的必要措施。文章从高校数据管理现存的问题入手,通过分析,得出当前大数据在教育领域的实践未能出成果的主要原因是管理机制不畅。文章通过构建数据治理框架,从学校顶层管理机制以及数据管理两方面厘清思路,解决“数据治理采取何种方式、何种路径运行”的问题。
关键词:数据治理;数据共享模式;工作任务调度;高校数据管理模式;高校信息化
中图分类号:G434 文献标志码:A 文章编号:1673-8454(2020)17-0050-05
一、引言
随着智慧校园建设的逐步深入,以及云计算、大数据、人工智能等新信息技术的发展,高校信息化建设的目标逐渐从信息系统建设,转化为借助信息化手段,革新教学管理模式。在该目标模式的驱动下,数据资产的管理显得尤为重要。以数据为核心的内部诊断、整改为高校治理提供重要依据。面对各应用系统大体量、多维度的海量数据,如何更有效地开展数据治理工作,利用数据有效支撑教学管理决策活动,是高校管理工作面临的新问题,也是教育管理研究的新课题。
二、高校数据管理现存的问题及数据治理的意义
随着信息化建设的不断深入,高校在打破信息壁垒、整合办事流程的探索中,逐渐面临着数据标准不规范和数据源头不明确导致的数据流程混乱、数据流转不顺畅、数据应用不能满足需求等一系列问题,给数据共享带来了重重障碍。系统应用支撑数据因共享不畅势必导致数据通过不同的方式来获取,就会出现数据重复采集、数据不一致等问题,使得数据共享的权威受到极大挑战,用户丧失对信息化发展的信心。
面对当前的数据管理困境,高校迫切需要通过更为便捷的信息化手段,解决当前数据共享中存在的“数据质量不高、数据流向混乱、共享度不足、关键数据缺失”等问题[1]。需建立高度融合共享的数据平台,获取高质量的数据,为教学、管理服务,并对各领域产生的数据进行处理、分析,挖掘数据背后蕴含的教育规律,实现更进一步的数据利用,并通过统计分析为决策提供依据,实现学校“依数治理”。
三、数据治理的概念及研究现状
1.数据治理的涵义
关于数据治理的定义,由于关注点不同,表述可能也会不同,因此至今数据治理未形成明确统一的定义。数据治理研究所给出的定义是“数据治理是指针对信息相关过程的决策权和职责体系”;国际著名数据治理专家Sunil Soares将数据治理定义为“通过协调多个职能部门的目标来制定与大数据相关的数据优化、隐私保护与数据变现的政策”;也有观点认为数据治理是一个围绕数据全生命周期的活动集合。本文结合高校数据管理的现状,将数据治理描述为“管理上重构学校数据管理职能,规范数据管理行为;业务上通过搭建业务治理平台,对业务管理数据进行标准化的梳理、清洗,有序且规范化地进行数据的采集、存储、应用,实现数据资产的深度共享和有效管理”。
2.研究综述
随着教育信息化的逐步深入,许多高校已经认识到数据治理对学校发展的重要意义。余鹏等人在“大数据视域下高校数据治理方案研究”中指出高校通过开展数据治理,可以有效解决“数据质量不高、数据流向混乱、共享度不足、历史数据缺失”等问题,更好地满足学校教学、管理领域进一步发展对数据提出的需求[1]。王锦华等人在“高等教育的数据治理研究”中指出,通过数据治理的有效实施,可以使大学的教育质量得到进一步提升,保障管理层决策的科学性,提高行政、教学管理的效率,使高校的管理服务变得更加“智慧”[2]。瞿振元在“大数据是教育研究走向科学化的重要支撑”中提到,高等教育“依数治理”旨在通过对教育大数据的整合、管理和控制,从数据视角,依靠数据证据实现对高等教育的现代化管理,为高校持续发展提供更加科学、客观、全面、智能的管理与决策,使高等教育治理和教育研究逐渐走向科学化[3]。
目前,各个高校的数据治理实践正处于“摸着石头过河”的探索阶段,但是从研究现状可见,文献资料对数据治理的内涵以及技术实施途径方面研究较多,在利用大数据解決学校决策活动方面的实践案例及经验总结并不多见。基于数字化校园数据共享理念基础上升级的数据治理理念,在实践过程中存在着很多的问题。祝智庭等人在“解决教育大数据的文化底蕴”研究中指出教育行业引用大数据的研究日益受到关注,但是利用大数据解决教育实践中遇到的难题的成功经验并不多见[4]。随着大数据相关技术的发展成熟,大数据在教育实践中的应用不存在技术方面的难题,导致大数据在教育领域的实践未能出成果的主要原因在于运行机制存在问题。
四、高校当前数据治理的难点问题
各高校经过从“数字化校园”到“智慧校园”的建设,在用信息系统基本涉及校园管理和教学服务的各个领域,积累了海量的结构化和非结构化管理数据。但是,这些海量数据在学校的决策管理过程中,并没有如期望那样发挥应用的作用。分析其原因,有助于我们了解当前数据治理的难点、需求,进一步思考解决问题的方案。
1.共享数据缺失
首先,数据标准不同,共享不畅是造成共享数据缺失的主要原因。大部分高校在数字化校园建设初期,并没有十分明确的信息化建设规划,信息系统的上线以业务需求为主,系统底层设计多样化导致各系统在与数据中心的共享过程出现各式各样的接口问题、标准问题而无法进行共享的窘境。其次,高校各业务部门信息化水平参差不齐同样导致关键业务数据的缺失,信息化水平较差的业务部门甚至没有建设信息系统,数据的积累完全靠传统的电子表格,数据的安全都难以保障,更别说数据的共享、治理。再者,一些需要多部门相互协作的业务,由于数据维护责权不明确,容易造成过程性数据缺失,结果导致数据多源且数据冲突、数据不完整。
2.数据源头维护不明确
“一数一源”是保障数据共享有效性的重要原则,源头负责是保障数据质量的有效举措,举一个很简单的例子,学校教学场地的编号作为建筑物的信息应该统一由资产管理系统管理并共享给各个应用系统,但是由于某方面管理的缺失,作为源头的资产管理系统并没有提供共享,导致教务系统一套标准,实习实训系统一套标准,作为会议管理的系统一套标准,给数据的共享统计造成了困难。这样的现象在高校数据管理中屡见不鲜。
3.数据管理混乱
高校数据管理混乱体现在数据的管理体系和数据的生命周期管理。基于数字化校园数据共享理念建设的共享数据中心,缺乏数据的统筹管理部门,业务部门数据管理各自为政,共享数据中心被动地获取业务部门提供的数据。数据管理权限分散导致数据管理权责混乱;业务部门管理上没有明确的数据责任人,数据安全和隐私监管机制不完善;缺乏对数据生命周期的认识和管理机制;缺乏对历史数据的有效识别和处理,无法提供数据的朔源及过程管理信息。在此基础上导致业务部门作为数据需求方不能及时、按需获得数据支持,作为数据提供方时无法提供真实、准确的数据。
针对当前高校在数据管理应用上面临的难题,单靠解决技术层面的问题无法从根本上解决这些难题,关键在于应该结合学校的数据现状及应用目标,从管理机制上进行变革,加强数据统筹管理。
五、高校数据治理框架设计
高校数据治理框架如图1所示。首先从学校顶层管理设计上确立一个清晰的数据治理运行机制,在制度的保障体系下,建立数据管理体系,以技术平台的搭建为技术基础,建设校本化信息资源标准以及数据流程管理标准,完成数据全生命周期的资产管理。该框架的设计有助于明确数据的权威源及数据维护责权,提高共享的有效性和实时性,实现数据的有效利用。
1.完善数据治理运行机制
通过组织架构的革新,建立自上而下的数据管理机制。目前高校各业务部门信息素养程度参差不齐,有些业务部门虽急需信息化辅助决策,但是数据意识薄弱,数据管理混乱,无法支撑业务发展的需要;有些部门信息化建设初见成效,奈何受“数据私有”的狭隘思想禁锢,无法提供有效的数据共享;有些部门从数据治理中获益较少,参与数据治理的积极性不高。总体来说,目前高校各部门缺乏大局观,不能从学校整体利益出发对待大数据治理。而作为数据管理部门的信息中心在学校中往往处于教辅地位,对业务部门的约束力不足,机构间协调难度大,统筹管理的能力不足,严重影响数据治理的实施效果。因此有必要自上而下明确数据管理的机制,确保制度执行的力度及效率。一是成立专门的数据管理部门;二是建立完善的数据管理机制;三是明确定位校内各部门在数据管理各环节的职责;四是确定数据治理执行的流程,并将数据治理的工作任务合理分解到每一个部门;五是将信息化纳入机构考核指标。
2.厘清数据治理管理体系
(1)数据标准管理
建立校本信息资源标准是高校数据治理的基础任务,数据标准的确立,可以为业务系统的建设及数据交换提供数据规范,确保数据含义的高一致性以及强可读性,实现数据的有效共享,解决数据的重复采集。
数据标准的内容应包括高校数据管理组织标准的定义、数据项的规范化定义、校级标准代码的定义,以及数据代码、数据项维护流程的定义。明确各数据项的权威数据源及数据维护责任。
(2)数据流程管理
高校数据流程管理的目的是将业务系统的数据汇集到共享数据中心进行集中式管理应用,因此对数据流程管理的任务就是定义元数据进行统一的管理。元数据的定义必须包含数据项定义、数据存储表的关系、数据流向等信息,利用接口信息实时获取业务系统的数据。数据流程的管理一般借助平台工具实现,包含元数据的管理、查询、版本控制、关系运维、提供清晰的数据字段映射关系、方便对数据仓库的数据条目进行检查,以及灵活修改数据指标等。
(3)数据资产管理
数据资产管理过程是一个资产全生命周期的管理过程。数据的生命周期包含了从数据生产、采集到数据存储、转换、应用,直至归档和销毁等多个阶段[1]。关键环节包括:①数据定义,包括数据的版本控制、定义、接口管理;②变更管理,包括数据的更新迭代、审批管理;③数据质量管理,包括数据资产质量指标监控;④资产应用,包括数据资产访问、引用等信息的统计分析;⑤接口管理,包括与数据安全管理、元数据管理、数据质量管理等的对接。
数据资产的管理,即是将数据管理机制贯彻于数据资产全生命周期的過程,明确各生命周期中各机构承担的责任、扮演的角色,明确各项业务的操作流程。在此环节,各个高校依据自身情况设定的数据管理政策可以是长期的,也可以是专题性、阶段性的数据管理政策。
六、数据治理个案透视
广东省外语艺术职业学院在数据管理机制的探索中,为解决共享数据中心数据不完整、各项数据重复采集、业务部门面向各类统计任务时怨声载道等问题,制定了基于“工作任务调度”的数据管理模式,流程如图2所示。
1.管理机制创新
基于“工作任务调度”的数据管理模式的核心思想是将数据的需求与采集职能进行分离,明确数据管理部门作为数据管理工作任务的调度中心,当业务部门作为数据需求方时,需要向数据管理部门提交需求说明,由数据管理部门根据现有数据进行分析,针对缺失数据与权威源部门协商采集方式,完成数据的收集。
通过该管理机制,针对跨部门的业务,以及信息系统未覆盖业务的数据维护难点问题,有效解决数据重复采集,极大地丰富了共享数据中心的数据数量,提升数据质量。
2.数据管理实施过程
(1)数据分析
业务部门提出的数据分析,有时候是具体的数据字段,大部分是上级要求的统计文件、报表数据。数据管理部门接收到统计文件时,首要必须对文件进行解读,转换为数据库可以识别的字段信息,这是分析的第一个阶段。
分析第二阶段是将需求数据与现有数据进行比对,分析当前数据资产对业务需求的支持程度,若现有数据不能支持结果的获取,即开展数据采集,如果现有数据可以满足业务结果的输出,当前业务需求可以直接向业务部门提交结果。
(2)数据采集
在该模式中,通过平台的建设,为数据采集提供场景配置工具,丰富数据获取的方式。对于有业务系统支持的数据获取,可以将业务系统相应模块封装链接后向用户获取,用户实际上仍然是通过业务系统完成业务流程,产生业务数据。对于信息系统未覆盖业务的数据获取,通过数据中心配置应用场景,收集静态数据,定期维护动态数据,同时共享给各业务系统。
数据采集实施过程中,无论采用哪种形式的数据组织形式,在面向用户提供服务时,需注重弱化应用系统的概念,建设以数据需求为导向,以校本化信息标准为基础,以数据共享为目标的场景服务平台。同时,在条件允许的情况下, 将采集与业务办理的场景相结合,实现伴随式的数据采集,最大限度地降低用户对数据采集的抵抗情绪,减少用户的重复劳动。
3.数据管理实施效果
通过基于“工作任务调度”数据共享模式的实施推广,一方面为无业务系统数据采集提供了有效途径,解决数据重复采集的难点问题。以数据中心提供的采集场景为基础,教工在业务结办的同时将数据、资料上传至共享数据中心,经审核后用于数据的共享利用。另一方面,该模式较好地支撑了学校评、算、送、策业务。共享数据中心好比人的大脑,掌握协调各个业务部门汇总的数据,在数据源唯一的基础上,由共享数据中心呈现综合的统计分析结果,节省业务部门来回提供数据、反复审核的环节。
(1)应用场景一:为教师提供数据画像,实现教师工作绩效智能评估
通过数据管理,将科研、教务、人事等应用系统的数据集中到数据中心,为教师进行画像,评估教师教学绩点、描绘教师个人发展路线、挖掘教师科研特点,为自动评价教师工作绩效、衡量教师科研水平提供数据支持和管理依据。
(2)应用场景二:为学校师资提供数据画像,实现顶层科学管理与智能决策
师资画像的场景可以分为院系层面和学校层面。场景通过对师资队伍的年龄、职称、学历、专业、科研成果等结构进行全面、综合分析和展示,对人事部门制定人才培养和引进政策、发现高价值人才起到科学决策和指引作用,有助于学校实现高质量人才培养和引进的治理目标。
(3)应用场景三:各种数据评估场景的应用
学校基于该数据管理模式,创建了“教学科研骨干考核业绩评价场景”,基于业务系统的数据对教师的工作绩效进行自动评估,改变以往纸质材料线下审核的方式,提高管理工作效率。同时通过数据共享平台的工具采集缺失的关键数据并提供共享。
七、高校数据治理实施的一点思考
数据治理是一个由少而多、持续迭代积累的过程,不是仅靠某个平台的搭建就可以实现,更没有普适方法可以适用所有的高校。在数据治理的总体框架下,各个高校在实践中只有经过不断的探索,才能摸索出适用学校实际的实施方案。
1.顶层设计,系统规划
构建高校教学管理数据平台,采集数据并进行相关整合分析,是大数据和相关应用的关键和基础;同时,设立专门的机构或部门对数据进行集中管理,规划学校信息化建设的整体方案,有计划地推进信息系统建设,提升信息化管理部门在学校的地位;在教学、科研、学生管理、教职工管理等领域要有信息员参与数据治理,各个领域的信息员必须十分熟悉本领域的数据情况,敢于承担一定的责任。
2.强化数据意识,提高数据素养
各个高校应该从认识和能力两方面强化工作人员的培训。数据意识是认识层面,要求工作人员了解数据的意义和价值,并能意识到数据处理不当可能带来的对学校管理的影响。数据素养是一种能力,是指工作人员对数据具有很强的敏感性,能够完成数据收集、分析,并利用分析结果进行决策支持。要完成这两方面的培训,必须在日常管理工作中注重学习和培养“用数据说话”的意识,在管理决策中贯彻“数据驱动”的思维,摒弃利用直觉、依靠经验的主观管理模式。
3.建立健全规章制度,创新数据使用和分享机制
在数据采集和使用过程中,可能出现导致师生隐私泄露的隐患,威胁学校信息安全。因此,与数据治理同步进行的是学校管理使用规范的制定,从制度的层面保障数据治理全过程的安全。
4.构建评价体系,促进创新发展
从学校层面建立信息化建设绩效考核制度,将信息化工作纳入部门和人员绩效考核,并配套绩效奖励方法。
八、结束语
本文从当前高校数据治理的难点问题出发,针对关键数据缺失、数据源头维护不明确、數据管理体系和数据生命周期管理混乱等问题,提出高校教育数据的治理不仅要解决技术层面的问题,更应该结合学校的数据现状及应用目标从管理机制上进行变革,构建高校大数据治理框架,完善数据治理运行机制,厘清数据治理管理体系,并对数据治理的实施提出策略和思考,以期帮助高校更加全面、客观地分析和解决数据治理领域的问题。
参考文献:
[1]余鹏,李艳.大数据视域下高校数据治理方案研究[J].现代教育技术,2018(6):61-67.
[2]许晓东,王锦华等.高等教育的数据治理研究[J].高等工程教育研究,2015,5):25-30.
[3]翟振元.大数据是教育研究走向科学化的重要支撑[J].清华大学教育研究,2017,38(3):1-3.
[4]祝智庭,孙妍妍等.解读教育大数据的文化底蕴[J].电化教育研究,2017(1):28-36.
[5]董晓辉,郑小斌,彭义平.高校教育大数据治理的框架设计与实施[J].中国电化教育,2019(8):63-71.
[6]李珊珊,王平月,杨阳,刘振昌,张虹.基于共享数据中心的高校业务流程再造研究[J].中国教育信息化,2018(23):47-50.
[7]李景奇,卞艺杰,张国宝.基于业务流程的高校数据共享平台设计[J].中国教育信息化,2016(11):93-96.
[8]范小春.智慧校园环境下高校大数据治理及应用策略[J].金陵科技学院学报,2018,34(4):48-51.
[9]张宇翔.面向质量评估的高校教学数据中心数据模块的设计与实践[J].软件,2016,37(4):51-53.
[10]秦磊.“互联网+”背景下高校行政管理信息化建设研究[J].中国管理信息化,2017,20(16):243-244.
[11]孙秋瑞,陈平,黄洛颖,刘臻.高校校务管理数据共享服务平台建设路径研究[J].中国电化教育,2016(3):69-74.
(编辑:王晓明)