摘 "要:该文首先提出数据治理的定义,简述数据安全与数据流通,通过分析相关政策和传统数据治理的缺点,讲明高校数据治理的必要性,然后详细分析山东大学数据赋能管理驾驶舱、全域数据库建设和学院信息服务系统的实施,最后提出高校数据体系建设的思考。
关键词:高校;数据治理;数据安全;数据流通;数据体系建设
中图分类号:G647 " " "文献标志码:A " " " " "文章编号:2095-2945(2024)20-0111-04
Abstract: This paper first puts forward the definition of data governance, briefly describes the data security and data circulation, and explains the necessity of data governance in colleges and universities by analyzing the shortcomings of relevant policies and traditional data governance. Then it analyzes in detail the implementation of Shandong University's data enabling management cockpit, global database construction and college information service system. Finally, the paper puts forward some thoughts on the construction of data system in colleges and universities.
Keywords: colleges and universities; data governance; data security; data circulation; data system construction
随着校园建设的智能化与智慧化深层次推进,高校对各类智能应用场景的多样化、碎片化、即时化、移动化以及融合化的需求越来越多。如何快速突破数据鸿沟,消除数据孤岛,实现数据共享,充分发挥数据的首要要素价值,已经成为各高校数据治理的基础条件和关键因素。这也将会成为当下以及未来很长一段时期,各高校信息化工作者进行研究、分析、探索的重中之重。
1 "数据治理的定义
国际数据管理协会认为数据治理是对数据资产管理行使权力和控制的活动集合。百度百科认为数据治理是组织中涉及数据使用的一整套管理行为。由企业数据治理部门发起并推行,关于如何制定和实施,针对整个企业内部数据的商业应用和技术管理的一系列政策和流程。国际数据治理研究所定义数据治理是一个通过一系列信息相关的过程,来实现决策权和职责分工的系统。这些过程按照达成共识的模型来执行,该模型描述了谁能根据什么信息,在什么时间和情况下,用什么方法,采取什么行动[1]。笔者认为数据治理需要在机构与人员、流程与制度、执行与管控为范围,通过适合学校情况的数据管理体系的搭建与持续优化为途径,持续提升高校数据资产的质量并挖掘其价值。
数据治理一般分为3个阶段。第一阶段,数据可得,即找到从数据中挖掘价值的明确途径。第二阶段,数据可靠,即基于数据确权和数据定价进行流通交易。第三阶段,数据可用,即发挥数据的要素价值,产生更大的生产力。
2 "数据安全与风险评估
数据评估应以点及面,摸清学校典型数据业务的安全现状,通过文档审阅、人员访谈、现场调研、工具扫描、渗透测试、综合分析和评估报告等评估方法,为制定整体数据安全规划、确立数据安全策略、补齐数据安全能力提供依据。其参考标准主要有:GB/T 41479—2022《信息安全技术 网络数据处理安全要求》、GB/T 20984—2022《信息安全技术 信息安全风险评估方法》、GB/T 22239—2019《信息安全技术 网络安全等级保护基本要求》和《信息安全技术 数据安全风险评估实施方法》(征求意见稿)。
3 "数据流通的基本原则
数据流通需要坚持一数一源一责任单位的基本原则。一类数据原则上只应有一个数据源,通过梳理资源目录明确数据源责任单位,最大化减少数据重复采集,鼓励数据共享,提升数据应用的效能,提供数据接口和开放数据目录,依规申请使用。
数据的使用需要坚持最小必要基本原则。数据收集遵循最小够用原则,数据查看遵循最小授权原则,数据存储遵循最短周期原则,数据共享遵循用而不存原则。
4 "数据安全
为保障数据共享及应用过程的安全性,应制定相关专业性要求。在采集时,应严格按照数据分级分类的标准,对不同级别的数据进行相应安全保障。涉及师生隐私数据的建立,通过独立的项目空间,授权特定的人员采集和管理;涉及少量表级的隐私数据,通过按角色授权相应的采集/访问/管理权限;涉及字段级的隐私数据建立脱敏规则,对相应的字段进行脱敏。
为保证数据存储阶段的数据安全性,规定数据采用三副本机制,单点故障不影响稳定性,保障数据不丢失;密码均采用国密算法存储至数据库。在数据管理阶段通过数据权限管理、数据脱敏设计,保障校情数据的安全性。数据中台对外提供服务时,出于数据安全的考量,基本都采用API接口方式实现[2]。
5 "传统的数据治理缺点
传统的数据治理需要专人,甚至多人进行持续治理,这就使得造成的人员成本、运维成本、治理成本和储存成本逐年攀升。数据治理后无法实现数据回流,或因为数据存在多个副本,导致数据多源。
高校业务系统繁多且相互独立,基础数据分布杂乱、数据逻辑散乱割裂。数据治理表面上是技术,实际涉及的是管理、制度、理念等的更新,需要企业统筹规划和协调。业务数据多处源头,数据职责边界模糊、使用标准混乱,导致最终数据结论不具备整体业务参考价值。数据种类庞杂,管理接口错综无序,共享数据基数小,无法支持广泛的业务需求;无法支持用户自助完成数据分析和使用。
数据治理通常需要管理信息系统。MIS是一个以人为主导,利用计算机硬件、软件、网络通信设备以及其他办公设备,进行信息的收集、传输、加工、储存、更新、拓展和维护的系统。基于MIS系统的校园信息化必然出现“数据孤岛”现象。
数据越多价值越大,越分享价值越大,越不同价值越大,越跨界价值越大。大力实施数据开放共享,优化治理基础数据库,不断完善数据权属界定、开放共享、交易流通等标准和措施,促使数据资产重复使用、共同使用、永久使用,加快推动跨界数据共享交换,十分必要。
目前很多高校面临数据不够全、不够完整的现象,需要改造现有业务系统数据流程,扩大数据的来源。数据分级分类的所有权、使用权和管理权需要确定标准与体系确权。提高数据的质量,全校统一一张表。利用AI算法、智能推荐、知识图谱等工具,统一流程和标准,禁止私拉乱接,增强数据挖掘与智能决策支持[3]。
6 "相关政策分析
2023年,中共中央、国务院印发《数字中国建设整体布局规划》明确,数字中国建设按照“2522”的整体框架进行布局。“2522”整体框架强化了两大能力,即数字技术创新体系和数字安全屏障筑牢可信可控的数字安全屏障。切实维护网络安全,完善网络安全法律法规和政策体系。增强数据安全保障能力,建立数据分类分级保护基础制度,健全网络数据监测预警和应急处置工作体系。
2023年怀进鹏部长在世界数字教育大会上指出“数字化转型是世界范围内教育转型的重要载体和方向”。教育部将着重在以下四方面作出努力:建强国家中心,汇聚共享优质资源。强化数据赋能,提升教书育人效力。提升数字素养,助力服务全民终身学习。加强国际合作,推动人类文明发展繁荣。
2021年3月,教育部发布了《关于加强新时代教育管理信息化工作的通知》。2021年7月,教育部等六部门发布了《关于推进教育新型基础设施建设构建高质量教育支撑体系的指导意见》。教育部高等教育司2023年工作要点是深入实施数字化战略行动,塑造高等教育改革发展新优势。2022年全国教育工作会议明确提出,我国要“实施教育数字化战略行动”,会议对加强教育数据资源互联互通和协同共享等工作提出了明确要求。教育部教育管理信息中心2023年工作要点是加快教育数据底座建设,推进教育数据治理和共享应用。
2023年我国发布的《教育部等七部门关于加强教育系统数据安全工作的通知》中指出,要建立教育系统数据安全责任体系和数据分类分级制度,形成教育系统数据资源目录。健全覆盖数据收集、传输存储、使用处理和开放共享等全生命周期的数据安全保障制度,开展常态化的数据安全监测预警通报。
2023年教育部按照“一数一源”原则,推动职业院校建设大数据中心,加大职业教育领域管理平台和专项业务平台的整合力度。到2025年,新时代教育管理信息化制度体系基本形成,信息系统实现优化整合,一体化水平大幅提升;数据实现“一数一源”,数据孤岛得以打通,数据效能充分发挥;在线服务灵活便捷,“一网通办”深入普及,服务体验明显提升;现代化的教育管理与监测体系基本形成,多元参与的应用生态基本建立;教育决策科学化、管理精准化、服务个性化水平全面提升,支撑构建高质量教育体系。
山东大学在2017年落实“两不出”要求,构建“一网通办”信息化公共服务平台;在2019年深化“放管服”改革,构建学院信息系统;2022年强化信息服务,聚焦服务学校中心工作,将信息服务推进2.0时代。
7 "高校数据治理的必要性
数据要素是学校数字化转型的核心因素。数据治理是促进学校治理体系和治理能力现代化的重要举措。当前,山东大学正处于加快转型升级、实现“由大到强”、全面争创世界一流大学的新阶段。
数据治理作为学校治理的重要内容具有历史必然性。数据由过去记录信息的载体逐渐演变为驱动社会变革的力量。数据治理能力的好坏,直接反映出山东大学适应新时代、新特征,应对国内外复杂环境的能力和韧劲。
数据治理赋能学校治理体系和治理能力现代化起到了重要推动作用。数据治理是以数据生产要素为对象,以释放数据价值为目标,以守住数据安全为底线,以建立健全数据全生命周期秩序规则为核心,以推动数据有序管理和流转为主要活动,以强化数据管理技术手段为支撑的一系列活动,具有综合性、复杂性、长期性等特征。学校数据治理的过程,也是山东大学围绕数据这一新型生产要素进行制度建设和执行落实的系列活动。
8 "山东大学数据赋能管理驾驶舱与全域数据库建设
数据是山东大学重要的核心资产,在推动教育决策由经验驱动向数据驱动转变,支撑山东大学治理体系和治理能力现代化进程中发挥至关重要的作用。
山东大学推进国家、部委与学校数据标准的融合,完善数据标准版本管理;规范数据归集,完善数据资源目录建设,规范数据“一数一源”;出台管理办法,压实各单位数据管理责任。聚焦大数据能力,进行全域数据库湖仓一体建设。统一建设数据开放平台,加强数据共享服务。完善学校交换体系,完成高效数据交换。为学校报表平台,管理驾驶舱提供数据支撑。围绕“人才培养、科学研究、服务社会、支撑保障”等要素,汇聚教育数据、视频、图像等多维数据,感知整体运行状态。坚持“平战结合”,实现贯穿山东大学“1+8+8”的安全体系闭环,作为应急管理中心,服务学校领导高效指挥调度。运用数字技术,支撑非现场数字化监管,助力增强跨部门、跨层级、跨地域联动监管能力。加强数据开发与创新应用,促进部门业务流程再造、服务模式创新、管理手段变革。
统一数据服务,完善数据标准,梳理全校数据资产,完成18个数据域,数据类589个,393个数据字典,8 100数据项的数据标准建设。汇交全校数据260亿条,集成22个部门24个系统。持续推动校内系统互联互通,日活接口1 222个,为学校人事、财务、科研46个部门107个系统提供数据服务。
9 "山东大学学院信息服务2.0系统
当前,世界百年未有之大变局加速演进,作为山东大学实施“七大战略”和“两个先行先试”的出发点和立足点,各学院面临着更加复杂的环境和更加艰巨的任务,通过数字化助学、助教、助管和助研,推进学院治理水平与治理能力现代化已是当务之急。
利用信息化的技术创新手段,山东大学建成完整统一、技术先进、覆盖全面和应用深入,高效稳定、安全可靠,具有特色的学院信息化服务平台,实现学院人才培养、管理服务、教学科研等工作的数字化和智能化,提升学院数据质量、管理水平、服务能力。通过平台的落地,将推动数据赋能学院数字化转型,促进服务提升学院治理水平与治理能力现代化。
信息化工作办公室以数据服务为切入点,深入支撑学院管理与服务,支撑高基、本教、学科、国际化评估服务,建设学院管理驾驶舱辅助科学决策,通过数据治理推动管理服务改进,从而实现数据的持续更新。其中,个人数据包括师生个人画像和个人数据档案。学院综合数据分析包括人事人才分析、学科分析、教学分析、科研分析和学生学情等综合分析。专项数据包括人事人才引育、学生资助成效、学生预警、就业招生专项分析和学生活动等专项分析。校级数据采集包括“双一流”数据、学科评估数据、本科教学质量数据和国际化评估数据采集。
目前,山东大学立足学院行政与公共资源管理、师生服务、精准思政、科研协作、学院数据等工作,聚焦学院信息化发展基础设施支撑水平不足,数据融合程度不高,管理服务模式创新不够等问题,已完成学院管理服务数字化转型。重点构建学院信息化服务2.0平台,形成“1+n”的学院信息化协作生态;优化学生“一张表”与学院管理驾驶舱建设;深化腾讯会议、电子签章、智能问答、云盘的学院应用场景。积极构建“数据为基、全域赋能、横纵互联、特色鲜明”的数字学院新格局。
10 "高校数据体系建设思考
高校应编制数据战略规划,清晰了解学校数据建设现状、明确数据规划与管理的目标愿景,清晰了解学校各职能部门、院系、师生用户对数据的需求,形成共识。学校各业务部门、信息技术部门应共同协作,评估学校当前信息化发展状态,制定切实可行的数据战略规划。
为维持学校数据建设、管理和应用的规范高效运行,学校应建立并不断完善学校数据治理体系,包括建立相应的组织体系和制度体系,并视自身情况配套数据治理相关系统,加强对数据流程、数据源、数据质量的管理,通过数据治理推动学校全要素、全业务、全领域和全流程的数字化转型。
高校应全面分析学校业务发展方向,理解把握学校的数据需求,明确业务数据、流程、组织和系统之间的关系,建立合理的数据架构,来保证数据能够高效地存储、集成、共享和使用。数据架构应具备数据资源目录、数据模型、数据分布和数据标准等部分。高校在数据规划建设、管理、应用和服务过程中,应实现数据的生存周期管理。数据生存周期管理包括从数据需求、数据设计与开发、数据使用及数据运维,到数据归档与迁移直至数据销毁的全过程,数据安全和数据质量管理贯穿其中。
数据质量是开展数据应用和服务的基础,是体现数据价值的前提。数据质量可以从完整性、及时性、准确性、一致性、唯一性和有效性6个维度进行描述。学校应围绕这6个维度,根据数据战略规范目标,从数据的使用者角度出发,明确各类数据质量的管理需求,制定学校数据质量管理目标、定期开展数据质量检查和质量分析,并不断提升数据质量。随着数据技术的不断成熟和数据共享开放的日益增速,保障数据安全也面临着严重挑战。学校需明确数据责任体系,确立学校数据分类分级管理,建立数据安全风险评估、监测预警、应急处置和数据安全审查等基本制度。
学校应通过广泛开展基于数据的应用和服务实现数据的价值,促进形成数据建设和应用的良性循环。基于数据的应用与传统的业务管理系统不同,应充分利用学校整体数据集成和共享的成果,为用户提供更丰富、体验更好的服务,充分发挥教育大数据的描述、监督、预警、分析、决策和评价等作用,数据的应用方式包括对象分析、主题分析、对比分析、预测监控和智能推荐等。
参考文献:
[1] SHREEVES S,CRAGIN M. Introduction: institutional repositories: current state and future[J].Library trends,2008,57(2):89-97.
[2] LOSHIN D. The Practitioner's Guide to Data Quality Improvement[M].Burlington:Elsevier,2011.
[3] 毕天睿,王昕.数据驱动决策支持系统在高校教育质量管理中的应用[J].中国教育信息化,2016(3):60-62.