DOI:10.19850/j.cnki.2096-4706.2021.08.055
摘 要:在智慧校园背景下,数据中心的研究建设和高校智慧校园建设有多方面契合点。文章基于对数据中心建设的新认识,以浙江师范大学数据中心建设为例,设计了浙江师范大学数据中心平台架构,该架构包含业务层、数据层、应用及服务层三个层次。同时,介绍了数据中心采用的数据集成方案及数据的备份机制。最后,为解决数据中心数据质量不高、数据冗余等问题,结合浙江师范大学数据治理四步走策略,给出了高校数据治理的合理化建议。
关键词:智慧校园;数据中心;数字化;数据治理
中图分类号:G434 文献标识码:A 文章编号:2096-4706(2021)08-0195-04
Research and Practice of University Data Center under the Background of
Smart Campus
——Take Zhejiang Normal University as an Example
LI Chao
(The Office of Network Security and Information Construction,Zhejiang Normal University,Jinhua 321004,China)
Abstract:In the context of smart campus,the research and construction of data center and construction of smart campus in universities have many similarities. Based on the new understanding of the construction of data center,taking the construction of data center in Zhejiang Normal University as an example,this paper designs the platform architecture of data center in Zhejiang Normal University,which includes three layers:business layer,data layer and application and service layer. At the same time,it introduces the data integration scheme and data backup mechanism used in the data center. Finally,in order to solve the quality of the data from the data center not high,data redundancy and other problems,combined with Zhejiang Normal University data governance four steps strategy,it gives reasonable suggestions for university data governance.
Keywords:smart campus;data center;digitization;data governance
0 引 言
目前校园数字化建设蓬勃发展,学校在教学、人事、科研等部门有了一些服务于教学科研人事相关工作的业务系统,但由于这些系统开发上线时间较早,同时各业务部门随着业务的增长,导致系统无法完全满足需求,而且,这些业务系统产生的数据也仅在本部门内部系统间进行内循环。各个业务系统间数据标准和数据共享工作无法开展,数据标准、数据格式缺乏统一标准,导致数据共享无法打通,数据更新与维护不同步现象严重,数据质量不高。因而,现在智慧校园建设的关键是建立统一的校级数据中心,通过指定统一的校内数据标准,保证数据唯一性和准确性,让各个部门的业务系统数据可以实现数据共享,真正让数据流转起来,服务于智慧校园的数字化建设。
浙江师范大学于2018年开始数据中心的研究与建设,经过两年多地建设,数据中心目前已对接组织部、人事处、本科教学部、学工部、科研院、计财处、图文信息中心、后勤集团等十五个部门的四十多个应用系统数据。建成后数据中心对校园信息化建设发挥了不可替代的重要作用,对消除信息孤岛实现各应用系统的数据共享提供了有力的技术支持。本文主要对浙江师范大学数据中心建设采用的平台体系架构、数据集成方法、数据备份机制做一个简要介绍,同时对浙江師范大学的数据治理思路做了阐述。
1 高校数据中心建设综述
在近些年的教育信息化工作相关文件中,《教育信息化十年发展规划(2011—2020年)》[1]及《教育信息化2.0行动计划》[2]无疑是最重要的两个,各高校在“教育信息化是实现教育现代化必然之路”的指引下,已经开展了多轮信息化建设,部分高校已经逐步过渡到了智慧校园建设。过去这些年,学校大力建设信息系统,但是并没有达到想要的效果,信息系统建设依旧停留在比较低级的阶段[3]。《教育信息化十年发展规划(2011—2020年)》论述了关于建设智慧校园的内容,包括数据标准体系、业务系统间的数据整合与数据共享、数据集成、数据应用、信息安全的保障体系等。《教育信息化2.0行动计划》多次提及提高教育管理信息化水平[4]。对数据集成、数据规范及信息标准的制定、数据共享等方面内容做了非常详尽的要求。因此,我们必须清楚地认识到,数据才是智慧校园数字化建设的本质。数据中心的发展建设,数据质量情况的好坏,直接影响到学校数字化建设以及后续的发展。
2 浙江師范大学数据中心建设
2.1 数据中心总体架构
在高校智慧校园建设的大背景下[5],数据中心作为信息大脑中枢,通过集成、交换、共享、应用等多方面集合学校业务系统的全量数据并且共享数据,通过建立数据中心,可以最大限度发挥各个业务系统数据价值[6]。在发挥数据价值的同时也能更好地为学校教学科研以及师生服务,数据中心对学校各级人员的查询、统计分析、分析决策发挥了重要支撑作用。浙江师范大学数据中心平台架构如图1所示。该平台主要由业务层、数据层、应用及服务层三个层次组成。该平台架构同时包含统一数据治理体系以及统一数据运维与安全管控体系。源业务层包含浙江师范大学各个部门业务数据库中的结构化数据。数据层包含浙江师范大学数据中心以及主数据管理平台。应用及服务层包含基于数据中心构建的各类业务系统及数据查询分析决策服务。整个平台架构充分支撑了浙江师范大学智慧校园建设的各类应用及数据服务的建设。
2.2 数据集成
数据集成工具主要作用是将各个部门源业务系统中的数据抽取出来,然后通过集成操作,把数据归集到校级数据中心,校级数据中心存放整个学校各业务部门系统的数据。通过构建数据中心,有效解决了数据集合和共享问题,同时也解决了业务系统间数据交互产生的各类问题,为数据中心查询统计分析各类应用提供了高质量可靠数据。数据集成是在保留原各部门业务系统数据库的基础上进行的,不会影响各部门业务系统使用的可靠性、完整性、可持续性。浙江师范大学数据中心采用Oracle Data Integrator 11g工具进行数据集成工作。数据集成工作流程如图2所示。浙江师范大学数据中心数据集成支持每日增量自动抽取以及手工全量数据抽取两种方式。数据集成的过程是首先根据抽取规则建立抽取线程,判断跟源数据库是否连接成功,若成功,抽取线程启动,否则,抽取线程销毁。然后开始抽取数据,待抽取完毕后,进行数据清洗、转换,最后,再将数据装载到数据中心。
2.2.1 抽取时间
数据中心抽取数据任务定时在每天凌晨一点启动,这时学校各业务系统处于空闲且网络带宽也处于低流量状态。因此,按照数字校园数据中心建设规划,将凌晨一点到凌晨五点作为数据中心每日增量数据抽取的时间窗口,进行数据的抽取与同步。
2.2.2 抽取方式
为了不影响业务系统性能,浙江师范大学数据中心采用业务系统开出视图、数据中心增量抽取视图数据的方式进行抽取。该方式的工作原理是:在源业务系统上(比如人力资源部人事管理系统、本科教学部学生管理系统)建立源业务系统表对应的视图,视图会跟源数据表的每日数据变化记录保持一致。在数据中心建立相应的数据表,ODI根据源业务系统增量数据,及时清除无用的数据日志信息。通过视图方式抽取源业务系统增量数据方式对业务部门源业务系统的使用影响最小。
2.3 主数据管理平台
为构建数据中心数据健康度模型,体现学校数据总体建设及运行状况,通过每一天健康度趋势反映学校数据治理的变化情况,部署了浙江师范大学主数据管理平台。主数据管理平台如图3所示。该平台围绕数据健康度指标呈现,反映数据当前健康度及历史趋势。主数据管理平台反映了业务系统源数据集成状态、数据代码标准完备情况、目前已有数据的现状、历史源业务数据的存储情况;同时,主数据管理平台也显示了元数据检测问题、数据代码标准一致性问题、主数据集成运行问题、数据质量问题、主数据仓库备份问题。
浙江师范大学主数据管理平台信息标准管理包含数据标准管理、代码标准管理和查询、使用范围检索、映射关系、使用情况检查等多种功能,可以助力学校实现对标准和映射的“制定、维护、分享、集成”等功能,而且也可以监督代码标准使用状况,优化代码标准使其趋于统一。数据信息标准管理是为各个部门业务系统建设提出数据信息标准要求,代码标准主要是为了数据代码标准、使用、定义的一致性,减少因为标准不统一而造成数据集成困难。浙江师范大学结合学校自身的校内标准以及学校个性化需求,形成了《浙江师范大学数据代码标准》。围绕各个部门业务系统建设,围绕业务数据的集成与共享,数据代码标准在使用中不断完善。
2.4 数据备份
浙江师范大学数据中心采用Oracle DataGuard备份机制。DataGuard的备份机制是一种数据库层级的热备份机制,这种机制的高可用性不仅包含了容灾、数据冗余、计划维护时间,还包括了业务系统故障、系统应用故障、网络带宽故障的监测。DataGuard机制的高可用性不但能够让系统避免自身问题,还可以提供高可靠性系统升级计划及系统维护。DataGuard备份机制的主要功能包含:数据容灾保护、数据库故障恢复。这种备份方案提供两种实现类型:物理备份和逻辑备份。浙江师范大学DataGuard备份机制由一个主数据库(主库)及一个备用数据库(备库)组成,两个数据库分别部署在两幢不同教学楼的机房环境中,主库和备库之间通过校园内部网络连接。主备库之间通过日志应用服务和数据传输服务可实现主数据恢复从而让数据实时同步得到保证。
3 浙江师范大学数据治理思路
高校数据中心数据治理工作是把工程技术应用与科学管理方式相融合的一套管理体制,贯穿在智慧校园数字化建设的全过程中。建立科学高效的数据治理体系,对全校各业务系统和数据中心的数据质量实施全过程、全领域和全人员管理,数据治理成为学校数字化建设的一项重要工作。浙江师范大学数据治理按照四步走完成数据治理工作闭环。图4为浙江师范大学数据治理框架图。分别是数据整理与集成、数据信息标准梳理、数据标准监督管理、数据治理运营服务体系四部分。
3.1 完成业务系统源数据整理与集成
业务系统源数据整理最关键的一步是要梳理信息标准,信息标准梳理完成后学校需要确立各部门业务系统间数据流转方向,同时主数据库中数据要根据源数据的数据结构确定自己的数据结构,等数据流转方向和数据结构都确定后,可以为数据的集成工作提供指导标准。对于没有从业务系统产生的各类数据,通过数据采集补录系统进行数据补齐和完善。数据补采操作可以让学校数据中心的数据更完备、更全面。同时,要对有效历史数据进行归档保存,为后期更有效利用数据提供基础。数据中心内部有效数据的大容量存储可以作为未来数据中心校级数据决策的基础。在数据中心建设的同时,要同步考虑大数据数仓的建设,高质量归档的历史数据,可以让未来的数据中心数据分析工作变得更快捷、更容易。
3.2 梳理校内信息标准
信息标准是一个学校数据层面数据中心建设能否成功最基础的因素,大部分高校已经完成了信息标准建设工作,但是标准的制定不完善,且标准没有得到很好地推广[7],这些都是阻碍信息标准在校内全方位铺开的最大原因。数据标准快速迭代需要解决,使之能够适应学校智慧校园数字化建设的多变需求。只有建立起统一有效的信息标准,并在信息系统建设中监督信息标准执行情况,才能高标准完成学校所需业务系统的建设,同时更好地促进校内系统间数据的流转与共享。
3.3 进行数据质量标准监督管理
学校数据中心基于最新信息标准完成数据集成整合后,数据中心基础框架就已构建。框架构建好之后,数据中心的最大问题就是数据质量不高,数据不全。如何对数据质量进行监督管理,同步补齐缺失数据,提升数据质量,是摆在学校面前一个亟需解决的问题。这时候要对数据中心的数据进行优化建设,提高数据质量是一项长期工作。源业务系统要根据数据信息标准对系统进行优化升级,或者根据系统中数据情况对数据信息标准进行调整。
3.4 建立数据治理运营服务体系
数据治理工作需要长期不懈的投入,不可能一步到位,业务系统项目化建设模式又会让学校在验收项目之后大大降低供应商对学校的支持力度。这时候学校需要长期、持续的投入人力、物力和财力,同时配置一支高水平的项目维护团队,才能把运营服务体系真正建立起来。基于数据中心的长期性运营服务体系,需要学校管理和供应商持续服务相结合,对校内数据进行长期运营。学校负责日常的信息标准执行情况检查、数据集成监控监督以及数据质量检查,供应商系统负责系统成功实践,持续性为学校提供数据层面各类咨询服务,和学校共同打造质量健康的数据生态圈。
4 结 论
本文以浙江师范大学为例,介绍了浙江师范大学在建设校级数据中心的探索与实践过程。从数据中心架构、数据集成工具、主數据平台建设、数据备份机制四方面详细阐述了浙江师范大学数据中心。并简要介绍了浙江师范大学在数据治理工作的四步走思路。未来,随着智慧校园建设的不断推进,数据中心建设及数据治理工作在数字化校园建设中的地位将变得更为重要。
参考文献:
[1] 中国教育报.《教育信息化十年发展规划(2011—2020年)》印发——到2020年基本实现学校宽带网络全覆盖 [R/OL].(2012-03-31).http://www.moe.gov.cn/s78/A16/moe_789/201203/t20120331_133414.html.
[2] 中华人民共和国教育部.教育部关于印发《教育信息化2.0行动计划》的通知 [EB/OL].(2018-04-25).http://www.moe.gov.cn/srcsite/A16/s3342/201804/t20180425_334188.html.
[3] 浙江省教育厅.浙江省教育厅办公室关于转发《中小学数字校园建设规范(试行)》的通知 [EB/OL].(2018-05-24).http://jyt.zj.gov.cn/art/2018/5/24/art_1532985_27488094.html.
[4] 刘邦奇,孙曙辉.智慧校园的融合发展与技术实现 [J].现代教育技术,2018,28(1):73-79.
[5] 中华人民共和国住房和城乡建设部.数据中心设计规范:GB 50174-2017 [S].北京:中国计划出版社,2017.
[6] 宗平,朱洪波,黄刚,等.智慧校园设计方法的研究 [J].南京邮电大学学报(自然科学版),2010,30(4):15-19.
[7] 杨秀萍,崔强.基于教学诊改的大数据专业课程实践研究 [J].赤子,2019(29):263-264.
作者简介:李超(1990—),男,汉族,浙江金华人,助理工程师,硕士研究生,研究方向:数据中心、数据治理。
收稿日期:2021-03-12