刘宝妹 陈美玲 白兴瑞
摘 要:随着信息技术的快速发展,高校信息化建设已迈入智慧校园阶段。建设共享数据中心,解决“烟囱式”系统建设、“信息孤岛”等问题,实现应用资源、信息资源的集成和共享,是智慧校园建设的核心基础之一。在对目前高校数据中心建设现状分析的基础上,文章设计了高校共享数据中心的总体架构,应用虚拟化技术整合基础设施资源,研究了学校统一信息标准建设,详细分析了数据交换与清洗平台及数据中心建设,提出了业务系统接入共享数据中心的方案。
关键词:智慧校园;共享数据中心;虚拟化技术;数据交换与清洗;统一信息标准
中图分类号:TP393.18 文献标志码:A 文章编号:1673-8454(2020)07-0070-04
一、引言
信息技术的快速发展为高校信息化建设的蓬勃发展提供了良好的机遇。特别是随着物联网、云计算、大数据等新技术的广泛应用,高校信息化建设经由基础设施阶段、数字校园阶段而逐步进入智慧校园建设阶段。智慧校园基于大数据、物联网、移动互联、云计算、知识管理、社交网络等新兴信息技术,集成学校的应用、信息、资源,将学校物理空间和数字空间有机衔接起来,构建智慧校园综合信息服务平台,实现以人为本的个性化创新服务,为全校师生提供工作、学习和校园生活一体化的智能化感知环境,为教学、科研、管理和生活提供智能化、个性化、便捷化的信息服务。[1][2]而如何将学校分散的各个信息资源、应用资源连接起来进行集成,实现资源的高效共享和优化,成为现代智慧校园建设的关键。[3]基于学校信息资源及应用资源,建设共享数据中心,实现资源的集成和共享,从而建设统一的数字化智慧校园平台,是高校信息化建设的核心任务之一,也是高校信息化建设发展的必然阶段。
二、共享数据中心建设背景
目前,各高校都已建立了各种业务系统,比如教务管理系统、学工系统、图书管理系统等,这些业务系统的建设能基本满足本部门业务需求。但是,由于前期缺乏对学校业务系统的顶层规划和整体设计的全局观,导致了众多“烟囱式”业务系统的出现。这些各自为政的业务系统,是根据各个业务部门的需求而建设的,系统相对独立分散,并且随着时间的发展,积累了海量数据,并形成了“信息孤岛”,严重影响了高校智慧校园的建设。总体来说有以下问题:
(1)早期业务系统建设基于垂直的体系结构,有独自的服务器、存储、数据库等,如此造成了计算、存储等资源的浪费,IT资源利用率也低,并且管理运维成本高,难以满足高校信息化对应用的快速扩展、灵活部署及方便维护的需求。
(2)各业务系统独立建设,处于隔离状态,数据存储在不同业务系统中,系统间缺乏集成和共享,形成“信息孤岛”,这也造成了大量的冗余数据、不一致数据,难以进行综合信息查询和决策分析。
(3)没有统一的信息标准,各部门使用的信息编码不一致。
以上这些问题极大地制约了智慧校园的建设。基于以上情况,笔者提出了共享数据中心的建设方案。通过分析共享数据中心的建设目标,提出共享数据中心的总体架构,并运用虚拟化技术实现基础设施资源的集成整合、统一管理;同时建立统一信息标准与规范,基于数据交换与清洗平台,实现异构系统数据源的抽取与交换,从而建设共享中心库,保证数据的一致性和准确性,并提出了各业务系统接入共享数据中心的方案。
三、共享数据中心建设目标
共享数据中心的建设是一项长期的系统工程,需要从基础设施、各类信息资源的集成、数据的交换与共享及相应的支撑保障体系方面考虑。[4-6]共享数据中心建设的总体目标如下:
(1)建设一套计算、存储、网络等IT资源集中融合、统一管理的数据中心,实现对资源的快速扩展、重组部署和业务编排自动化,从而为智慧校园提供高效的IaaS服务,满足智慧校园对节能高效、绿色环保数据中心的需求;
(2)建设统一的学校信息标准,实现数字化智慧校园统一信息编码;
(3)建设统一的数据共享平台,通过整合学校各业务系统数据,将各部门的基本数据集中统一管理,实现对分散在各业务系统数据库中数据的采集与整合、交换与共享,同时要保证数据的准确性、一致性、完整性、安全性和实时性。
四、共享数据中心设计与建设
1.架构设计
为满足共享数据中心平台按需扩展、资源可管理及共享需求,学校设计了共享数据中心平台架构。平台建设在现有学校业务系统基础之上,遵循学校信息标准及规范,从各业务系统中采集数据,通过数据交换与清洗,建设共享数据中心,通过对集成共享的数据进行分析与利用,为学校提供各种数据应用服务。平台总体架构如图1所示。
采用云计算理念设计平台的技术架构如图2所示。共享数据中心平台建设利用虚拟化技术,将网络、计算、存储等基础设施进行池化,建设IaaS硬件平台,并基于建设的学校统一信息标准,通过数据交换与清洗平台,整合各应用系统数据,构建统一数据平台。共享数据中心架构从底至上包括基础设施层、数据交换层、数据中心层和提供的信息服务四个层面,并贯穿四个层次的标准规范体系及安全管理、运维保障体系。
2.基础设施虚拟化方案
基础设施层为共享数据中心提供网络、存储、计算等资源,是智慧校园建设的基础工程。基础设施层包括物理资源和相应的虚拟资源池。物理资源包括网络设备、存储系统、服务器、计算机设备、安全等内容。机房是运行这些设备需要的基本环境,包括空调系统、消防系统、动环监控、UPS电源等设施。為实现IT资源的动态扩展及统一管理,提高资源利用率及业务的可用性,降低成本,满足共享数据中心对高性能数据读写和存储需求,采用VMware vSphere虚拟化解决方案对计算、存储、网络等物理资源进行池化,实现资源的按需分配,改变传统的“烟囱架构”模式,从而为智慧校园建设提供更好的基础设施服务。
3.数据交换与清洗平台
数据交换与清洗平台是共享数据中心的关键,是实现数字智慧校园数据共享、数据分析挖掘的重要基础。数据交换与清洗平台通过从学校各异构业务系统中采集所需的数据,根据学校信息标准进行标准化,实时同步到数据中心,实现了部门内的应用和跨部门应用业务数据间的整合与数据共享,解决了学校各种应用系统间大量基础数据冗余容易引起数据不一致的危机,打通了系统间业务数据通道。
(1)数据交换与清洗技术
数据交换与清洗技术是实现数据交换整合的关键技术。数据交换与清洗技术又称ETL(Extract-Transform-Load),是指数据抽取、转换和装载,它实现了对分散在各业务系统中的现有数据的提取、转换、清洗和加载。采用ETL工具,通过从多个异构数据源中抽取数据,使用一系列的清洗过程将数据中存在的冗余、错误、缺失等数据检测出来并加以改正,同时使用预定义的ETL规则对数据进行相应的约束转换,最后将处理后的数据存储到共享中心库中。[7]其中,数据清洗与转换解决了数据质量问题,保证了数据的正确性、一致性、完整性和可用性。[8]
应用Kettle ETL开源工具能实现学校应用系统之间数据的转移、清洗与整合。Kettle是纯java编写,具有数据抽取高效稳定的特点,可通过图形化拖拉拽方式对ETL作业进行编辑。ETL作业是指可执行的一次ETL转换,具有明确的执行配置和状态(启动/暂停/……)约定的任务。图3是一项ETL作业,将学工系统中学生评优数据推送到共享中心库,通过Kettle设计的作业,能够清晰地看到数据转换流向。
(2)数据交换与清洗平台管理
数据ETL平台运维管理包括ETL作业管理(指作业的查看、啟动、运行、暂停、审核、删除等)、作业的监控状态(指运行作业的实时在线监控、负载、执行情况等)、业务管理(指作业的展示、数据流的流向、作业的设计修改等)、数据源管理(包括数据库数据源的分布图展示、添加、修改、删除、可用性检测及相应的监控等)、平台用户管理、权限管理、日志管理、安全控制及容灾备份恢复。
4.数据中心平台
数据中心平台通过数据交换与清洗平台层,遵循学校信息标准,对数据进行清洗、整合和双向交换,实现了各业务系统数据的集成、存储和共享,从而为学校教科研、管理和师生提供完整、实时的数据服务。数据中心平台包括学校统一信息标准建设、共享中心库和数据管理平台。
(1)统一信息标准建设
信息标准是信息在采集、传输、交换和处理过程中使用统一的规范、数据格式及存储模式等,是学校信息化建设的数据字典,通过统一的数据字典对公共数据达成统一认识,是实现业务系统数据交换、信息资源共享及业务协同的基础。[9]统一信息标准的建设解决了不同应用系统间数据共享时数据不一致问题。信息标准的建立要符合国际、国家、教育部、行业标准和学校内部自己的标准,遵守“循序渐进,逐步完善”原则,建设具有高校自身特色的信息标准。[4]结合学校实际情况,信息标准建设需要涵盖学校所有业务,按照以下两个维度进行:①按照学生、教职工、资产、财务等主题对象进行建设;②按照学校的管理、教学、科研、信息服务等业务进行建设。
(2)共享中心库
共享中心库集中存储着全校规范的、权威的数据,是所有应用系统共享数据的集成地,为综合查询和决策支持等信息服务提供良好的数据基础。共享中心库的设计遵循学校统一的信息标准,结合元数据管理工具,建立主题数据库(如教职工库、学生库、科研库、财务库等),实现标准、开放的共享中心库。共享中心库中的数据来源于各个业务系统,采用中间库方式对异构数据源进行集成,将业务系统权威数据定时集成到共享中心库,再从共享中心库把权威数据分发给各个应用系统数据库,从而保证数据的一致性和有效性。业务系统遵循“谁产生,谁维护”原则,来保障业务系统之间数据共享的准确性、安全性和可管理性。
(3)数据中心管理
数据管理平台主要包括数据的访问控制(如数据查询、统计、分析)、数据接口管理、元数据管理、信息标准管理、数据服务管理、主题库管理及其他系统管理。数据管理平台规范化共享数据接口,为各应用系统提供统一规范的数据推送及数据查询接口,并遵循“一数一源”原则进行数据服务、管理数据服务授权。
5.共享数据中心应用服务
基于共享数据中心,为学校提供信息的查询、分析、下载及推送等各种数据服务,同时,也为学校的决策分析、教学、科研、管理及师生提供全面、准确的数据支持。在共享数据中心构建过程中,通过对校内信息资源和应用系统的整合,建立统一身份认证系统和统一信息门户系统。统一身份认证系统实现全校师生用户的统一管理、统一授权和统一身份认证功能,实现所有接入应用系统的单点登录功能,从而解决了离散应用系统的身份信息不一致、多次登录的问题,并提供身份账户数据管理与安全监控。统一信息门户提供了统一的访问入口、统一的资源导航、个性化门户定制、资源访问权限控制,面向不同对象提供个性化页面,按角色为全校师生提供个人情况、一卡通、科研、教务等信息服务。
6.业务系统接入共享数据中心方法
共享数据中心是基于元数据管理技术实现数据集成、存储及分发的数据共享平台。利用数据清洗与整合平台,遵循学校信息标准,从各异构数据源中抽取需要共享和分析的数据到数据中心,数据中心将相关数据推送给业务系统,实现各业务系统与数据中心的数据集成与共享,实现系统间数据的交流。采用中间库的方法实现业务系统的数据集成,能确保数据交换的效率与应用系统数据的完整安全,降低了应用系统数据结构改动带来的修改成本。[10]业务系统集成要求与方法如下:
(1)实现数据抽取。业务系统创建中间数据库,数据以视图的方式提供给数据中心,利用数据交换与清洗平台将需要共享和分析的数据自动定期同步更新到数据中心,实现数据的抽取。
(2)实现数据推送。数据中心以中间表的方式推送权威数据到业务系统中间数据库视图。如数据中心通过数据交换与清洗平台自动将教职工基本信息、学生基本信息同步到中间表中,再由业务系统从中间表中抽取数据,达到数据推送实时同步的目的。
五、结束语
智慧校园建设是一项长期复杂的工程,共享数据中心是这个工程的核心基础之一。本文研究了智慧校园共享数据中心的建设,分别从基础实施、数据交换与整合平台构建,数据中心平台、业务系统接入共享数据中心方案等方面进行了探讨,实现了基础设施资源的统一管理、多个业务系统之间数据交换及数据共享,改变了传统“烟囱式”系统建设方式,消灭了信息孤岛,为高校数据分析与挖掘、决策支持等服务提供了强有力的數据支撑,为智慧校园综合信息服务平台提供数据支持。智慧校园共享数据中心的建设是一个长期连续性的过程,还有许多问题亟待解决,如共享数据中心的优化及安全建设、数据质量的治理、海量数据存储处理问题、数据的分析利用等。
参考文献:
[1]王燕.智慧校园建设总体架构模型及典型应用分析[J].中国电化教育,2014(9):88-92,99.
[2]蒋东兴,付小龙,袁芳等.大数据背景下的高校智慧校园建设探讨[J].华东师范大学学报(自然科学版),2015(S1):119-125.
[3]狄宏林,周为,周勇等.共享数据中心在智慧校园中的建设与研究[J].无线互联科技,2016(8):37-38.
[4]曹立明,丁勇.对我校数据中心建设的思考[J].时代教育,2017(16):14-16.
[5]吴群英.横店影视职业学院共享数据中心平台设计与实现[D].成都:电子科技大学,2011.
[6]孔存金.数字化校园共享数据中心建设研究——以新疆师范大学为例[D].乌鲁木齐:新疆师范大学,2009.
[7]徐俊刚,裴莹.数据ETL研究综述[J].计算机科学,2011(4):15-20.
[8]郭志懋,周傲英.数据质量和数据清洗研究综述[J].软件学报,2002(11):2076-2083.
[9]王海亮,刘亚翃.高校数字化校园信息标准建设的研究[J].中北大学学报(社会科学版),2015(3):116-120.
[10]郑苑.浅析数字化校园共享数据中心建设[J].电脑知识与技术,2013(9):2273-2274.
(编辑:王天鹏)