摘要:伴随大数据的应用,高校在信息化建设方面对于多源异构的问题亟待解决。高校应用系统多,导致异构数据存放分散,缺点是侧重具体业务、分散建设、集成性差及可用性低。基于以上问题,以及主数据建设关键性和长期有效的特征,提出建设主数据平台,通过建设符合高校信息规范的数据管理体系和主数据平台,提供标准化统一的数据管理,解决数据冗余和各个业务系统数据不一致问题,实现系统的集成及数据在系统之间的共享,以此促进大数据技术在教育行业的应用及研究。
关键词:主数据;数据交换;数据集成;服务接口;编码标准;数据库注册
中图分类号:TN302.7文献标志码:A文章编号:1008-1739(2019)18-70-4
0引言
数据已经是企业的一种资产,主数据建设属于数据治理的内容之一,国内数据治理方面先后印发了《政务信息资源共享管理暂行办法》《政务信息系统整合共享实施方案》。数据是信息的载体,信息和数据互相依存,信息技术是新型高等学校的支撑。主数据管理概念于21世纪初在国外被提出,国外在ERP系统中提出主数据管理,旨在实现企业业务系统互联互通[1],打破信息孤岛[2-3]。文献[4-6]在企业和高校主数据的建设及应用可以通过面向服务的架构(SoA)和企业服务总线(ESB)技术实现,主数据平台建设是实现数据共享、规范化和流程化管理的基础。为了确保系统数据正确、一致和可控,保证数据分析结果和质量,高校数据治理和主数据平台建设方面的工作将大有可为[7]。
1编码
1.1编码原则、标准和集成方案
编码是主数据平台建设的一项基础工作,编码要具有唯一性、可扩展性、简单性、规范性、实用性及合理性,结构、类型以及编写格式必须统一,要尽可能地反映分类对象的特点,便于记忆。另外,编码结构要与分类体系相适应。
数据标准管理是数据治理范畴的一个重要环节,依据标准及相应数据管理技术实现数据治理的过程。为了规范定义业务系统元数据,使高校在信息建模、信息加工采集、资源共享等信息化建设方面具有统一的标准,需研究信息标准编码标准体系的建设。西安某高校在利用主数据平台建设解决多源融合的问题,实现数据编码规范化方面取得了良好成效[8]。
編码标准总体维护方案及编码标准集成共享方案如图1所示,编码规范体系如图2所示。
1.2编码集成
以学工系统为例阐述信息标准编码规范,编码规范分为2部分:第1部分是学工管理自定义编码规范,为业务系统建设过程中应用到的自定义部分的编码;第2部分是引用代码规范,为学工系统建设过程中会引用到的国家标准编码。此部分不需要编码,后期在使用到相关编码时作为标准直接引用。编码标准集成及共享方案如图3所示。
2主数据管理平台设计
2.1数据拓扑设计
有文献提及主数据建设支撑大数据分析,主数据标准化是行业展开大数据应用的基础和前提[9-11]。主数据管理平台建设以学校信息化建设业务和主数据编码的需求为起点,遵循应用驱动原则,在学校解决具体教育教学管理的问题,实现信息化建设的低投入高产出。
主数据管理平台对学校的学生、老师和组织机构等基础数据及主数据的产生和发布进行管理。主数据管理平台具体负责学校办公系统、学工系统、人事系统、教务系统和科研系统等编码的维护和管理,提供数据集成接口,实现各个业务系统的数据集成,为各业务系统提供高质量的主数据服务。提供定制功能实现主数据编码规则及流程的支持。
主数据管理控制台主要是校内管理员使用,不对外开放。主数据平台建设对数据库环境、服务器的软硬件及数据集成服务器有一定要求。数据库类型建设要求为Oracle RDBMS。依据实际需求,设计的系统数据拓扑如图4所示。
2.2服务器资源规划
基础平台是主数据建设的基础[12],主数据管理平台基于SOA实现和其他业务系统的数据共享,依据需求部分资源规划如表1所示。
2.3 WebLogic Server构建
开发过程运用Web Service技术,依据Web Service技术规范实施开发,使应用之间的数据交换得以实现。构建WebLogic Server管理控制台,实现对WebLogic Server域的管理。通过管理控制台的Web应用程序执行的主要操作有8项:①配置、启动和停止WebLogic Server实例;②配置WebLogic Server集群;③配置WebLogic Server服务;④如数据库连接(JDBC)和消息传送(JMS);⑤配置安全参数;⑥包括管理用户、组和角色;⑦编辑选定的运行时应用程序;⑧描述符元素、配置和部署应用程序。
2.4数据源管理
主数据管理平台数据源的管理需要实现业务系统的数据源注册。注册信息有:系统名、Oracle的数据集成类工具(ODI)数据源名称、数据库管理系统类型(SQL Server 2008,Sybase,Oracal,Infornix,DB2等)、数据库驱动、数据库连接字符串、数据库连接用户名、数据库连接用户密码、数据库对象所有者和注册系统描述信息。
2.5数据采集样表及表的设计
主数据平台数据对象管理实现对数据对象基本信息、字段属性、引用关系和实体关系ER图的操作。数据对象基本信息包含的操作:数据对象命名、修改人、修改时间和数据对象描述等信息。字段属性包含的操作:字段名、中文简称、字段类型、是否主键和是否唯一等操作。引用关系包含:引用对象、引用对象中文简称和引用代码表字段等信息。ER图实现实体之间的关系模型,实现一对一关系、一对多关系、多对多关系及无任何约束的表的关系。
依据实际对系统表和业务表设计,系统表设计为综合服务提供相关的接口服务数据表,数据通过接口调用自动写入。设计的系统表和业务表如表2和表3所示。
建成学工系统测试库如图5所示。
2.6数据库注册及注册实例
开发Web Service服务接口通过搭建Web Service服务,获取工厂实例,生成针对指定服务接口(URL)的客户端,调用指定的方法实现。服务总线提供服务的注册与申请授权流程、服务的查询与分类功能、方便快捷的线上流量控制与缓存设置功能。将建好的数据库注册,注册的主数据管理平台信息如表4所示。
3应用及网络安全
学工方面应用服务情况是解决对所有在籍在校学生基础信息的收集,通过已掌握的学生基础信息可进一步统计出有效数据,作为学校开展全校策略和规划工作的依据。学校管理老师可以设置基础信息批次,设置开放时间、学生范围、修改范围以及审核流程等。学生在修改时间的范围内对个人基本信息进行完善或修改。按照审核流程,由班主任或辅导员进行学生基础信息初审,再由院系负责人进行复审,最后由学校管理老师进行最终审核。班级信息与学生基础信息从教务系统中获取,并一起初始化到基础信息中。接入应用程序(APP)時,云端通过HTTP协议调用校内应用管理平台的接口写入应用APP的注册信息,同时生成应用APP的安装包,安装包只能在本校使用。
整个平台只有相关应用服务器对公网开放某些端口,其他服务器公网都不能直接访问,应用程序统一通过代理出去。每台服务器都开启防火墙并在防火墙上限制开放的端口及限定访问的IP,所有软件安装采用非root用户,并限制root用户直接连接服务器。定期修改服务器密码确保安全。应用程序安全采用Web应用防火墙,做安全防护数据库安全采用数据库防火墙。平台上线运行前做漏洞安全扫描。在网络安全方面,应用程序采用HTTPS。SSL VPN保证管理员远程接入,出口采用核心防火墙。
4结束语
高校主数据平台建设解决各个业务部门信息不一致问题,以主数据的编码原则及其规范进行编码设计。通过对服务器资源规划部署,对WebLogic Server的构建,对基础数据的采集、整理及清洗工作,对业务系统表的设计,对整个平台应用安全的设置等工作,实现学校元数据管理、代码标准管理、主数据管理和数据集成等。针对应用实现了教务系统、学工系统、一卡通系统和招就系统等异构数据源的整合。接下来将要完善各业务部门业务系统实时数据的采集及数据的深度融合,以此确保平台建设的有效性和持续性,也为大数据应用打下良好基础。
参考文献
[1]杨现民,王榴卉,唐斯斯.教育大数据的应用模式与政策建议[J] .电化教育研究,2015,36(9):54-61.
[2] Singh S,Singh J.SSMDM: An Approach of Big Data for Semantically Master Data Management[C]// International ConferenceonComputingforSustainableGlobalDevelopment, IEEE,2015.
[3] Putro B L,Surendro K,Siregar H.Leadership and Culture of Data Governance for the Achievement of Higher Education Goals (Case study: Indonesia University of Education) [J].AIP Conference Proceedings,2016, 1708(1):1
[4]查永军.大数据与高校院系治理[J].中国电化教育,2018,372(1):59-63.
[5] Druker D,Rich R.Master Data Management[J].DB2 Management,2015,10(3):33-36.
[6]张闪闪,顾立平,盖晓良.国外信息服务机构的数据管理政策调研与分析[J].图书情报知识,2015,167(5):99-109.
[7]宋姣姣.神东主数据平台系统的设计与实现[J].陕西煤炭, 2018,37(S1):105-108,145.
[8]锁志海.西安交通大学教育大数据分析驱动智慧教育[J].中国教育网络,2017(10):20-21..
[9]陈君.主数据管理平台建设研究[J].铁道工程学报,2016,33(5):134-136.
[10]南旭光,张培.智能化时代我国高等教育治理变革研究[J].中国电教化教育,2018(6):1-7.
[11]李智蓉.数据管理信息系统接口集成设计方案[J].办公自动化,2018,23(4):29-31.
[12]蒋远辉,吕忠亭,任浩然.数据服务平台在高校的建设与应用[J].信息通信,2018(12):187-190.