面向对象的个人数据中心规划与实施

2015-12-02 03:00应奕彬赵泽宇吴庆杰
关键词:院系数据中心信息化

张 凯, 应奕彬, 赵泽宇, 田 鹏, 吴庆杰, 谢 蓉

(复旦大学校园信息化办公室,上海 200433)

0 引 言

复旦大学信息化校园建设从2001年开始.在信息化的整体实施过程中,信息化部门意识到信息化数据是支撑职能部门业务发展的核心资源,因此大力开展共享数据库建设,重点解决不同业务系统的数据标准和格式统一,致力于推动各个应用系统之间的数据交换、信息共享.

然而,校园信息化前期的建设过程将中心放在对业务部门的支持和服务,使得最终用户游离于数据产生和交换的信息化过程之外,用户与信息库之间存在着信息获取、信息处理和信息提供方面的巨大矛盾,这反映了信息化初期信息化部门普遍存在的对服务对象方面的关注度不够的问题.要使用和维护个人数据,师生需登录各个业务系统的相应模块,而业务系统越多,与“人”相关的数据(属性)就越多,对师生或者院系管理者而言,要全面的获取和使用这些数据的难度相当大[1].

近两年,学校在发展规划中明确提出推进院校二级管理体制,将权、责、利下放到院系.就实际落实情况来看,院系权力扩大,但院系视角的数据基础缺失,业务的信息化改革没有抓手,院校二级管理模式也标志着传统的分条块的数据组织方式已无法支撑院系的管理,现行的信息化架构制约着院系使用数据进行公共决策的能力.所以开放给职能部门的数据要在院系落地,需要良好的数据组织将数据利用简单化,这对学校信息化提出了新的要求,需要转换视角,面向教师、本专科生、研究生、博士后重新规划和组织数据.

因此,在一站式服务规划下[2],复旦大学信息化提出建立面向对象的以“人”为核心的数据中心,并在此基础上形成了一表通、统一申报等服务,为院系二级管理的体制改革落地以及提升个人的信息化数据使用体验进行了创新性的尝试.本文对面向对象的数据中心的设计和规划进行阐述,并阐明具体实施效果.

1 项目需求

从数据管理的角度出发,高校的教育信息化应用建设过程可以分为三个阶段:第一阶段,按照职能域构建业务系统,实现流程信息化,进行原始的数据积累.这个阶段的数据管理以建立、维护集中的基础数据平台为主,通过交换和集成将不同业务系统的数据进行统一;第二阶段,管理与服务前后端分离,实现服务信息化,按照用户在校的生命周期进行服务梳理和整合,改造服务模型;这个阶段的数据管理则在全局的业务数据基础上建立主题库和历史库,形成支撑上层业务的数据“中间件”;第三阶段,在流程信息化与服务信息化基础上,为个人、院系、学校提供数据综合利用与服务,实现支持在线与离线双重模式的数据填报、数据管理和数据分析.这个阶段的数据管理将数据组织模式进行改革,改变传统的以业务条线为主体的模式为以“人”为主体的面向对象的组织方式,为个人数据中心的建立奠定基础.

目前大多数高校的数据管理思路仍以第一阶段和第二阶段为主,传统的数据组织和利用方式的劣势随着信息化服务的推进渐渐显露出来,主要体现在以下几个方面.

(1)个人数据重复填报

信息化建设虽然已经深入到了学校各项工作当中,数据共享程度越来越高,但个人数据重复填报的现象仍然非常普遍.原因有两个方面:一是以个人为权威源的数据,如联系方式等,每个业务系统中都要涉及,甚至每张申请表单用户都要重复填写;二是一些业务部门下发的表格并没有信息化系统支撑,如工号、姓名、职称等核心数据几乎是各个表单必不可少的数据项.

(2)数据梳理工作繁复

信息化建设过程中已经积累的数据,是以管理视角进行存储的,在面向服务进行业务设计时,需要进行大量的转换和翻译工作,要求开发者全面了解其他业务系统的数据存储和转换方式,存在数据的重复清洗和梳理.以教学排课数据为例,教务管理系统中往往以课程代码为主键,关联课程信息、教师信息等;核算教师个人工作量时,则需要转换为以工号为主键,关联课时信息、选课名单等.在教师教学、年度考评等多项服务中都需要建立这样的转换关系,不利于服务的快速开发.

(3)综合性服务难以获取综合数据

服务的深化离不开坚实的数据基础,各个业务系统中分散存储的数据加大了综合性服务的建设难度.在前端服务与后台管理分离的建设模式下,从业务系统中剥离出来的个人服务,面临的仍旧是来自于各个业务系统中的零散数据,伴随着服务覆盖面的扩大,数据同步规则越来越复杂,同步压力日益增大,成为限制服务发展的瓶颈.

(4)院系数据基础薄弱

在传统的信息化管理模式下,数据主要掌握在管理部门手中,院系要了解教师的基本信息,如科研情况、生活情况等,需要到学校职能部门申请,准确性和实时性低.

总而言之,学校的体制和流程的改革对信息化提出了新的设想,信息化业务的推进对数据基础服务模式提出了新的要求.复旦大学在信息化“一站式”服务平台的规划中,提出信息化数据管理的发展方向,拟将各级用户纳入数据生产、维护和流通的过程,为用户建立数据操作和管理的平台,简化用户管理数据的流程.个人数据中心就是在这种背景下规划设计的个人数据管理平台,它以面向对象的思路,将不同业务过程中涉及到的各种数据类别作为“人”这个对象的特殊属性,一方面对数据管理的维度进行了重新规划,方便利用,另一方面以数据托管的概念为用户提供了一个在线的、安全的、可维护管理的个人档案,可极大减少用户维护业务数据的复杂度,又提高了业务数据在信息化系统中的可用性.通过个人数据中心的收集和归纳,院系可轻松获取到管理范围内的非常全面的与个体相关的数据,按照教学、科研、人事等类别进行综合查询及统计,通过为院系量身定做一些具有共性需求的报表,减轻了院系的工作压力,促进了院系管理水平的提升.

2 系统架构

2.1 数据中心架构

复旦大学的数据服务中心建设架构如图1所示,包括数据层、业务层和服务层.业务库从支撑全部业务转变为支撑以管理为主体的业务流程;主题数据库、历史数据库等形成学校决策支持库;共享数据库定位则更加明晰,负责数据交换与共享,分发数据字典,主导数据的一致性和规范性.

个人数据中心库按照服务的特性将各个业务系统中的数据抽取出来进行重构,改变了原来的数据组织形式,按照人的属性进行数据存储规划,方便进行数据利用和服务[3].个人数据中心库以及基于其上建立的个人数据查询与展示平台、综合服务平台和一表通离线填报平台的建立为高校信息化建设思路注入了新的活力,面向对象的数据模型可以有效地支撑教师、学生的个性化服务,实现管理与服务的松散耦合,推动院系二级管理的发展.

以个人为权威数据源的数据放在个人数据中心库中进行维护,作为数据源同步到各个业务系统中,用户只要保证数据源头数据的准确,则各业务系统中的服务所引用的数据就是最新的.其次,对线下填报的表单提供基于个人数据中心库的离线下载服务,采用快速配置的方式配置业务部门的表单,将已有数据预填进去,用户离线或在线维护补充其他数据,完成表格,以Word/Excel/PDF格式下载后自行完成申报.

经过重新整合的数据存储方式更有利于个人服务数据的读取,对于教师岗位考核、学生毕业审核等需要广泛数据支撑的综合性服务,个人数据中心库的优势体现地更加全面.个人数据中心库建成之后,分散在各个业务系统中的与个人相关的数据进行了集中.从业务系统中剥离出来的个人服务,将综合利用个人数据中心库的中的数据,而不再通过ODI数据同步的方式获取多个外部数据源,以支撑个人服务的运行,大大减轻了数据同步与共享的压力,使数据接口唯一,数据利用更加便捷.

图1 数据服务中心建设架构

2.2 数据组织模型

个人数据中心抽取了与“人”相关的各类信息,进行重新整理和汇总,存储在个人数据中心库中,与各业务系统库、共享数据库、主题数据库物理上分离.个人数据中心库与业务库在同步机制上是一致的,只有自身产生的数据才作为权威数据源通过数据交换平台分发到各个业务库中,实现数据流通和共享.

教师个人数据中心数据规划包括基本信息、能力/资质信息、入职/聘用信息、兼职信息、培养信息、考核信息、教学和人才培养工作信息、科研信息、财务信息、资产信息、校园生活信息、离职/退休信息等12大类55小类数据,如图2所示.

本专科生/研究生个人数据中心规划包括基本信息、学习信息、生活信息、毕业信息4大类35小类数据,如图3所示.

2.3 数据采集方法

由于信息化建设的复杂性,在数据存储层面和数据抽取层面均存在诸多问题.如数据结构的差异、数据库的异构等,甚至包括单机版数据库的数据,Excel、TXT等文本形式的数据.个人数据中心要充分采集上述数据,必须根据其来源和特征的不同,采取多种采集方式.

一、共享数据交换平台抽取.由信息化部门自主管理的数据是最容易获取的,可以通过标准的数据同步和共享机制获得;

二、数据同步机制读取.由业务部门独立建设的业务系统,其数据对信息化部门是不公开的,由业务系统建立视图将数据推送出来,通过数据共享平台读取后存入个人数据中心;

三、数据交换平台采集.部分管理部门仍然存在由工作人员手工维护的外部数据,以DBF、Access等单机版数据库形式,或者Excel、TXT等文本格式存储.这些数据的采集难度比较大,通过自主开发的数据交换平台,实现用户手工数据与学校核心数据库的数据对接,用户不定期上传数据即可.

图2 教师个人数据中心结构

图3 本科生/研究生个人数据中心结构

四、数据清理后批量导入.业务部门在核心期刊网购买的论文、著作等权威数据,通过姓名、院系、电子邮箱等多个属性的匹配、清洗后批量导入个人数据中心.

个人数据中心通过多手段、多渠道的技术实现方式充分采集到了学校范围内所有与“人”相关的属性信息,进行转换和处理形成权威的个人数据中心.

3 实施成效

复旦大学个人数据中心建设始于2012年,在应用层,对个人数据中心库的数据利用分为三方面:个人数据服务平台、综合服务平台、一表通离线填报平台.

教师个人数据中心已经正式运行,研究生数据中心和本专科生数据中心正在测试阶段,页面风格如图4所示.师生只需登录到个人数据中心就可以查询到与自己相关的所有数据,改善了以往查询不到数据或者需要登录到各个业务系统中分散查询的状况.

图4 研究生个人数据中心页面

教师个人数据中心,集成了30类数据共982属性信息;研究生数据中心集成17类数据共600个属性信息;本专科生数据中心集成15类数据共518个属性信息,并且还在不断完成和拓展当中,已集成数据如表1所示.

表1 个人数据中心数据集成项列表

综合服务平台主要是已有信息化支撑的服务流程,实现个人在线填报和院系、学校在线审批等.包含个人数据维护、年度考评、教职工与学生出国出境申请、博士后出站管理、科研成果申报等多项个人服务.

一表通离线填报是针对未实现信息化的业务表格而开发的平台.线下处理的方式是师生在网站上下载电子版的表格或业务部门下发纸质表格,由师生填写后上报,其中存在着大量的重复填报问题,一表通平台则将电子版的表格或者纸质表格做成报表形式,自动关联系统已有数据,提供给师生在线填写后下载或者离线下载后填写两种方式,有效地的解决了业务信息化和数据重复填写之间的矛盾,目前人事、科研、教学相关的多张电子表格已配置完成,极大地方便了用户填报,系统界面如图5所示.

图5 一表通系统

5 结 语

在学校二级管理体制改革的背景下,在信息化“一站式”服务的设计和建设过程中,复旦大学重新规划了数据的维护和管理方式,以减少个人数据重复填报、促进数据梳理、推动综合业务服务发展、促进院系决策为目标,提出建立个人数据中心,满足业务部门和院系变更数据的需要和部门间数据共享、校一级与跨部门综合统计、分析和评价等校级信息决策的需求.个人数据中心使得业务系统的数据在更广阔的范围内公开,引起了数据产生部门和师生个体对数据质量问题的关注,利用全民监督机制能够更快更准确地进行问题定位,从而形成自下而上的数据监督与管理机制,提高个人进行数据维护的积极性和主动性,让数据真正地实现了流通.

数据是信息化建设过程中积累的一笔巨大财富,深化数据应用,提升个人体验,夯实信息化的数据基础,建立良性的数据生态循环的发展环境将推动信息化建设迈向新的台阶.

[1] 张凯,吴庆杰,陈翼,等.复旦大学:从业务服务向数据服务转型[J].中国教育网络,2013(8):39-41.

[2] 张凯,朱亚晓,宓詠.构建“一站式”个人服务中心[J].中国教育网络,2010(11):62-63.

[3] 赵泽宇,陈翼,张凯,等.复旦大学:大数据促进服务模式转变[J].中国教育网络,2014(1):69-70.

猜你喜欢
院系数据中心信息化
酒泉云计算大数据中心
月“睹”教育信息化
浅析数据中心空调节能发展趋势
月“睹”教育信息化
幼儿教育信息化策略初探
关于建立“格萨尔文献数据中心”的初步构想
清华院系手机背景图
关于高等院校院系党政关系的思考
基于云计算的交通运输数据中心实现与应用
突出音乐本体 注重和声实践——高师音乐院系和声教学的思考