复旦大学:大数据促进服务模式转变

2014-03-13 01:55:03赵泽宇陈翼张凯宓詠
中国教育网络 2014年1期
关键词:复旦大学院系数据中心

文/赵泽宇 陈翼 张凯 宓詠

复旦大学:大数据促进服务模式转变

文/赵泽宇 陈翼 张凯 宓詠

一脉传承的历史数据则能体现出数据对象在一定条件下的发展变化趋势,这对于发现问题,优化服务起到至关重要的作用。

复旦大学的校园信息化建设从2002年开始,至今已经经历了IT基础设施建设、信息化应用推进阶段,进入信息化服务优化阶段。随着业务与服务的发展,学校积累了大量教学、科研、管理方面的数据成为宝贵的资源,对这些资源的积累和有效利用将使得信息化向更深层次的服务模式转变。

复旦大学从信息化建设初期就开始着手建设U-IDC校园数据中心,是国内最早建设校园数据中心的高校之一。经过十余年发展,中心拥有由小型机、多组虚拟化集群支撑的400多个虚拟化应用的运行环境,存储集群提供超过1.2PB的存储空间。

共享数据库系统作为数据中心的业务数据核心平台,不仅为业务系统建立和管理数据库,还针对人、财、物、事、文等大类建立了不同主题的专题和历史数据库,使得数据的组织和管理具有专业性和延续性。

在数据服务设计方面,根据服务的受众不同,实施不同的规划:综合利用包括基础数据在内的各类资源,逐步实现学校精细化管理,为学校提供决策支持;为各职能部门提供精准的数据查询、统计和展示服务,为真正实现学校、院系两级管理打下坚实基础;建设个人数据中心直接服务于师生,提高数据展示度和师生满意度等。

数据共享促进业务融合

数据共享服务面向各应用系统,通过数据的清洗、集中和交换、提供权威数据源和实时数据检索服务,在数据共享的基础上进行业务调整与融合。复旦大学从信息化建设开始就面临着各个业务系统间的数据共享问题,通过UC权限图表、星形共享库模型的建设等技术手段,建立了全校范围内的标准数据结构、统一数据编码规范、清晰的数据维护—使用体系。在共享数据库稳定运行的基础上,进行业务系统的功能调整和融合,在共享库基础上建设一站式信息服务门户和统一数据检索查询统计服务。

数据仓库及决策支持服务

数据共享能够保证数据的一致性,但是对于历史数据并没有记录下来,而一些日常业务的流水数据对于决策支持分析有非常大的帮助,但是对于其他业务却意义不大,也没有共享的必要,而这些数据的量级是非常大的,因此需要针对数据挖掘与决策支持建立专门的数据仓库和大规模数据处理架构。复旦大学从2012年开始建立和逐步完善校级统一数据仓库,着重存储每天一个版本的业务数据、一卡通日常消费流水、日常网络行为日志等大流量数据,并通过分布式数据采集、分布式计算、虚拟化、内存计算等方式,建立一整套从采集、存储、分析、计算、展现的架构。

在数据仓库的基础上,复旦大学建立了包含面向学生和教师对象在内的6大类17小类的主题数据展示系统,主要包括人员信息类(教职工信息统计、学生信息统计、本专科生基本信息查询、教职工基本信息查询、研究生基本信息查询)、科研类(文科科研数据分析、教师学术表现)、教学类(研究生成绩分析、招生数据分析、本科生生命周期数据分析)、综合服务(一卡通分析、图书馆客流分析、综合校情展示、其他信息)、学生工作(宿舍数据统计、宿舍使用情况统计)、报表类(教育部高基报表)等。

数据展示利用的服务主体是校领导和各职能部处,业务人员登录系统选择不同的数据主题和条件,定制符合自身需要的数据展示图表。复旦大学从2012年开始推行此项服务,此举解决了很多部门在日常工作中经常会碰到的获取学校业务数据难、实时性不高和准确性低的问题,受到业务部门的广泛欢迎。在此基础上,复旦大学信息化部门连续2年为学校高等教育研究所、本科生院、研究生院和发展规划处等部门编撰年度的本科教学质量报告、研究生教育质量报告以及高等教育基层统计报表等提供数据材料,并支持数学学院、医学院、招生办等机构开展专项的教学、招生情况分析工作。

个人数据服务

将信息化过程中积累的大数据进行分类和整合,抽取与“人”相关的各类信息,建立个人数据中心,为师生提供区别于管理视角的集中数据展示、数据填报、数据下载等服务,同时也简化以“人”为对象的数据化过程。在个人数据中心基础之上建立校级的统一填报中心,将填报服务与管理流程分离,使所有基础数据对师生可见,减少重复上报,实现数据的高效利用。通过上述服务的提供,个人数据中心形成“学校-院系-个人”的逐级开放模式,以数据的充分利用为目标,激发用户对数据维护的积极性和主动性,以此建立实时准确的个人数据交换平台,融入学校核心数据库。

个人数据中心服务产生的数据对推动教育教学改革能起到明显的作用。通过个人数据中心,院系可以获取到管理范围内的非常全面的与个体相关的数据,并且还可以按照教学、科研、管理等类别进行综合查询、统计及分析,通过为院系量身定做一些具有共性需求的报表,从而减轻院系的数据上报工作压力,也更利于促进院系的管理水平的提升。

建立大数据管理的良性生态

随着校园信息化的推进,新的业务系统和服务系统的出现容易制造出新的“数据孤岛”,因此要建立适宜的数据管理机制,促进大数据管理和利用的良性发展。根据复旦大学数据服务和管理的经验来看,良好的数据管理机制包括加强数据标准建设、重视历史数据积累、健全数据管理队伍,以需求主导服务方向,建立互助互利的数据交流模式。

增强数据标准化建设应坚持在全校业务系统和服务系统推行统一编码,去除阻碍数据整合和流通的潜在隐患。在业务管理层面,建立以用户角色在校活动的阶段和身份为主线,将“招生-迎新-教学-培养-学工-就业-离校-校友”全系列数据依据先后关系组织到一起,形成条理清晰的业务数据链结构;在教学资源层面,建立以知识化的资源管理结构,将异构的资源媒体统一管理;在网络行为层面,以数据化为着眼点,建立以“人”为中心的数据索引和存储模式。

历史数据积累强调关注数据的变化体现出来的规律。大部分的传统业务系统和服务系统注重短期、实时数据对业务运作的支持,强调数据单体的精确度、及时性,而并不关注分析数据相互之间的联系。而一脉传承的历史数据则能体现出数据对象在一定条件下的发展变化趋势,这对于发现问题,优化服务起到至关重要的作用。

大量数据的堆积并不能直接产生效益,其分析过程需要创新的思路和对业务的深入理解。研究表明,数据挖掘通常只能解决20%~30%的问题,真正复杂、重要的问题要靠数据处理、数据集成和数据质量来解决。这就要求校园信息化中做数据分析的人员需要具备既懂得数据、又懂得业务的复合能力,能将业务带入到数据剖析过程、将技术传递给业务人员;同时也要求IT人员要熟悉业务、逐步向数据分析员角色转换。

表1 个人数据中心服务

以决策需求主导数据服务方向应重视数据分析与挖掘对学校管理改革的支撑,有的放矢、真正为学校决策支持提供数据服务;信息化部门应主动出击、抛砖引玉,为学校、业务部门等不同层次的用户提供定制的主题数据分析,形成常态化工作,并逐步使行为主体从信息化部门转变为管理职能部门;让学校和业务部门切实体会到信息化带来的变化与好处,信息化部门也因此会成为学校管理和教育教学改革的真正推手。

所有信息化业务的运行都是建立在相对精确的数据基础之上,数据质量问题不是仅仅通过IT等部门的技术手段就能解决的;数据只有在流转中才能体现其价值,有价值的数据才能引起使用者的关注,使数据权威生产者变被动为主动地去维护数据,以保证数据有效性;通过在IT部门和职能部门间形成互助互利的数据交流模式,提高职能部门提供业务数据的积极性。IT部门通过对数据的收集和整理,反过来为学校和业务部门反馈数据的统计和分析结果,相互推动工作的发展,建立“个人-院系-学校”自下而上的数据监督与管理机制,形成内需拉动的信息化发展良性循环机制。

建立如上所述的数据管理良性生态环境,会对正在进行的高校信息化建设起到至关重要的作用,同时也必将成为正在走来的“大数据时代”的重要基础。大数据的成功应用,也将进一步促进良性生态环境的不断发展,为高校发展的长远战略目标提供有力支持。

(作者单位为复旦大学信息办)

猜你喜欢
复旦大学院系数据中心
酒泉云计算大数据中心
复旦大学附属中山医院整形外科简介
复旦大学附属中山医院整形外科简介
民航绿色云数据中心PUE控制
电子测试(2018年11期)2018-06-26 05:56:24
高师音乐院系艺术实践周实效提升策略
清华院系手机背景图
大学生(2016年7期)2016-04-29 10:12:06
关于高等院校院系党政关系的思考
基于云计算的交通运输数据中心实现与应用
Comment acquérir la culture de l'autre?
法语学习(2015年5期)2015-04-17 06:06:01
商科院系建立咨询委员会的思考
现代企业(2015年5期)2015-02-28 18:50:41