徐琦
(陕西师范大学网络信息中心,陕西西安710119)
基于大数据的高校数据整合模式研究*
徐琦
(陕西师范大学网络信息中心,陕西西安710119)
面对“大数据”时代给高校数据整合带来的挑战,本文从组织维度、数据维度、技术维度三方面对高校数据整合模式进行研究,为高校数据整合工作提供新思路,尝试建立高校数据统一规范管理的组织架构,通过对高校主要数据模型的梳理,提供统一的基于云的高校数据整合和共享平台,实现高校内部数据的整合和共享,为教学、科研、管理提供数据决策支撑,提高高校的信息化水平。
数据整合;大数据;云存储
随着大数据时代的到来,高校的数据资源呈几何级数的增长,但由于高校数据普遍存在缺乏统一的管理规范、数据一致性差、数据格式各异、数据链不完整的问题,使得大量优秀数据无法共享和利用,无法获得更大程度的价值。在此背景下,基于大数据的高校数据整合模式研究,特别是消除高校的“信息孤岛”,提高数据资源利用效率,使原来分散、利用率低下的教育资源得到更大程度的价值挖掘,为高校的发展战略和决策提供科学的依据都有重大的意义。
研究机构“Gartner”给大数据的定义是,大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据的战略意义不在于掌握庞大的数据信息,而是对这些含有意义的数据进行专业化处理。而高校面对大数据时代的到来,如何对高校招生、就业、教学、管理等各种实践活动中产生的具有保存价值的数据进行大数据整合和继承管理,并利用大数据处理技术进行这些信息的挖掘、整理、分析,为高校的发展提供决策支持,是下一步学校信息化发展的重点工作。
近年来,从国家、区域到高校等不同层面都在加快信息化建设步伐,建立学校内部统一的公共数据平台,部分985、211重点院校已经初步建成了支撑学校日常运行的校级统一信息系统,建成了包括信息门户、统一用户管理与身份认证、统一权限管理与控制、数据共享与交换、综合信息服务平台等在内的公共基础平台,在信息化教学、资源和应用系统建设都有了长足的进步,但是高校数据整合工作仍然面临着诸多难题和挑战。
1.数据资产意识薄弱
数据作为高校重要的无形资产和战略资源,其利用的水平高低可以直接反应一个高校的教学科研水平、管理能力,同时又是提高高校竞争力的有效手段。而高校内部还存在重视信息系统建设,对高校数据建设意识薄弱,没有认识到数据也是高校的宝贵资产,将会在学校教学科研管理中发挥重要的作用,导致高校内部业务系统众多,但数据并没有统一管理制度,存在管理混乱、不一致的现象,有价值的数据资产不能发挥其重要作用。面对大数据的冲击,要求高校内部从上到下不断调整思维模式,在思想和行动上重视数据,树立大数据、大档案、大资源的思想意识,实现数据的统一管控,提高数据质量和数据的利用效率,提供安全、完整、统一的数据服务,为学校教学、科研、管理提供信息服务和技术保障。
2.数据缺乏规范性和统一管理
经过长时间的信息化建设,目前高校内部形成了多个业务系统,但这些系统之间在应用或数据等层面上是彼此分离的,分别采用了不同的架构及其开发技术。同时各业务系统的数据维护及管理工作缺乏统一管理,导致不同部门之间的数据存在不一致性、差异性,更有甚者两个部门发布的数据甚至出现冲突的情况。因此确定数据的唯一性和权威部门、规范同一数据的格式及做好数据清洗和整理工作是高校数据中心整合过程中工作量最大也是最为重要的内容。
3.数据管理安全性不高
高校业务系统普遍存在各自为政、应用系统之间无法实现共享和利用、应用系统的数据存在服务器或存储中、没有统一的安全规划、存储的安全性无法保证等问题。有些高校已经有了数据中心,但是数据中心的数据管理缺乏安全性管理,普遍缺乏密级划分,涉密数据和一般数据没有区别对待,加密数据没有做安全措施的防护。因此在高校数据整合过程中,如何加强数据的安全管理是亟待解决的重要问题。
4.数据在高校的价值没有很好的体现
通过高校内部数据的整合应用,可以有效提高数据的利用率和价值,从而优化高校内部的管理结构,数据不仅仅在各自业务系统发挥作用,还可以通过对高校数据的有效整合并通过对这些数据的挖掘、分析和预测,从而优化高校内部的管理结构,如图1所示,通过数据整合将高校内部行政、教学、服务等部门从繁杂的事务性管理中解脱出来,从而关注于本部门的业务职能,并为部门及整个学校的发展提供决策支持。
图1 高校管理衍进图
在此背景下,基于大数据的高校数据整合模式研究,可以统一数据的标准,规范数据的管理,提高数据的安全性,提高数据资源的利用效率,使原本分散、利用率低下的教育资源得到更大程度的价值挖掘,为高校的发展战略规划决策提供科学的依据。针对高校内部的数据整合,本文从三个维度进行了整合的模式设计,分别是组织维度、数据维度、技术维度。
1.组织维度
很多高校在信息化建设初期投入大量经费用于购置各种软件、应用系统、铺设网络,却并没有对信息化工作进行统筹规划,导致了很多部门的系统各不兼容,造成资源浪费,或是只注重信息化的形式,并不重视内容,导致很多信息化管理模块内容空洞,更新速度慢,而且更为突出的是缺乏规范的管理机构,并没有实现统一规划、统一管理,影响了信息化的质量和效率。
考虑到各个高校实际情况的不同,组织维度上的整合也有所不同,但基本的组织原则可以归纳为:整体规划、统一部署、分级把关。校级组织部门对数据的建立、使用,信息系统的开发、整合建立统一的规范和审批机制。部门级组织机构负责单位内部数据管理及与其他单位数据集成、整合的具体工作。根据各个高校信息化建设的推进情况,逐步建立完善校级、部门级的数据管理机构,从而为数据整合建立上下一致的组织管理体系。由于高校数据整合是一项全局性工作,涉及到学校的各个部门。各高校主要领导要牵头成立专门机构,强化对数据整合工作的组织领导和统筹协调,制定工作制度,明确时间节点,划分责任主体,加强考核督导,确保数据整合工作顺利开展。
建议高校成立数据管理领导小组,该机构的主要职能是通过行政组织手段,遵循数据应用的基本规律,在充分利用现有数据基础上,对学校数据进行整合、共享、利用和有效管理,解决数据碎片化、信息孤岛问题,建立学校统一的数据中心,减少资源的浪费,保护高校的信息化投入,使得高校数据资源可以有效利用,为高校教学、科研、管理服务。该组织架构为:
(1)组长一名:由高校校长牵头,保证其权威性。副组长一名,由分管信息化部门的副校长担任,负责数据整合和管理工作的统筹、组织、协调和重大问题的决策。
(2)组内成员由高校各院系、处室分管信息化领导兼任,一方面保证学校整体部署数据整合工作的顺利实施,另一方面可以及时反馈各部门数据整合过程中的问题。
(3)小组下设办公室,挂靠高校信息化主管部门,具体负责学校数据资源整合共享管理的日常工作。
高校内各部门可以优势互补,实现不同类型的大数据资源的优质整合。其次在高校内部各部门建立数据管理机构,将数据整合和管理工作常态化,该机构由各部门信息化分管领导直接领导,并对学校数据管理领导小组负责,贯彻学校数据整合的统一部署,协调部门内部工作。该机构的成员可以考虑二级单位原有的信息系统管理、网络设备管理人员,避免部门内部人员的内耗,从而确保管理职能的统一、高效。另外,将各二级单位数据整合工作,纳入各单位年终评价体系中,切实保障学校数据整合工作的效果。
2.数据维度
为充分挖掘大数据的潜在价值,高校数据整合首先明确哪些数据应纳入移交范围,归档范畴,区分基础数据和专属数据,从数据源头保证数据的准确性和一致性。从高校业务和现有数据特性出发,凡是学校在招生、就业、教学、财务、党政管理等各种实践活动中形成的具有保存价值的数据都是数据集成管理的重点。
高校数据模式包括教育部发布的教育信息化行业标准在内的参照模型及数据,公共的标准以及满足各业务部门需要的校级标准模型及数据,各项业务活动的共享数据集模型。共享数据模式主要包括:教职工数据子模式、学生数据子模式。
(1)以教职工为核心的数据模式
教工基本信息:职工号、姓名、出生年月、性别、工作年月、报到年月、民族、政治面貌、婚姻状态、单位、职称、学位、学历、从事专业。
附加信息:工作经历、学习经历、家庭情况、配偶情况、奖励情况、处罚情况。
考核信息:年度考核、岗位考核。
合同信息:档案合同、岗位合同、引进合同、临时合同。
教学信息:教学情况、导师信息、教学论文等。
科研成果:科研项目、科研成果、科研论文、专利等。
培训培养:奖教金、攻读硕博、在职培训、继续教育。
福利信息:三金、岗位津贴、基本工资。
人员变动:校内调动、干部任免、聘用信息、人员离校。
(2)以学生为核心的数据模式
学生基本信息:学号、姓名、民族、籍贯、政治面貌、院系、专业、身份证号、联系方式。
附加信息:学习简历、家庭情况。
学籍信息:转校、转专业、休学、复学。
选课成绩:选课、成绩、已修学分。
奖惩信息:学生荣誉称号、优秀毕业生、学生处分等等。
学生档案:档案接收、档案传递。
毕业信息:毕业办理、毕业证书、学位证书、协议书及去向。
活动信息:思想政治教育、社团活动、文体娱乐、能力培养、学生会活动。
一卡通:图书馆、食堂、财务、医疗保健。
住宿:住宿安排、住宿操行评定。
资助:贫困生信息、助学金、勤工助学、贷款、减免学杂费。
3.技术维度
数据的整合离不开技术的支撑,可以说高校信息化建设和数据的应用是伴随着计算机信息技术的变革不断发展的。传统的高校信息化和数据应用采用的是网络平台统一建设,业务平台各自建设的模式,在短短的几年间,各高校的网络基础建设水平得到了快速的发展,万兆核心、千兆出口,数据中心逐步建立,原有的网络瓶颈、硬件性能得到了很大的改善。与之形成鲜明对比的是校园业务系统和数据应用在硬件设备、网络带宽极大改善的同时,并没有对高校各部门的工作质量和效率进行有效提升,应用系统发挥的作用没有取得预期的效果,同时硬件设备投资大、维护成本高和利用率低之间的矛盾,数据几何基础增长和数据利用率差、存储分散、一致性差的矛盾日益突出。
随着云计算概念的提出和应用,为高校数据整合提供了新的思路和技术支撑。云计算既是一种商业模式,也是一种技术模式。云计算主要包括IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)三种服务模式。通过云计算技术对高校数据进行有效整合,最终在高校内部建立统一的数据中心平台,其结构可以参考图2。
图2 基于云的高校数据中心平台
(1)基础数据平台:主要解决数据存、取的问题,将现有各院系、各业务部门的系统公共数据进行整合、归档,例如:人事基础信息、学生信息等,建立全校统一的基础数据平台。该平台一方面为学校各个业务部门提供数据支撑,保持数据的一致性,另一方面各业务平台在使用基础数据的同时,又通过统一的数据接口更新平台上的动态数据和相关文件,最后通过其平台内部的数据整合机制,完成对数据的统一处理。
(2)业务支撑数据平台:主要解决数据利用的问题,校内各部门根据业务需要在学校的统计规划下建立各自的分系统,例如人事管理系统、学籍管理系统、就业分配系统等,系统从基础数据平台取得静态数据,更新基础平台动态数据,并从基础平台中取得整合过的业务分析数据,为管理决策提供依据。
(3)管理决策数据平台:是数据真正为决策服务所提供的支撑应用平台,管理决策的数据平台由决策的需求驱动,其决策可以是各部门内部决策,也可以是跨部门的校级决策,通过对业务支撑数据平台和基础数据平台的整合数据进行分析,通过数据之间的关联,预测业务发展的方向,找出决策需要的关键数据。
通过业务集成、数据整合来建立基于云的数据中心平台,降低各个业务系统间的耦合度,增强业务系统间的协作关系;通过建立统一的数据标准,遵循数据间操作的规范协议,组成数据服务云,向其他业务系统提供数据服务;通过数据转换、迁移、共享,将数据整合起来,消除高校信息化中存在的信息孤岛现象,有效地提高数据的使用率。之后,如何将这些数据真正的利用起来,发挥重要的决策作用,是高校信息化下一步的重要工作。
本文基于大数据提出了高校数据整合模式,通过组织、数据、技术三个维度对高校数据整合进行了研究,为高校数据整合工作提供了新思路。高校数据整合水平不仅体现了高校教育信息化的程度,也反映了决策者的对现代教育发展趋势高瞻远瞩的水平,更是衡量学校办学能力和教学科研水平的重要标准之一。
[1]唐蓉君,熊忠阳.高校数据中心建设探索与实践[J].中山大学学报(自然科学版),2009(3).
[2]李恒贝,唐惠燕,毛莉菊.基于数据整合的高校信息标准构建研究[J].中国教育信息化,2011(15).
[3]曾雪梅,许春,粟海.基于IDM的高校数据整合分析与实现[J].微计算机信息,2011(27).
[4]刘志亮,张金隆.基于教育云的教育信息资源整合框架研究[J].情报杂志,2013(10).
[5]杨文正,熊才平,江星玲,周杰.公共服务外包视角下教育信息资源供给模式研究[J].电化教育研究,2013(11).
[6]杨鹍.基于语义的金融行业大数据整合及处理技术[J].浙江大学硕士学位论文,2013.
[7]白如江,冷伏海.大数据时代科学数据整合研究[J].情报理论与实践,2014(1).
[8]陈文东.高等教育信息资源共享中的政府角色研究[J].湖南师范大学硕士学位论文,2014.
[9]杨文正.基础教育信息资源优化配置模式与机制研究[J].华东师范大学博士学位论文,2014.
[10]荣荣,杨现民,陈耀华,赵秋锦.教育管理信息化新发展:走向智慧管理[J].中国电化教育,2014(3).
[11]大数据[EB/OL].http://baike.baidu.com/link?url= VmbPEmbc4kU 9iDk I2zcpmR lHdrv5xbfX tV7EX 1f21oUv 9bxH0bqLs4XHvTviYUZEC83qvtheOeat8j-KQXNn8zk IV0xOuuOGdrFLsljf-Je.
(编辑:王晓明)
TP393
A
1673-8454(2015)15-0060-04
*项目支持:本文系陕西省2014年管办评分离改革招标课题“基于大数据的高校数据整合模式和机制研究”(项目编号:GBPKT32)研究成果之一。