李占平++杨昱昺
摘要:目前高校档案管理存在管理内容独立、管理不全面、重馆藏轻利用等问题,通过引入“云平台+大数据”技术,实现高校档案管理向全面化、智能化方向发展。
关键词:高校;档案管理;云平台;大数据
一、引言
随着信息技术的发展,我国高校教育信息化已日趋完善。高校每天从各个信息管理平台产生了大量的电子文档,特别是教学平台产生的大量音频视频文件,日积月累,将给高校各信息系统的正常运行和档案管理带来巨大挑战。以前针对大量的电子文档一般采用措施是:增加硬盘存贮空间、提高硬件性能或只保留规定年限内的,其余删除。目前,有一种新的解决方案:引入“云平台+大数据”技术。云平台可通过对大量普通PC机的集群,实现存贮空间的以快速低廉的成本进行扩充。大数据是以海量的信息、多种数据类型、知识密集度低等特征为高校档案信息资源实现数据分析与数据挖掘提供技术上的支撑。
二、高校档案管理现状
目前高校档案管理主要存在如下几方面的问题:1、由于历史原因,档案管理信息系统一般都独立存在,如:教师信息有教师信息管理系统、学生信息有学生信息管理系统、图书馆有图书馆信息管理系统、教学有专门的网站等,系统之间数据基本独立。2、由于技术的限制,目前一般的信息管理系统都采用关系型数据库存贮数据,对结构化数据信息存取比较方便,但对非结构化电子文件,如文档、表格、网页、音频视频等存贮比较困难,所以目前这些非结构化文件在档案处理过程中,很多高校依然采用纸质或统一以普通文件存放,造成管理不全面。3、目前国内高校档案管理中普遍存在“重馆藏轻利用”的现象[1],档案管理员对馆藏数量比较重视,但对如何提高档案信息的利用率及应用服务不够重视。
三、高校档案的特性
与一般档案相比,高校档案有其自身的特征,大致可归纳为如下几个方面:
1、档案形式广泛、内容多样。高校档案包括教师个人档案、教师教学档案、教师科研档案、学生个人档案、学校行政档案、各分院行政档案、资产档案、图书资料档案等。如果将目前网络教学平台资料、学校OA平台各类文件、各分院网络平台资料也归入档案进行统一存贮管理,内容将更全面、丰富。
2、档案存贮形式多样。由于高校档案来源广泛,势必造成有多种存贮形式,如教师个人档案、学生个人档案、资产档案等以结构化数据存贮为主;但对不少教学资料档案、行政档案、图书资料档案、各类教师学生获奖证书等,大多还以纸质形式存贮,或以电子扫描文件存贮;网络教学平台、学校OA平台等发送的文件,一般以文档、音视频文件等形式存贮[2]。
3、档案调用频繁,利用率高。高校档案大多都需要频繁调用,如学生每学年的评优、每一届毕业生的调档;教师每年晋升职称查档;上级主管部门的教学评估和学校内部教学质量检查调档;学生转专业、教师人事调动调档等。
4、档案价值密度较大。由于高校档案资源主要来自校内已有的信息系统,从这些系统中获取的资料格式规范、内容完整,其档案信息的价值密度较高。
四、云平台+大数据的应用
云平台分公有云和私有云[3],主要用于解决大容量存贮问题。公有云目前常用的有阿里云服务器、腾迅云服务器、百度云服务器等,可通过租赁的方式获取云空间。私有云目前常用Hadoop框架进行搭建,相对公有云,私有云的优势在于采用自主管理,在扩充存贮空间方面相对比较方便,并能对数据、安全性提供有效控制。
大数据技术是在合理时间内完成海量数据的采集与处理,最后将处理结果反馈给用户,给用户决策提供帮助。大数据有4V特征,分别是:数量(Volume),即数据巨大,从TB级别跃升到PB级别;多样性(Variety),即数据类型繁多,不仅包括传统的格式化数据,还包括来自互联网的网络日志、视频、图片、地理位置信息等;速度(Velocity),即处理速度快;真实性(Veracity),即追求高质量的数据[4]。
根据高校档案的特性,采用云平台+大数据技术可以很好的解决目前高校档案管理中存在的问题。图1是结合“云平台+大数据”的高校档案管理系统设想。在该图中,通过建立Hadoop私有云平台,在该平台下,采用HDFS和Database相结合的数据库存贮方式,将结构化数据和非结构化数据进行分别存贮,根据需要由大数据引擎的数据处理层进行调配。HDFS和Database相结合的数据库处理方式有利于充分发挥关系型数据库和非关系型数据库的优势,使系统的处理效率更高。数据来源通过对已有的不同信息系统建立相应的接口进行处理,通过在休息时间由系统自动调用接口,更新高校档案管理系统数据库。在应用层,通过不同的业务访问档案管理系统时,可通过应用接口层访问数据库处理层,再由数据库处理层访问到HDFS/Database数据库。
五、结束语
通过结合“云平台+大数据”的高校档案管理系统,由于将高校各种档案管理或教学网站等信息系统的数据库集成到一起,不但能解决目前高校档案管理各自为战,信息不全,且查询不方便的问题,而且如果能引入大数据中的数据挖掘技术,还可找出档案信息之间、用户之间以及档案与用户之间潜在的逻辑关联规则,从而能够为学校教学、学生综合素质评价提供帮助与决策。
参考文献:
[1]李小晨. 大数据时代背景下的档案管理探讨[J].云南档案,2013.6:48-50.
[2]陈峰,孙淼洋. 大数据在高校档案信息管理中的应用研究[J].管理信息化,2015.7:54-55.
[3]孟宇,张涛,赵政文.数字档案云平台的构建与研究[J].微处理机,2013,34(6):49-52.
[4]石俊峰,周俐霞等. 大数据时代高校数字档案资源管理研究[J].现代教育技术,2015.1:19-24.