杨剑云
摘要:大数据环境下,各种数字档案信息资源急剧增加,高校数字档案馆建设的优化模式成为档案工作的必然,从技术层面、人才层面、安全层面作以分析,提出了大数据视域下高校数字档案馆优化策略。
关键词:大数据 高校 数字档案馆 优化策略
大数据顾名思义就是指由于数据的信息量庞大,用户很难获取和加工的那些数据。国际数据公司(IDC)将大数据定义为:通过高速捕捉、发现或分析,从大量数据中获取价值的一种新型技术架构。其特点可以概括为4V,即Volume(海量)、Velocity(高速)、Variety(多样)、Value(价值)。大数据技术涉及到云计算、数据挖掘、存储和管理等许多领域,对高校数字档案馆建设提出了新的挑战,也必然给高校数字档案馆的建设带来多样化的发展,大数据视域下,高校数字档案馆如何应用计算机和多媒体等通讯技术,对数字档案信息资源进行管理,提供网络检索和利用服务,实现超大规模资源共享的数字信息系统,是亟待解决的问题。
一、高校数字档案馆建设的重要意义和作用
从广义讲,数字档案馆建立在档案馆自动化的基础上,实现了自动标引、自动著录、自动检索、自动统计等活动,不仅能使本地和联机用户查询利用直接形成于计算机系统的数字档案,而且还可以利用经过数字化处理的传统馆藏的数字化信息,它是连接了众多档案信息源(包括文件形成部门构建的数据库信息系统)的广义信息系统,既是用户与信息源的接点,也是信息源与信息源的节点。高校数字档案馆建设的重要意义和作用主要表现在加强校内档案信息资源的共享、实现档案管理系统与办公自动化的无缝链接、提升职能部门管理的规范化和加强高校信息服务的网络化和多元化几个方面。
二、高校數字档案馆的现实条件
1.信息资源重复保存,不利于节约开支。已经形成的某些信息资源存在着重复保存现象,造成人力、物力和财力的浪费,像学生的电子论文在档案馆和图书馆都有保管,视频、音频资料在档案馆和音像室也有重复保管等,随着数量的增多,应进一步加强信息资源的整合、分配、集中管理与永久保存等问题。
2.信息资源保管部门无条件开展深层次的整合与挖掘。学校档案馆、院系档案室的工作人员主要职能是收集和保管档案、文献和资料,主要职能是开展档案的分类、整理、保存、保护、提供馆内查档服务等基础业务,在跟踪学校动态发展和利用信息化技术开展编辑、研究、汇总、分析等方面有很大的局限性;尽管校史馆在开展编史修志和历史展示方面做出了大量的成绩,但由于人员少、信息技术支持有限等原因还很难从学校发展的各个方面来开展全面的、系统的信息资源挖掘、利用和展示的工作。
3.信息资源分散管理,不利于系统化开发。据调查,大多数高校多年来形成的各类信息资源中,具有凭证和查考价值的纸质文档如历次校级会议记录、重大活动记录、重大科研项目报告与实验数据等具有凭证和参考借鉴作用的文字材料大都以档案的形成保存在档案馆;近年来开展信息化建设与应用形成的各类学生学籍信息、科研项目经费及研制过程记录等都以电子数据形式保存在学校计算机与信息中心的服务器;各类声像、多媒体信息则保存在宣传部和音像资料室;各院系的资料室也存有相当部分的资料,特别是校庆、系庆等重大活动所编辑、汇总和展示的各综合性成果都未进行系统化管理;这无疑造成信息资源利用的不便性,致使真正有用和急用的信息难以获得。
4.已形成的数字信息资源没有永久保管基地。学校各部门信息化应用形成的数字化信息资源,校庆、系庆等重大活动统计、汇总、编研和开发各类综合信息,校史馆编撰的各类图书、资料,以及回忆录、名人事迹等综合性资料和学校各级领导开展重大决策过程中所参考的统计报表和综合分析数据等,分散在学校多个部门,尚未开展系统管理、持续积累和永久保管,也未制定专门的收集、保管和存储制度、规范与标准。
三、大数据视域下高校数字档案馆建设的总体模式和策略——宏观角度和微观角度(技术层面、安全层面、人才层面)
1.宏观方面。高校数字档案馆数字化建设的项目思路、研究内容、经费预算、项目人员等情况进行了重点调研,确定工程建设方案(1)研究校内信息资源的保存、管理和分布现状,针对高校内部信息资源的利用与开发、展示需求,确定数字记忆基础数据库的建设方案;(2)研究高校数字化档案馆的规划方案,基于校内IT资源状况,确定软硬件基础设施平台的建设方案和系统应用与实施的策略;(3)开展信息资源积累、开发与整合,一方面,将已有的保存在馆的纸质信息资源进行数字化加工、编研、开发和整合;另一方面,将已形成的大量的数字化信息资源进行综合处理,实施集中管理、永久保存、研究开发和有效利用。(4)研发数字记忆网络平台和数字资源管理软件系统:针对收集、整理、处理、整合、管理展示、发布和利用等的需求,开发数字资源管理信息系统和信息发布平台,建设网络化数据统一管理的集成服务平台。(5)制定管理制度与标准规范体系,包括从收集、整理、分类、组织、存储、编研、开发、发布、展示和提供利用等全过程的业务工作规范和数字资源组织、存储、管理、发布的格式规范与标准。
2.微观方面:
(1)数据存储技术。海量数据存储技术一般包括直接附加DAS技术、网络附加存储NAS技术、存储区域网SAN技术、内容寻址存储CAS技术等几个方面。对于影像数据存储技术方面,东北大学档案馆馆藏档案扫描采集后的影像数据技术值得采用,单个多页无损Tiff格式文件:此类文件保留了原始图像的清晰度,最大程度的还原了档案的原貌,并且多页图像可以在一个图像文件中保存,便于管理利用,但是由于Tiff格式文件不便于网页浏览,所以系统在客户端通过网页浏览图像时,将自动对Tiff格式图像进行切分和有损压缩处理生成多页多个临时的JPG格式文件:此类文件在不影响原始图像清晰度的情况下进行了有损压缩,图像格式标准化、轻量化,便于网上查询浏览利用。大部分馆藏档案为单卷多页,为进行数字化加工时的便于管理和流水化作业,采用支持多页存储的JTIF(JPEG Tagged Interchange Format,24位彩色,YUV 4︰4︰4)格式存储,可同时将多页的档案扫描进入一个图像文件的不同页面中,可避免发生图像不容易确定归属的问题。JTIF格式支持8位灰度、24位彩色。
JPEG格式是国际上通行的标准。JPEG是the Joint Photographic Experts Group(联合图像专家组)的缩写,是用于连续色调静态图像压缩的一种标准,是一种高效率的24位图像文件压缩格式,同一幅图像,用JPEG格式存储的文件是其他类型文件的1/10~1/20,是互联网上通用的图像传输资源。
(2)安全战略。对于高校数字档案馆而言,应自行对馆藏各种数据资源进行及时全面的更新、维护、备份,以保证数据长期、可靠的有效保存。
要建立一个安全的网络保障体系,保证关键数据、关键应用平台的安全以及各个馆际间业务部门的安全,实现网络应用系统的安全高效运转。网络安全建设一般包括,多层次的防火墙设备、网络入侵检测系统、网络防毒软件、密钥技术等防范能力;同时要构建一个良好的网络设备的运行环境,比如,要具备防火、防潮、防水、防盗能力,有一个恒温、恒湿、防静电的机房环境,更适合在大数据下的海量存储网络系统中实现。
(3)人才战略。大数据视域下的高校数字档案馆建设,要求档案工作人员不仅仅是要懂得档案管理的内容,还要懂得计算机专业知识,具备现代化、网络化和数字化的相关技能,最好还要懂得网站技术、数据库技术及多媒体等技术的多料人才。因此,档案部门应该积极组织档案工作者进行系统培训,进行交叉学习,计算机专业的档案工作者要学习档案学基础理论和知识,档案学专业的档案工作者也要学习计算机的相关知识,互通有无,这样才能推动数字档案馆建设的步伐和进程。
数字档案馆建设也存在着很多不足和问题,需要我们进一步去探索和实践,相信,随着技术手段的不断进步,人才队伍建设的不断提高,安全保障系数的增高,高校数字档案馆建设一定会在大数据视域下不断完善和进步。
参考文献:
[1]谢海洋.数字档案馆网络技术初探[J].档案学研究,2005,(03).
[2]王芳.数字档案馆学[M].中国人民大学出版社,2010.2-5.
[3]王媛.高校数字档案馆建设策略研究[J].兰台世界,2011,(03).
[4]张志云.数字档案馆的共建问题研究[J].兰台世界,2006,(03):27-29.