数字档案云平台的构建与研究*

2013-09-12 01:50赵政文
微处理机 2013年6期
关键词:库房档案馆服务器

孟 宇,张 涛,赵政文

(1.西北工业大学软件与微电子学院,西安 710072;2.西北工业大学计算机学院,西安 710072)

1 引言

目前,云计算技术已经开始向开放、互通、融合的方向发展。近年来,各国政府纷纷将云计算技术与软件产业的发展结合起来,国内的云计算技术开始步入成熟期,大型企业已将云计算运用到企业运营中。我国的数字化档案馆针对目前档案数据分散管理及档案资源利用率不高等问题,借鉴国外电子文件管理策略,开始将云计算技术引入到档案数字化管理中,构建基于云计算的数字档案云系统平台,实现海量档案数据资源的统一管理及共享,使用户更方便、高效地利用档案资源。

2 云计算在数字档案馆构建上的优势

经过近年的建设和发展,我国档案信息化建设已经取得了一定成就,很多省、市均建立了自己的数字档案馆,然而,省、市经济发展的不平衡和数字档案建设策略的差异造成我国数字档案信息化事业发展失衡,各档案馆各自为营,分散管理。现在,国内的档案信息化总的来说存在以下几方面问题:

档案资源分布不均:省级档案馆相对有更好的资源(包括管理员、档案室和计算机设备等),而地方档案馆由于资金来源有限,往往面临着设备老化等状况,其网络建设信息化资源配置也存在巨大差距。

档案资源更新速度慢:各种信息技术飞速发展,要求数字档案馆能够为用户提供最新的档案检索以及相关信息服务以适应新形势的发展,这给部分区域档案信息化建设带来了很大压力。

档案资源共享程度低:数字档案管理的最终目的就是信息共享,但目前各区域档案资源的共享程度仍然有限。

这些问题造成了我国在数字档案信息化建设过程中重复投入,资源利用率不高。云计算的出现将是我国数字档案信息化平台建设强有力的技术支持。将云计算引入数字档案馆,会使数字档案馆发生巨大变化。数字档案馆在原有软、硬件发展的基础上,利用云计算技术的应用特点,可建立一个统一、开放、灵活的档案信息化平台。

2.1 提高档案资源整合度

利用云计算技术可以将各地方档案馆的档案数据整合到档案云系统数据中心的服务器中,制定统一的访问规则并对档案资源进行归类、管理和定制,档案用户通过统一的访问界面即可访问来自各地的数字档案资源。

2.2 强大的资源存储及计算能力

“云”中大量的服务器集群可以容纳TB级甚至PB级的档案数据,并可以随时增加和更新。其超强的计算能力能更好地计算和分析海量数据,并能够为超复杂的计算提供快速、高效的技术支持,为数字档案馆日益增长的数据提供了解决途径。

2.3 提高服务器运行效率及可靠性

云计算避免了现今档案馆各自为营的现象,消除信息孤岛,在各档案馆之间构建数据共享空间,通过网络进行数据联通。这样,各档案馆就可以分享档案云系统的数据资源和基础设施,实现数据的全面共享,一旦某台服务器出现问题,云中的服务器将在极短时间内将数据拷贝到别的服务器中,启动新的服务器提供服务,进而提高了档案资源的利用率。

2.4 降低成本投入

利用云计算技术,档案馆不用将大量投资用在硬件配置和更新上,只需支付相对低价的租赁费即可获得所需的各项服务。服务器的日常维护和升级由云服务提供商来提供,而且客户端的配置没有限制。这样,数字档案馆的建设成本可以大大降低,可以将更多的时间和资金利用在开展其他档案业务上。

3 “档案云”概述

3.1 “档案云”的提出

根据上述云计算在档案馆建设上的优势,提出档案云的概念,将有限的硬件和软件集中起来,把档案馆相关业务进行包装,对外提供相关档案服务。为实现数字档案的检索利用和充分共享,档案云应对各层所提供的各种档案资源进行有效记录和描述,建立档案云的数字档案索引库,用户可根据对数字档案的需求进行检索,从而完成后续的档案管理等操作。

如图1所示,档案云由区域云组成,每个区域云由若干已存在的数字档案馆组成,将为各省、市级档案馆提供相应档案服务的政务中心或是档案检索中心进行扩充,每个区域云设立一个管理机构,实现对区域云资源的管理。最后,各个区域云互联形成我国的档案云,整个档案云设立一个管理机构进行综合调控和数据管理。

图1 “档案云”示意图

3.2 “档案云”的意义

档案云的提出首先促进了各地档案资源整合,并能够缩短数据集中过程,在档案云的范围内向用户提供更广泛更迅速的档案服务。其次可以在一定程度上提升档案馆建设进程,通过集中优势硬件和在已有数字档案馆的基础上建立云服务,能够加速经济欠发达地区档案馆的建设,通过网络提供高速、简洁的档案服务,方便数据共享。

4 “档案云”构建研究

档案云是云计算技术在数字档案领域的迁移,是档案信息化的基础架构,包含了数字档案云系统所必须的一切软硬件计算资源,向用户提供以数字档案为媒介的服务。在此首先介绍基于云计算的数字档案云平台系统的总体架构,然后讨论基于该架构的功能模块和运作模式。

4.1 系统总体架构

一个通用的云计算平台一般包括存储设备、网络设备、计算设备、安全设备等,并可提供多种服务模式,如基础设施即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)等。档案云系统利用网络将地方档案馆分散的服务器整合成为大型的服务器集群,组成计算资源池,将各种资源包括计算服务、存储服务、宽带资源等都抽象成服务,由档案云体系中的软件进行统一管理。该体系中的档案信息是分布式的,以数据流的形式分布存储在各个数字档案的节点上,这是档案云的一个基本架构,主要分基础设施、服务平台、档案云应用和客户终端,如图2所示。

图2 “档案云”总体架构

基础设施主要是由云计算数字档案管理应用程序的数字管理节点、计算机专用网络安全防火墙、公用和私有的硬件设施等构成。将各级档案馆的服务器通过网络互联在虚拟软件环境下,形成一个统一的软件集群和数据存储节点,向上一层提供文档的计算服务和存储需求。

档案云平台提供的云环境包括用户定制和构建数字档案馆时基于Web云应用所需的所有软、硬件及中间件,使用户更快更有效地开发和部署自己的档案馆。

该档案云系统将数字档案馆中查询利用、档案鉴定、虚拟档案室等功能模块封装成云应用,以服务的形式提供给用户。用户在使用档案资源完成相关操作时,无需搭建档案馆运行环境或安装相关软件,只要在云终端登录到档案云系统的统一界面,通过付费租用所需功能,便可完成相应操作。

4.2 功能模块设计

档案云系统中的很多功能是其他功能运行的基础,因此,将这些基础功能进行整合,构建出档案云系统基础功能模块,介于系统应用层与平台层之间,使档案云应用依靠基础应用层完成交付。

图3 档案云系统功能模块具体设计

如图3所示,“档案云”SaaS应用层依靠基础应用层实现交付,专注于虚拟化数字档案馆建设的业务需求。这种方式虽然牺牲了一些系统灵活性,但是能够以较低的投入快速实现新功能,为平台后期建设及功能拓展提供了便利。为实现“档案云”系统的功能需求,在基础应用层中设计了一些功能模块,这些功能构成了软件即服务平台的关键技术。其中,系统包括大规模多租户支持、定价收费、认证安全及可视化图形引擎、报表引擎等组件作为基础应用服务平台的关键技术,与应用层共同向用户提供数字化档案馆的云服务。

5 “档案云”具体应用

数字档案云系统是在传统数字档案馆的基础上,建立可伸缩的档案云平台,使各中小档案馆利用网络进行资源共享,并可通过统一的服务接口定制自己的数字化档案馆,从而管理企业和政府现行的政策性文件和归档的历史档案信息。平台中的服务可以是具体的服务器集群,也可以是数字档案馆的具体应用。通过档案云系统平台,用户通过各种终端设备连接档案云服务,以按需付费的方式定制所需功能,下面简单介绍一下系统中提供的云应用。

5.1 档案著录

档案著录是在编制档案目录时,对档案内容和形式特征进行分析、选择和记录的过程。本文中档案云所提供的档案数据著录云应用主要是将传统的纸质文档转换为数字化档案,为之后的档案查询等其他操作提供基础。

基于上述系统设计策略,如图4所示,档案云服务提供信息处理,文档中转、发布和访问以及对各种格式的数据存储,如数据库、电子档案等。作为档案著录人员可以通过网络订制应用程序及防火墙的安全保护,访问档案云服务器提供的相应应用,进行数字档案的数据著录过程。作为数据著录管理人员的用户通过网络访问订制的应用程序直接访问档案云内部的节点,继而访问数据库服务器,对数据进行维护和审核。它可以实现文档一体化管理,大大提高了档案有效性,减少了工作量,避免造成档案归档过程中的信息丢失。

图4 数字档案著录云应用示意图

其主要工作流程是:多个数字档案著录人员通过网络并发地访问该云应用,进行数据著录,提交到档案云中心分类存储,提高了著录数据的有效性和完整性;同时,著录管理人员通过网络可以查询到已经著录成功的电子文档,对其进行审核,审核通过以后将数据存储,进行信息共享。该数字档案系统的正常运转提供完整的归档记录和数据存储支持,以及一个全新、开放、有效的信息收集空间,使得数字档案馆的信息资源价值最大化。

5.2 查询利用

档案借阅查询利用是信息利用和档案管理的重点和难点之一,它是一个数字档案馆发布数据、档案查询和使用信息资源的技术平台,主要包括档案查询借阅平台、库房管理平台,用以提供档案信息搜索、借阅申请、借阅管理、归还管理、催还管理、查询统计、图形化库房管理、库房出入库等功能。借助网络平台,实现对档案的查询、借阅、归还、统计、库房进行全过程管理,提高工作效率,方便档案的查询利用。

5.2.1 查阅管理

以简单搜索表单和分类导航页面为主要查询工具,面向浏览器用户实现简单查询、组合查询和分类查询等功能,并且针对不同的用户或角色,进行查询权限控制。云应用提供的自助查阅受理和服务主要有:完成档案利用者的在线注册、资格审核、档案查询、档案查阅审核、预约、借出和归还、催还等功能。

5.2.2 库房管理

主要是配合上述的查阅、查询管理和服务,提供实体档案的出入库管理、档案物理位置信息服务和档案库房温湿度、光照远程监控管理等功能。在库房浏览首页,将显示所有库房的整体排列,任意进入一个库房,将展示库房内部的排架布置图片,并显示库房名称、库房编号以及库房长和宽。继续选择,可以进入下一级排架展示图片,并显示排架条码、格子类型、规格与排架行列,同时也显示其上实际安放的档案。同时采用无线传输的方式将库房中档案出入库的管理信息实时地更新在无线终端上,方便库房管理人员进行档案存储和管理。

5.3 档案鉴定

档案鉴定就是鉴别和判定档案的价值,挑选出有价值的档案交档案机构保存,剔除无保存价值的档案予以销毁。用户通过网络首先检索需要鉴定的档案加入待确认鉴定列表中,检查待确认鉴定列表中的档案信息,确认档案是否需要鉴定。若需要则加入待鉴定列表,否则将档案从待确认鉴定列表中移除。档案的鉴定和鉴定审核结束后,对确定需要对外公开的档案自动公开,需要销毁的档案加入档案销毁列表,否则将档案驳回重新鉴定,并填写审核意见。通过对档案鉴定流程的控制可以更方便对数字档案进行公开和信息共享。

6 “档案云”具体实现

根据以上研究和分析,初步开发出来的数字档案馆的档案云平台,通过虚拟化软件对底层的物理服务器进行虚拟化部署和管理,构建小型数据中心,形成小型虚拟资源池。中层的云基础架构,则可以通过开源的分布式计算模型,来构建一种可扩展、高性能的数据处理体系,从而完成数字化档案资源建设的部署和管理等业务工作。而面向用户的云终端的桌面显示开发技术及相应的架构技术则可以通过网络编程技术完成配置和部署,建立个性化的云计算交互界面。

图5 “档案云”实现图

在档案云系统中,用户只需为自己所需要的功能付费,因此,该系统建立了档案云租户管理功能,统一规范了各种云应用的使用权限及计费方式。

7 结 束 语

将云计算理念加入到数字档案馆的服务中,提出了一个基于云计算的数字档案信息化平台的构建和运作模式。利用档案云的统一性、灵活性和开放性将有助于加速数字档案馆的建设进程,促进档案信息共享。目前该“档案云”系统已在某省数字档案馆试运行并获得一定成效,但是将云计算充分运用到数字档案馆中仍面临巨大挑战。

[1]马张华.网络信息资源组织[M].北京:北京大学出版社.2007.

[2]张建勋,古志民,郑超.云计算研究进展综述[J].计算机应用研究,2010,27(2):429 -433.

[3]刘振鹏,张宁,卞昭玲.云计算技术在档案馆中的应用探讨[J].兰台世界,2010(16):17-18.

[4]陶新权,孙青,王亚.云计算在图书馆中的应用[J].大学图书馆学报,2010(2):54-58.

[5]张叶红.“云计算”环境下图书馆信息资源共享模式初探[J].图书馆学研究,2010(11):30.

[6]王萍,张际平.云计算与网络学习[J].现代教育技术,2008(11):81-84.

[7]蔡学镛.漫谈云计算[J].程序员,2008(11):50 -51.

[8]Guangyou Xu,Yuanchun Shi.Pervasive Compute[J].Computer Learned Journal,2003,26(9):1042 -1050.

[9]Huai Jinpeng,Hu Chunming,Li Jianxin,et al.CROWN:SeviceorientedGrid Middleware System and Trust Management[J].Science in China(Series E:Information Sciences),2006:36(10):1127 -1155.

猜你喜欢
库房档案馆服务器
石化某库房建设项目的全要素管理要点
化学品库房施工组织设计分析
云南省档案局办公室关于表彰2018年度《云南档案》优秀通联组及发行先进单位的通报
通信控制服务器(CCS)维护终端的设计与实现
全省部分档案馆新馆掠影
中国服务器市场份额出炉
典当行库房被盗案
得形忘意的服务器标准
计算机网络安全服务器入侵与防御
when与while档案馆