赵春辉
(中原工学院图书馆,河南 郑州 450007)
基于云计算环境的数字档案馆发展机遇研究
赵春辉
(中原工学院图书馆,河南 郑州 450007)
文章在介绍云计算和数字档案馆概念的基础上,重点剖析了云计算技术在数字档案馆建设中的优势,最后概述了目前云计算技术在数字档案馆建设应用中存在的问题及改进对策。
云计算;数字档案馆;信息资源
云计算被称为继计算机、互联网之后的第三次IT领域的革命浪潮,而IT领域每一次技术革新都会极大地改变着人类的生产生活方式以及商业运营模式。云计算作为一种新型的计算机技术,具有网络分布式、大数据存储、服务远程化、资源共享化、功能开放化等优势,将其应用到数字档案馆的建设及服务中,为数字档案馆资源共建共享、信息知识服务等功能的拓展与升级,提供了技术条件和应用空间。
1.1 云计算的内涵
云计算,又被称为云端计算,是基于计算机技术、互联网计算、通信技术而产生的一种新的计算方式,这个概念的最初起源来自2006-2008年间Dell的数据中心解决方案、亚马逊EC2产品和Google-IBM分布式计算项目,之所以成为“云”技术,很大程度上因这些项目与网络的关系十分密切,而“云”在很多示意图里面是表示互联网的,云计算的原始含义即将计算能力放在互联网上。经过十余年的实践应用及理论升级,云计算技术已经广泛应用于互联网应用服务的各个行业的方方面面,并在很大程度上引导着互联网技术的发展方向。
通过搜索引擎检索“云计算”的概念,可以得到多种解释,不同行业、不同领域、不同专家对其解释也是仁者见仁智者见智,至今,有关云计算的基本内涵仍无统一的定义。如中国云计算专家委员会主任委员李德毅从资源整合的角度提出了云计算的内涵,即对数据资源、计算资源、存储资源、软件资源等组成的资源库,进行互联网或物联网加工,使其成为广大用户便于获取、共享、扩展的虚拟资源[1];国际知名竞争情报领域专家Peter Fingar则从纯技术角度定义了云计算的概念,即包括网格技术、公共计算技术、对等计算、自主计算、远程技术等在内的技术组合体[2];而较为权威的美国国家标准技术研究所(NIST)的定义:云计算是一种资源配置及使用模式,是对可供配置和共享的资源如服务器资源、存储资源、应用和服务资源,提供一种方便、快捷、实时、个性的网络访问的平台[3]。
对于非专业人士而言,云计算的概念略显抽象,但从实践应用的角度来说,云计算之于行业应用的优点是十分突出且一致的,即①规模性:云计算突破了原有的单机或局域互联,它是由不同规模的计算机集群组成的,具有强大的存储和计算能力。②易用性:云计算帮助企业或行业实现了粗放型向集约型的升级,使分散式、高耗能的运营模式成为过去,在很大程度上节约了用户的服务获取成本。③灵活性:云计算环境下的资源共建、共享、配置有利于进行有机整合,按需调整,用户可根据自身需求动态实时增减资源配置。④虚拟化:云计算本是一种基于共建共享理念的技术平台,它允许多个用户参与和共享,但又无须了解各种资源的存储位置和加工过程,虚拟化的工作模式大大降低了使用成本。⑤计量化:由于云计算模式所提供服务的系统性,其服务内容更加透明化,即易于监测、分析、评估,用户只需按需购买即可,极大地避免了资源闲置与浪费。
1.2 数字档案馆的内涵
数字档案馆的概念,多数学者认为其已经突破了简单的档案数字化或档案信息化的范畴,更多的是通过计算机网络和通信网络形成的一种信息平台,通过这个平台可以实现电子文件的系统化、集成化、有序化的加工、利用和管理,并最终实现电子文件的完整性和持久性,简单来说,数字档案馆就是一种超大规模和分布式的数字档案信息处理系统。当然,部分学者的观点与这种“系统论”的内涵略有不同,他们认为数字档案馆的重心不在于技术,而是一种信息组织模式,技术需要不断升级换代,但组织模式则是引导档案馆创新升级的精髓所在,因此,他们强调数字档案馆“其实就是一种基于计算机技术和通信技术的虚拟信息中心,这个信息中心突破时空限制,更好地为信息提供者服务”。
两种观点虽然从不同角度剖析了数字档案馆的内涵精髓,但都离不开对通信技术、建设模式、管理模式因素的概括,因此,数字档案馆是尤其固定的本质特征共识的:首先是资源数字化,数字档案馆中数字资源取代了传统的纸质档案资源,不但便于查阅、传递、共享、利用,更便于其长期保存和图谱分析,呈现出了大数据的优势;其次是资源的网络化,正如上所说,数字化加工后的档案资源由于其基于的信息网络平台,使得档案信息更易于流转和共享,用户获取档案信息的难度和成本大大降低,而且这种客观资源网络不会随着时间推移而发生结构性变化;第三则是其管理的自动化,数字档案馆不再依靠传统的人力分类、编排、调取等步骤,很大程度上靠预先设定的计算机程序实现自动化管理,大大降低了人力成本,提升了运行效率[4]。
综合以上观点,可以看出,数字档案馆其实就是一种依靠网络技术和通信技术而打造成的网络虚拟图书馆,其依靠高度电子化的技术运转使得档案资源数据库的服务行为呈现出极大的便捷性、低耗性、增殖性。
自2008年云计算开始进入国内相关领域,一直到2010年,在国内的行业应用进入高峰期,云计算的尝试至成功再至成熟的案例日渐增多,获得了行业人士和专家学者的一致认可。在这种大环境下,档案界也可是尝试抓住这个契机实现转型,即开始分析尝试如何根据自身需要选择性的将云技术和日常业务甚至增值业务结合起来,通过档案领域的数字化和网络化建设,在提升工作效率和改善工作模式的同时,提升档案行业的服务水平。
从资金投入角度来看,云计算可以在很大程度上减少数字档案馆建设中的IT投入,数字档案馆建设如同其他领域的业务数字化建设一样,需要大量的包括服务器、计算机、数据库等方面的软硬件投入,同时后期的升级维护和人员配备成本更高,一定程度上制约了数字档案馆的建设宗旨。有了云计算技术,数字档案馆的建设可以更多地交给专业的云服务提供商去做,通过这种“半外包化”的运营模式使档案馆工作人员从日常的设备建设、升级、管理中解脱出来,更好地为用户服务。这种运营模式下,专业的云计算服务商通过专业的技术和服务人员帮助档案馆建设人员弥补了较多的技术短板,而档案馆建设人员只需要采集用户需求并将其转变为可操作的组织模式,这样有的放矢的建设、管理和服务模式自然会节约很多无用的和重复成本,从而降低了服务开销。
从资源存储和共享角度来说,云服务的提供商自身往往会拥有庞大的云计算服务器集群,不但能够为数字档案馆建设主体提供海量的信息存储空间,而且在很大程度上保证了数据的稳定性和安全性,基于安全技术和专业团队的信息管理系统,在数据备份恢复、抗灾难能力、权限管理等方面拥有较大的优势。同时,云计算的自身优势可以在信息平台搭建之初就避免了资源限制、资源重复、信息壁垒等问题。通过各种信息资源的集成分析,各数字档案馆的资源可以轻松地实现共建共享、空间存储、资源互借等集成化功能,使以往数字档案馆建设中的信息孤岛不复存在[5]。这种基于大数据和共享理念的档案信息资源服务模式,更能体现当下的信息用户需求,提高档案资源利用率。
从利用成本角度来看,基于云计算的数字档案馆的开放化服务使得用户的信息资源利用成本大大降低,而且更能够根据不同用户或用户群需求实现有的放矢的个性化服务、定题服务、知识服务等,恰恰体现了“用户需求为中心”的建设思路。另外,云计算的终端易用性能够更好地提升用户体验,使其只需通过易掌握的终端入口利用云环境下的分布式数字档案馆资源,即一旦用户通过终端提出自身需求,云计算平台会根据用户意图最快最优地将检索结果呈现到检索界面,大大降低了用户的时间成本和经济成本。
从增值服务角度来看,基于云计算的数字档案馆不仅可以实现传统的信息传递、联合加工、资源共享等增值服务,还可以实现更高层次的信息服务,如数据挖掘和知识服务。云技术的一大特点便是其集成化和系统化,基于这种技术环境下的信息资源可以更好地实现联合发现和知识挖掘,进而向用户提供更好的新智力要素的知识服务,提升用户的知识创新能力。当然,愈实现这种增值性的知识挖掘服务,需在数字档案馆建设之初就进行分布式、结构化的资源组织处理,通过初期的数据分析、标引技术以及网格化技术等将庞大的计算机程序拆分成可以自主结合的子程序,进而建立起强大的数字处理和运算中心,从基础平台上为数字档案馆各种增值服务的开展提供标准和技术。
3.1 数字档案馆建设过程中的权限及涉密问题
对于不同档案馆的信息资源来说,一般都是有保密要求或者保密期限的,将这些资源全盘放到云计算平台上,需要对公开的对象有特定设置,如保密权限的时间设置、特定访问人群的修改等,而有的资源则是对所有用户全面开放的。所以,这就产生了一个问题,面对庞大的数字化档案资源和用户,如何根据用户需求和自身保密需要,定时有机地设置访问权限,且尽量避免权限混乱以及由此带来的信息泄露等问题。
3.2 数字档案馆中技术层面的安全保密问题
因为在云计算环境下,数字档案馆的资源数据并不是保存在本地服务器上,而是保存在云计算处理中心的数据处理中心,一定程度上存在着档案信息的安全保密隐患。目前,大多数云服务提供商均在数据传输环节加大了数据加密力度,最大限度地降低了信息安全隐患,但在用户存储和日常处理环节的加密保护问题仍然存在。因此,如何在数据意外丢失、损坏,非正常收集、传递、利用,以及提升数据抗风险和数据恢复能力,则是目前云服务提供商需要重视的问题,它不仅涉及到云计算方面的技术性问题,还需要保证在不影响档案馆服务提供方和用户使用的情况下来实现。
3.3 档案馆资源数字化过程中的资源版权问题
因为按照云服务的服务理念,各档案馆间的信息资源是需要按照相关协议进行共建共享的,这样才能最大程度降低档案馆运营成本和用户的使用成本,但这种无边界的共享协议也必然会涉及版权问题。目前,关于档案馆各类型资源的版权争议解决方案尚无官方版本,大多仅是自发形成的一种协议处理文件,面对需要诉诸法律的版权争议的时候显得力不从心。因此,有关云服务环境下档案馆信息资源的版权保护亟须配套相应的解决方案,方便用户使用档案信息资源的同时,也降低用户可能遇到的版权壁垒,更好地提升云服务在数字档案馆建设中的合理合规性[6]。
3.4 不同协议环境下的统一接口问题
在云计算各服务提供商之间,目前并不存在统一的介入标准,不同档案馆在数字化接入“云端”的过程中,从计算机、服务器、文件格式、传输方式及协议等多个方面千差万别,这就产生了一定的接口障碍。云计算服务提供商的单一接口难以满意不同类型档案馆数字化建设的需要,导致很多时候的数字化接入云端服务心有余而力不足,因此,云服务提供商需要针对不同类型的资源操作平台,有针对性地开发相应的接口插件,以提升其灵活性来面对不同的云服务终端。
云计算服务的价值精髓并非其技术本身,而是在于基于这种技术能够使相关行业先进的服务理念及模式得到实现的可能,节约建设和服务成本的同时,进而将信息资源的共建共享理念深入人心,使得大数据和超共享得到实践和拓展。当然,要融入数字档案馆的云共享体系中,还需要在技术、模式、法律、标准等多方面进行改进。
首先,需要不断提升安全保护技术,以保证各类档案数字资源的安全存储,如服务等级协议、访问策略控制、存储访问日志、数据定期备份等均是需要云服务提供商需要开发或完善的基本功能[7]。其次,针对不同类型用户,需要差异化访问权限,以更好的保证用户隐私,如将管理员权限和密匙管理者权限分离以防止非法授权访问,再如建立起即时的数据销毁机制,即当用户进行数据删除后,云端服务器也定期进行清理以防止被非法恢复进而泄露;最后,需要不断完善建设和服务标准,以消除资源共享壁垒,这就需要成立相关的数字档案馆云服务的协调或监督机构,不但在建设之初就统一其各技术标准,减少后期重复建设成本,同时,还可以协调处理各档案馆数字化资源共建共享中出现的各类争议和问题,并对其服务效能进行科学评估,以更好地提升云服务水平。
[2]黄正鸿.云计算在档案信息化领域的应用启示[J].中国档案,2011(5).
[3]贾聪聪.浅谈云环境下数字档案馆的建设[J].兰台世界,2015(1).
[4]刘伟谦.云计算在档案馆中的应用模式初探[J].档案学研究,2012(2).
[5]黎春兰,邓仲华.云计算下的信息资源共享研究[J].中国信息界,2011(12).
Study of DigitalArchivesDevelopmentOpportunity Based on Cloud Com puting Environment
Zhao Chunhui
(Library,Zhongyuan University of Technology,Zhengzhou Henan 450007)
Based on the introduction on the conceptof cloud computingand digitalarchives,thearticleanalyzes the advantages of cloud computing technology in the construction of digitalarchiveson focus;finally summarizesthe existing problems in the construction of digital archives based on cloud computing technology and puts forward some countermeasures for improvement.
Cloud Computing;Digital Archives;Information Resource
C39
A
1671-0037(2015)12-82-3
2015-11-28
2015年河南省档案局科技项目“基于云计算的数字档案馆信息资源服务研究”(2015-X-16)。
赵春辉(1983-),男,硕士,馆员,研究方向:信息咨询。