数字档案资源整合新技术的研究与探讨*

2016-05-31 03:05任慧朋南京政治学院军事信息管理系上海200433
档案与建设 2016年2期
关键词:存储介质服务端数字

任慧朋(南京政治学院军事信息管理系,上海,200433)



数字档案资源整合新技术的研究与探讨*

任慧朋
(南京政治学院军事信息管理系,上海,200433)

[摘要]针对档案信息资源整合与共享中存在的问题,文章通过介绍国际最新的“Digital Vellum”数字档案整合方案,分析了如何通过云技术实现数字档案的集中共享,最后讨论了资源整合技术面临的诸多挑战。

[关键词]数字档案资源整合云技术

[分类号]G273

随着信息科技的不断进步,数字档案的资源总量迅猛增长,档案管理工作中遇到了很多难题,出现了软硬件技术更新快、存储介质不稳定性、存储格式多样化等方面的突出性问题,同时,由于技术发展和经济水平等因素,各个地区和国家间的文档格式和存储介质不能相互兼容,难以实现档案资源的整合共享,这将是数字档案整合需要研究的重要课题[1]。

1 数字档案整合存在的问题及实现意义

1.1存在的问题

1.1.1扫描复制阶段。在数字档案发展的过程中,人们不断尝试用高效的方式来复制和读取数字资源。目前常见的文字格式有DOC、XML、RTF和TXT;图像数据格式有JPEG和TIFF;网络图像查询格式有CEB和PDF。随着科技水平的不断进步,这些格式又发展出很多版本,而且兼容性不强,导致数字档案资源的格式标准非常杂乱,同时计算机存储技术发展较快,当前的计算机对很多陈旧的存储格式不支持(如5.4英寸磁盘)。计算机软硬件发展速度快是导致储存格式混乱的主要原因,某些存储介质往往需要专用的读取设备,而随着技术革新,很多提供相关技术服务的公司被市场淘汰,一些过去的数字资源面临着无法读取的局面[2]。

1.1.2存储保管阶段。数字档案的具体保存时间依存储介质的性能和保管条件而定。采用磁力存储方式的介质可存储的信息量较大,但稳定性比较差,保存时间不长。光盘存储的时间较长,容量也大,但对保管条件的要求比较苛刻。早期经常采用的3.5英寸软盘在常温状态下的最长保存时间为15年,目前普通光盘的最长保存期限为20年,数字胶片等存储介质的保管时间还要视保管条件而定[3]。

从表1中可以看出,各种存储介质各有优缺点,其中综合性能最好的是感光胶片,但其寿命、保存条件和保管风险等依然无法与纸质档案相比。数字化的档案资源较纸质档案虽有着高效、便捷、方便检索等优势,但数字资源具有着不易恢复的致命缺点,遭受损坏后复原的可能性不大。

1.1.3整合共享阶段。整合数字资源是档案界长久以来都想要实现的目标,但实现的过程中面临着非常多的难题,其中包括技术兼容、文化差异、知识产权等多个方面。资源整合是把相互独立的、多元异构的零散信息资源统一成资源整体,要实现这一目的,除去法律许可和标准规范等因素,还受到很多技术条件的限制,如硬件设备、操作系统、软件应用环境等,如果要实现共享还需要与资源所在档案馆建立信任连接,设定各方均认可的通信协议和参数,同时还要考虑语言互通等问题。

1.2资源整合的意义

1.2.1唤醒沉睡的档案

目前,对档案资源的信息挖掘主要依靠档案工作者,因其有紧密接触档案资源的机会,对特殊档案的信息处理还需要有一定的技术和知识背景。经过几十年的积累,数字档案的数量已经非常庞大,一些资源储存过久已经被海量资源所淹没,有价值的信息常处于被忽视的状态,仅凭档案工作者的力量和有限的技术很少能被重新开发利用,对资源的信息内容进行查询也将变得非常困难,有时甚至无法准确定位档案资源的保存位置。数字档案资源如果处于开放使用的状态,将有更多的人员和技术参与档案资源的开发利用,数字档案资源的价值会最大程度地体现,让这些沉睡已久的档案信息真正活起来[4]。

1.2.2延长数字档案寿命

数字档案的维护和管理需要资金和技术的投入,因此经济条件和政策原因也会导致档案馆的发展水平不均衡。保管条件是影响数字档案保管寿命的主要因素;软硬件的发展要经历技术变革和市场竞争等多个环节,这又直接影响着数字档案的技术寿命。对于陈旧数字档案的挽救工作,某些欠发达地区的档案馆因缺少维护资金的支持,将会导致一些数字档案资源彻底消失。云技术的应用使得存储维护更新的成本大幅降低,提高了综合利用效率,能够解决档案馆建设水平不平衡、技术资金匮乏和重复性建设等问题,延长数字资源的生命周期。

表1 各种存储介质的性能比较

1.2.3让资源流动起来

档案分类实现了资源的集中统一管理,而各种档案间的联系往往又是十分紧密的,例如历史档案与城建档案、财务档案与科技档案,在信息获取和认定的过程中是相互佐证的关系。对某历史事件的资料进行全面整理,一般需要对多个相关联的档案进行分析提炼,搜集分散的档案便成为最繁重的工作,档案馆之间的相对孤立会带来巨大的阻碍。档案资源的整合不只是档案馆间点对点的简单联合,需要建立统一的信息集中共享平台,统一资源的传输协议,规范数据格式和标准,实现资源在网络间的高速流转,从而节省大量的时间和资金成本,实现对档案资源的精确定位,提高综合查询效率和分析能力[5]。

2 Digital Vellum整合方案的设计分析

2.1整体架构

Digital Vellum方案,最早由谷歌公司提出,最初定义为“数字化羊皮纸计划”,其意在利用云技术整合不同来源、不同格式、不同历史时期的数字档案。Digital Vellum的整体架构称为Olive,它根据服务端、客户端和用户端的需求有区分地提供云服务。在资源客户端提供私有云服务,为档案资源存储提供足够的空间,支持各种版本的操作系统、读写软件和虚拟硬件设备,可同时在多个操作系统环境下使用资源;服务端为客户的档案资源提供磁盘的镜像备份,云端的备份实现了数字档案资源的永久保存;在普通用户端,通过Apache服务器提供Web浏览界面,支持普通用户通过网页的方式进行浏览和检索等操作[6]。服务端和客户端用Spice远程桌面协议的方式进行连接,这也对网络通信提出了更高的要求。

2.2资源提供端

资源客户端的构成主要有两个部分,一是私有云的搭建,需要根据客户端的实际需求确定存储空间和软硬件环境,有时私有云内会包含多个虚拟环境,必要时还要提供一定的模拟硬件设备;二是客户端与服务端的数据传输,有实时和离线两种方式[7]。在私有云的空间内实现全部资源的数字化存储,对老旧数字档案的分类归档等工作,在私有云与服务器间进行传输实现对资源进行镜像备份,这种传输可以采用实时的方式也可离线进行,Olive保证了即使在网络通信不畅的情况下,也可通过本地的私有云进行离线操作,正常通信后再自动进行增量备份。Olive根据不同需求合理地划分存储空间,可以实现高效的数字化管理,同时确保了档案资源的信息安全[8]。

2.3云服务端

服务端主要提供两方面的服务,一是对客户端私有云的磁盘进行云备份;二是提供查询、浏览等综合性的Web服务。服务端通过高速网络实现客户资源的备份,利用Spice远程桌面协议提供Web服务,针对不必要建设私有云的地方也可直接提供云服务,但对网络通讯质量的要求比较高。备份的方法采用的是制作磁盘镜像的方式,对资源进行增量备份,这种存储的好处就是通过云服务实现不可预见性灾难的恢复[9]。按照方案的预期,云服务端将拥有着巨大的资源,这些资源利用就是人类文明财富价值的体现,服务端可以通过云计算支持对整合资源进行分析应用,用最科学、简易、高效的Web方式来为用户提供信息资源服务。

2.4普通用户端

整合数字档案资源的目的就是为信息需求者提供高效的服务。目前对于普通用户来说,从档案馆获取资源的过程非常麻烦,首先要准确定位资源的具体位置,同时还需要具备一定的信息检索和计算机操作技能。Olive架构将这一系列的复杂程序简化,服务端将全部镜像盘的资源进行集中,经过标准格式的转化,通过Apache服务器提供Web的浏览操作方式,用户可以从服务端快速获取资源信息,无需具备相关的专业知识和信息检索技术,不必知道中间的处理过程,甚至不用了解信息资源的存储方式和具体来源[10]。

图1 资源客户端的虚拟机结构

图2 Web网页图像表示原理图

3 数字档案整合新技术面临的挑战

3.1设施和技术的支持

各个地区和国家的档案数字化水平极不均衡,需要的投入力度和技术支持也不同。云构架的建设工作需要大量的资金和技术支持,在整体的构架建成后又要考虑经费维持问题[11]。一方面需要从国家层面进行顶层的整体规划,在标准、存储格式、检索流程等方面进行集中统一,如果不能达到整体的规范化就很难实现与国际接轨;另一方面,在加大数字档案建设投入力度的同时,要考虑到档案资源开放的商业化,因为信息技术的发展日新月异,需要不断的经费投入作为支撑,只靠政策拨款将会很难维持,技术和设施的更新进程将会非常缓慢[12]。

3.2安全机制的建立

档案资源的整合是一项跨区域、跨国家的系统工程,对资源使用的合理性和可靠性要求建立严格的安全机制。首先要制定相关的法规政策,规范数字资源的使用与开发行为,在遇到信息安全事故的情况时能做到有法可依,在国际层面上,需要建立各国公认的公约条款,在安全防范策略方面达成共识,防止引发严重的信任危机。一些珍贵的历史资源大多存属于不发达的国家,这些国家虽有着悠久的历史文化,但与发达国家之间有很大的文化差异和政治分歧,因此建立世界范围内的安全机制共同体变得非常必要。

3.1知识产权的保护

数字档案数据库和纸质档案都受到知识产权的保护。知识产权一方面保护了档案资源的合法利益,但另一方面也在一定程度上促生了“信息垄断”。对档案数据库知识产权的保护难点在于保护范围的认定上,欧盟和美国采用了双重保护模式即著作权和特殊权利保护,其保护的范围相差不大。我国自加入WTO后对《著作权法》进行了修改(2001年10月),但是对独创性档案数据库的保护范围较小,对非独创性档案资源的保护尚处于空白阶段,与发达国家的保护范围有很大的差异,同时在“网络传播权”的划定范围上也存在巨大的差异。

4 结语

整合数字档案资源是必然的发展趋势,随着信息时代技术的革新,对数字档案的维护管理面临着诸多的难题,对呈数量级增长的数字档案资源,通过云构架的执行可节省存储空间和保管成本,实现资源的实时全寿命备份,确保了数字档案的存储安全,增强了数字档案的开放共享性能,但是在文化差异、知识产权、安全机制等因素上,数字档案整合的工作还面临着很多挑战。

*本文为国家社会科学基金项目“信息化条件下档案社会化媒体信息资源的整合路径与机制研究”(批号:15BTQ078)的阶段性研究成果之一。

参考文献

[1]Vint Cerf. Digital Vellum and the Expansion of the internet into the Solar System [EB/OL].[2015- 2- 11].Http://www.cmu.edu/silicon- vally/news- evente/dls/2015/cerfnews.html.

[2]中国科学网.第十七届中国科协年会国际科学大师论坛举办[EB/OL].[2015-05-24].Http://zt.cast.org.cn/n435777/n435799/n16364438/index.html.

[3]姜针针.数字档案面临的灾害及应对研究[J].兰台世界,2015(05):96.

[4]安小米,钟文睿,白文琳等.我国国家数字档案整合与服务研究现状及未来研究建议[J].档案学研究,2014(02):4-8.

[5]Buchel O,Sedig K. Extending map-based visualizations to support visual tasks:The role of ontological properties[J].Knowledge Organization,2011,38(3):204-229.

[6]Osinska V. Fractal analysis of knowledge organization in digital library[J].[EB/ OL].[2014-09-30].https:// repozytoriium. umk. pl/handle/item/467.

[7]Fagan J C. Usability testing of a large,multidisciplinary library database:Basic search and visual search[J]. Information Technology and Libraries,2013,25(3):140-150.

[8]郑然,李晶.我国图书馆、档案馆与博物馆数字资源整合研究进展[J].图书资料工作,2012(03):69-71.

[9]吴艺博.我国档案信息资源整合实践探索行为研究[J].档案学研究,2012(04):41-45.

[10]林丽群.数字档案信息长期保存的策略研究[J].广州工业大学学报(社会科学版),2011(02):78-81.

[11]蒋卫荣.论《中华人民共和国档案法》的立法定位[J].档案学研究,2012(05):30-34.

[12]刘祥麟.数字档案存储介质的发展[J].湖北档案,2007(10):20-23.

任慧明,南京政治学院上海校区军事信息管理系研究生,主要研究方向为图书馆学、档案学。

The Research on the New Technology about Digital Archives Integration

Ren Huipeng
(Department of Information Manegement of Nanjing Academy,Shanghai,200433)

Abstract:For archival information resources integration and sharing of existing problems,the paper describes the latest international“Digital Vellum”archive digital resources integrated solutions. We analyze how through cloud-based digital archives are centralized shared and finally discussed the integration of archival information resources faced the many challenges in future.

Keywords:Digital Archive;Resource Integration;Cloud Technology;Digital Vellum

[作者简介]

猜你喜欢
存储介质服务端数字
档案馆移动存储介质管理方法探讨
新时期《移动Web服务端开发》课程教学改革的研究
答数字
在Windows Server 2008上创建应用
一种使用存储介质驱动的方式
数字看G20
成双成对
医院环境下移动存储介质的信息安全管理
摸清黑客套路防范木马侵入
数字变变变