数字信息保存系统威胁比较研究

2012-04-13 09:12杨琳
河南图书馆学刊 2012年6期
关键词:存储介质数字信息数字

杨琳

(郑州图书馆,河南 郑州 450053)

1 数字信息保存系统威胁分析

作为数字信息保存项目的核心,数字信息保存系统无疑应当是数字保存项目的研究重点。然而国内外的研究现状表明,目前仅有几个项目提出了“数字信息保存系统”概念并进行初步的系统实现,对数字信息保存系统可能遇到的障碍及应对策略进行研究的项目就屈指可数。数字信息保存系统实现数字资源的长期保存的具体时间尚不明确,一般的理解是依据现有的技术和条件,能够实现的最长的时间。它要比单个存储介质或单个软硬件或信息的存储格式的寿命都要长。因此,为了实现数字信息“长期保存”的目标,笔者分析了数字信息保存系统的常见威胁,并结合实例总结提出若干应对策略。

1.1 技术威胁

数字信息保存系统在技术上面临三大威胁因素:一是存储载体不耐久;二是读写信息的计算机软硬件技术过时;三是数字信息的真实性。[1]

(1)存储介质易脆性:数字信息是存储在各种类型的物理媒体上的。它既可以承载于磁盘和光盘,又可以存储于网络服务器。由于数字存储介质的物理特性而天生不稳定,如果没有相适应的存储环境和管理,可能迅速破碎,引起诸如磁盘损坏、脱机媒体损坏等暂时性的或永久性的故障。

(2)技术老化:数字信息的长期可用依赖相应软件,而这些软件又依赖专门的操作系统甚至硬件系统,一旦离开了软硬件系统,数字信息的使用价值也就结束了。然而近二十年来经常性的技术变化引起了重大的技术变革,因此技术老化被大部分馆藏管理者看作是对数字存储的最大威胁。[2]

(3)内容真实性:与纸质环境相比,在数字环境中对存储内容进行改动显得更加容易。不论是故意还是无意所致,辩别数字信息的真伪已成为目前一个比较棘手的问题。

1.2 环境威胁

环境威胁因素[3]主要包括网络环境、组织环境及自然环境。

(1)网络环境:这主要指数字保存系统的外部网络服务(包括域名及URLs)可能会遇到暂时性的或永久性的故障;在某特定时间段内,网络可能会出现传输错误(传输失败或部分传输);数字保存系统易遭受公网上的病毒攻击。

(2)组织(机构)因素:组织机构的解体、破产或使命改变可能导致数字保存系统的技术丧失。遇到此种威胁,要么有后继组织接管,要么进行其他的合理处置。

(3)自然灾害:如洪水、火灾及地震等各种自然灾害都可能给数字保存系统带来意外故障。

1.3 其他威胁

其他威胁因素包括人为因素[3]、成本因素[3][4]及知识产权因素[5]。

(1)人为因素:这主要指计算机专家和操作人员两方面。由于计算机专家经常授权访问数字保存系统,就算将系统与外部网络隔离能够防止了外部病毒的袭击也难抵御内部攻击。操作人员的不良行为也可能造成暂时性的或永久性的系统故障。这种故障不仅可能发生在数字保存系统本身,而且也可能发生在操作系统、应用程序、硬件设施及计算机网络。

(2)成本因素:首先将数字保存成本与文献数字化的成本区分开来,后者只是前者的一部分。数字保存成本不仅大于文献数字化成本,而且与保存纸质文献相比,更易受到经费的影响,因为如耗电、带宽、系统管理、域名注册等一系列数字保存活动都需要经费作保障。

(3)知识产权:知识产权问题是数字保存面临的重要挑战,从数字信息的收集开始,知识产权问题就出现,而数字保存进程的每一个阶段又都与此息息相关,不可分割。但到目前为止,各个国家和地区都没有完整的数字保存知识产权法律,这不能不说是影响数字保存的重要因素。

2 数字保存系统威胁的应对策略

2.1 普通文本的“双套制”解决方案[5]

复制/拷贝又称数据更新,是在原来的技术环境下实时重写信息数据,将数据流从旧存储介质转移到新存储介质上,防止由于存储介质理化性能变化而引起的信息丢失。这种方法早就已经大量应用于磁带、磁盘、光盘的保存上。但这只是一项常规的管理工作,并不是真正解决由于计算机软硬件过时引起的长期保存问题。再生性保护技术指将技术过时的数字信息实时的转移到缩微品或纸上。由于缩微胶片存储量大、寿命长(其保存寿命理论值是500年,国际上已有100多年的实践经验,国内也有几十年的实践经验。)、便于保管、不再使用计算机软硬件技术读取,因此,它为长期保存数字信息提供方便,并且可避免计算机软硬件技术过时所带来的任何麻烦。于是,笔者认为数字拷贝和保存缩微胶片的“双套制”方案[6]为保存使用频率较低的纯文本信息,而不是声音、超文本、多媒体信息提供了一种最佳方案。随着所谓摄影技术和设备的发展,缩微胶片记录的模拟信息,能进入计算机网络系统,不用担心数字信息会失去它原有的数字风格。

2.2 技术仿真策略[4][5]

技术仿真策略是在实施拷贝保存数字信息内容的同时,制造一种能运行过时软硬件的软件,在这种软件中对某一过时的软硬件进行模仿,使得保存的数字信息能在模拟的软件上运行,这是一种延迟技术淘汰的方法。实际上这和“计算机技术档案馆”方法有关,由于保存有关软件版本和硬件设备的物理实体建立“计算机技术档案馆”对大多数保存机构来说都不现实,因此,人们更多的是详细描述数字信息利用和各种技术参数和环境条件,以便未来计算机系统可以模仿原始系统环境来读取和使用数字信息内容。技术方针策略使我们总可通过新的仿真器来仿真上一代仿真虚拟机,因此不必持续更新针对特定数字信息的定义语言、仿真说明、解释器等。从技术的角度来看是可行的,但在实际中它的兼容性并不可靠,仿真器自身的耐用性不稳定,所以笔者认为这不太可能是一直有效的方法,软件制造商也可能最终放弃某些软件的向下兼容性。

2.3 数字信息格式迁移策略[3][5]

迁移是持续地将数字信息从一种技术环境转换到另一种技术环境,意味着基于字符的数据可以从一个存储介质转移到另一个存储介质上,以进行数字信息的长期保存,同时,也可以将原始数据格式转换为独立于具体原始软硬件平台的标准数据格式,由于这些原始数据格式的开放性和标准性,可以保证总有相应软硬件系统来处理这些数据。这种方法维护了数字对象的物理形体,也保护了其内容存在,但可能无法保证其外观、功能和背景信息等,限制迁移过程中的各种损失是使用这种方法的关键,但它至少对于结构简单的单一文件是比较适用的。尽管各机构采用数字迁移策略,但具体实施办法又有所不同,有的是改变存储媒体(如再生性保护技术,笔者认为它是迁移策略的一种方法),这种方法主要用于保存使用频率较低的数字信息;有的是格式迁移(也是狭义的迁移策略),适于保存使用频率较高的数字信息。为了建立有效的数据格式迁移战略,需要对数字文献格式进行标准化处理,如澳大利亚国家档案馆采用了规范化方法,就是将各种数字信息存档为通用的XML格式,荷兰国家图书馆(KB)仅接受PDF格式的数字信息。

2.4 评估策略[3]

采用评估策略的原因有二:一是在获取数字信息阶段对获取的数字信息进行评估以检验其真实性;二是对保存特色文献的系统评估及时发现潜在故障,从而降低维修成本。

评估方法主要有第三方评估和互评估。前者是一种常用的评估方法,它是将被检索的系统内容样本与被检索的内容摘要及保存在其他系统内的内容摘要比较。如果先前的文摘是按SIP(递交信息包)处理的,那么就包含了元数据。如果系统能将检索到的SIP作为DIP(传播信息包)的部分或全部内容,那么系统就具备了端到端检测系统的性能。其不足是信息内容及原有文摘都以比特流的形式存在,可能会导致二者错误匹配。互评估对原有文摘信息不会产生风险。这种评估机制的优点是不必向评估人员泄露信息内容;不足之处是不能进行端到端的评估。两种方法各有千秋,于是笔者认为二者恰当的结合对于数字信息的长期保存更是相得益彰。

2.5 经济策略[3]

保存数字信息要比纸质文献的成本高。数字保存系统的运作过程可分为获取数字信息及相关元数据、保存及发布数字信息三个阶段,每个阶段都有其成本构成。

首先,获取阶段的成本有获取数字信息的产权许可费用、获取数字信息费用及相关元数据的费用三部分构成。其次,保存阶段的成本有三部分构成:购买并持续更新软硬件的费用;业务成本如电力、带宽、员工的时间及评估成本;格式迁移成本。最后,发布阶段的成本有两部分构成:保存数字信息协议条款中规定的费用以及向授权用户发布数字信息的费用。前者主要指认证系统的管理成本,如引导用户进入和退出系统及监督有关出版机构的管理费用;向授权用户发布数字信息的费用一般都很低,主要指操作web服务器和带宽的花费。

根据以最小的投入获得最大的收益这一经济学原理,数字保存系统的主办机构在经费有限的情况下,就必须考虑以最小的成本投入保存更多的信息资源,并降低保存风险。笔者所说的经济策略主要指降低获取和保存阶段的成本。主要措施有:采取保存本单位拥有版权的资源,健全版权许可法律体系等措施来降低产权许可费;通过对获取过程及评估系统实施自动化管理来降低获取数字信息的成本;通过采用机器自动生成元数据或从数字信息创建者那里获取数字信息时一起获取元数据来降低获取元数据的成本;由于对数字信息实施单独管理或将数字保存系统与其他基础设施集成管理降低业务成本的方案风险性高,因此尽量使操作人员参与系统操作;采用适当的转移方法来降低格式迁移成本。

2.6 健全数字保存法律规定,建立全国统一的数字信息归档系统[5][7]

目前,一些传统的图书馆、档案馆与其他文献收藏部门,开始收藏数字文献,并提供网上浏览与借阅,但这些传统图书馆包括发达国家的数字图书馆,都没有把数字信息长期保存纳入其职能范围之内。这样,就使得一些在网上流动的、未被收容的、有价值的信息,在当前技术情况之下无法长期保存。因此,有必要建立一个全国数字信息归档系统,使之对全国文化、经济、科技、社会等领域的数字信息的存贮和存取承担管理责任,使之成为我国数字信息的资源基地。

法定保存是解决数字保存面临的知识产权问题的首选方法,而且它为数字信息归档系统提供了强有力的资源保障。各国采用不同的方法实施法定保存,英国采用法律条文规定,澳大利亚采用法律覆盖和自愿收集的混合法。笔者认为建立数字信息呈缴本制度具有可行性,因为印刷文献的呈缴本制度在各国广泛实施,成功地解决了印刷文献长期保存的知识产权问题,对于人类文化遗产的长久传承发挥了关键作用。由于数字信息的真伪难辨,数字信息的呈缴本制度可能会比印刷文献的呈缴本制度实施方面具有一定的难度,但在丹麦、芬兰和挪威等少数国家已有先例存在。当然,解决知识产权问题的方法还有法定许可等措施。

3 结语

每种新技术都是一把双刃剑,所有的技术解决方案都不是尽善尽美的,只是部分地解决了问题,因此,笔者建议选择数字保存系统的风险防范策略时,要根据选择技术方案的要求和标准[6](保存什么、为谁保存及怎样保存)来选择最理想的技术解决方案。

[1] 郭瑞华.数字信息长期存取策略研究[J].情报理论与实践,2002(2).

[2] Hedstrom,M,Montgomery,S.Digital Preservation Needs and Requirements inRLGMember Institutions.RLG website.http://www.rlg.ac.uk/preserv/digpres.html.

[3] David S.H.Rosenthal,Thomas Robertson,Tom Lipkis,Vicky Reich,Seth Morabito.Requirements for Digital Preservation Systems:A Bottom-Up Approach.D-lib Magazine 11,11(Nove.2005).

[4] 朱烨.数字保存中的技术、组织及法律因素分析[J].图书馆学研究,2005(4).

[5] 宋显彪.数字信息的长期保存[D].硕士学位论文,2005(4).

[6] 颜晓栋.保存数字信息技术方案选择与评价[J].档案管理,2003(1).

[7] 张绍武.数字信息长期保存的策略[J].现代情报,2002(4).

猜你喜欢
存储介质数字信息数字
北京尚水数字信息产品介绍
数字有形状吗?数字信息精确性和品牌标识形状的匹配效应*
档案馆移动存储介质管理方法探讨
答数字
一种使用存储介质驱动的方式
数字看G20
成双成对
数字信息时代图书馆职业权利缺失与回归路径
网络环境下数字信息产品定价策略
医院环境下移动存储介质的信息安全管理