冯海英 赵秀敏
随着数字信息技术和互联网的快速发展、数字信息的扩散和数字环境的形成,我国文献信息服务正在全面进入数字时代,数字化图书馆是为了解决信息资源的有效利用,今年数字图书馆产生了大量的数字资源。数字图书馆的优越性使越来越多的图书馆热衷于建设数字图书馆。然而,图书馆购买的数字资源大多以年为期限的方式购买,如果合同终止大部分数字资源将不复存在,数字信息的长期保存也不够充分。数字图书馆不同于传统图书馆馆藏,它依附于现代计算机技术、具有很多不同于传统信息的特征,比如数字资源现有形式的多样性、存储信息的动态性、以及数字图书馆馆藏资源的多样性、访问媒体的复杂性等等。这些特点使得我们必须尽快寻找一种适合数字资源的长期保存策略。
1 数字图书馆信息资源长期保存的问题
1.1 数字载体的安全性
随着现代数字信息技术的发展,数字资源以前所未有的速度和规模不断地产生。世界上每人每年产生的信息量大约为500MB,其中绝大多数的信息以多媒体的形式存在,而印刷载体的信息量仅占总数比例很低。因此,数字图书馆所涉及的数据类型不仅包括文本而且也包括很多多媒体信息。由于多媒体信息占用了大量的存储空间,数字图书馆面临的数据必然是海量的,到目前为止,还没有任何系统遇到过这么大量的数据。因此,如何有效地保存和管理这些海量数据,使系统成本不高,系统响应快,是数字图书馆系统设计的重要课题。
在数字图书馆中,文献信息都是依附于存储介质存在。目前常用的存储介质是只读式光盘,一次性写入光盘,磁盘,可擦式光盘等等。这些数字信息的寿命完全取决于其物理载体的寿命。由于载体的不同,它们的使用寿命也不同,有的只有数十年。即使总的使用寿命可以达到很长的光盘与过去一千年的纸质文献相比,也是昙花一现。传统的资源载体可以通过观察其物理外观特征来判断其保存和使用状态。数字资源的载体需要使用相应的设备来检查其存储和使用。与传统载体相比,数字资源载体体积小、容量大,但载体容易劣化和损坏,易遭受毁灭性损失,对存储环境要求越来越高。在大容量高密度存储介质的情况下,存储介质的不稳定性增加,有效寿命降低。因此,载体问题是数字资源长期保存中需要直接面对的问题之一。系统升级、技术更新、信息迁移、格式转换等会导致信息读取和信息失真的不稳定。计算机网络的固有特性,如计算机病毒、网络危害、系统泄漏、黑客等,使得数字资源面临前所未有的安全问题。一旦数字资源被病毒侵蚀和黑客攻击,它们可能在瞬间消失。人为因素、环境变化的保护、停电和不可抗力因素(如战争、闪电、火灾等)会对数字资源造成不可挽回的损害。
1.2 数据迁移与重组等技术问题
技术进步导致数字资源所依赖的环境发生了重大变化,如硬件、软件和网络环境。如果数字资源本身不能随着环境的变化而及时演进,那么数字资源很可能处于新的环境中失去相应的数字信息。
迁移涉及底层数据的配置变化,其文献本身内容没有变化。当硬件和软件技术更新,意味着除非数据迁移到较新的机器中,否则数据不能再被访问。迁移通常涉及一些重新修饰,这回避了数据是否仍然像迁移之前一样传递相同内容信息的问题。数据结构越简单,内容就越简单明了。对于复杂链接的形式,比如网站等,很难看出如何能够毫无损失地复原它们,除非在结构上生成复杂的文档。
存储和数字化信息利用的技术体系和数字环境由硬件,软件和服务系统的限制。软件更新和技术陈旧是其中一个主要原因。阅读和理解需要数字信息的设备和软件,以及设备和软件的快速更新将使数字信息长期保存遭受技术过时的制约。与载体寿命的问题相比,更为紧迫的问题是阅读和检索数字资源的技术问题。数字资源的系统软件与硬件平台的依赖使数字资源的读出和恢复技术成为另一个阻碍数字图书馆的发展的因素。
1.3 顶层设计统一标准
数字图书馆目前缺少全国性的、统一的协调组织机构,公共标准的缺失是数字信息长期保存困难的根本原因之一。多年来,我国数字图书馆的研究重点主要集中在数字图书馆体系结构、信息组织与检索系统、信息显示与可视化、智能化等方面。中国的数字信息保存一直处于实验阶段,缺乏相关和广泛接受的标准。标准是缓解技术更新与数字信息阅读矛盾的良好途径,但很多行业标准严重滞后于发展需求。制定标准应广泛征求相关技术人员和管理人员的意见。不应该闭门工作或者只是听取少数人的意见,导致指导和规范每个行为的标准严重落后于国际发展水平。在实际工作中也大量存在标准兼容性和选择问题。不同的保存技术具有各自的优缺点,都符合各自的标准规范,但兩者如何统一运行是目前比较难解决的问题。作为要保存的数字信息,应以最稳定的技术和通用标准进行归档,并与相关行业标准和国际标准相兼容,这是我们首先要考虑的重要问题。
2 数字图书馆信息资源长期保存的策略
针对数字图书馆信息资源长期保存目前存在的问题,本文提出数字图书馆信息资源长期保存的对策和方法,从构建体系入手,多方面应对,从而建立综合治理的完整应对措施。
2.1 制定合理统一的政策
保护政策是数字资源长期有效保护的有效保障。这些政策包括技术、组织、人文、法律和权益管理。我们要加强国际和国内合作,可以参照联合国教科文组织发布的《数字遗产保护宪章》等法律法规来进行制定政策。
在数字资源长期保存中,宏观的规划、组织与控制是数字资源长期保存的基础和保证。数字信息资源是国家信息资源体系的重要组成部分,是建设网络化社会和知识社会的基础设施。因此,数字资源必须作为国家综合规划和研究的基本战略加以保护。把数字资源保护政策提高到国家水平,有利于各种资源的合理配置,从宏观上保证数字资源保护计划的有效实施。需要动员国家各方面的力量,取得政府部门在政策和法规上的支持,得到信息产业领域的帮助和科研机构的指导,还要充分与软件商、供应商等合作,才能使我国的数字图书馆信息资源的建设产生良好的预期效果。
在传统的图书馆中,文献的所有权和保存权是统一的,传统媒体的稳定性保证了馆藏的长期保存。数字资源创造者和出版商经常使用数字保护和其他保护措施来分发数字产品以保护版权。国家应该建成统一的数字资源的保存基地,要求数字资源出版商必须提供数字资源产品的样本,保证国家控制下的数字资源长期保存。规范和审查出版商的数字资源也是重要环节之一,采取全体协作战略能够充分提高效率,并且避免由于规范或者标准不统一所造成的数字资源损失。
2.2 国家持续资金支持
数字资源的保存和保护需要大量的资金支持。数字资源保存的成本可以分为两部分。第一部分包括人力资源、软硬件支持、保存环境的维护和日常管理;第二部分主要包括数字迁移的成本。前者的成本较容易计算,而后者具有很大的不确定性。由于国内数字图书馆资金来源渠道主要是政府部门,在数字资源保护规划时,必须充分考虑可持续发展问题,尽可能的增加资金来源渠道。如果没有一个可持续的资金来源支持,数字资源的保存将无法得到有效实施。
2.3 选择专业的保护机构
国外具有专业机构从事数字资源保存,承接专门领域或特殊形式的项目。主要出版商的数字资源大多委托荷兰国家图书馆数字档案系统长期保存。英国国家图书馆特定部门负责保存声音文件。从技术上讲,现有的数字迁移、技术保存等都有其特定的要求和条件,不同的数字资源具有不同的技术保存要求。我们必须充分考虑和估计这些因素,设立专业机构来从事保护特定的数字资源,这些结构可以承担政府项目,从科学研究的角度来保存特定的数字资源。
3 结束语
通过多种形式保存文献遗产对文明社会都具有重要意义。鉴于其重要性,以及需要长期建立和预测许多战略因素和成本,这是一个存在许多不确定性的领域。这涉及广泛的问题,不僅包括制度、设备、方法、技术等,还包括各国的经济、文化、法律等等。不同的应对策略有拥护者也有反对者,所以必须利用国家机制的力量,使数字资源的长期保存能够继续有效地存在。我国数字资源的长期保存尚处于起步阶段,在发展过程中还存在许多问题需要进一步研究。为了避免各科研院所的分立管理和重复,以及无法达到制约和值得信赖的状况,国家必须有效地指导和协调全国各主要科研和教育机构,科学分工、持续投入、安全备份、形成可持续发展。
(作者单位:吉林省社会科学院)