李金莲
(绍兴县图书馆,浙江 绍兴 312030)
目前我国文献信息服务正全面进入数字化网络化环境,各个文献信息系统已经采购和生产了大量数字资源,广大用户也日益依赖数字化资源和网络化服务。但网络环境的不确定因素和复杂的国际环境,对数字资源的安全提出了严峻挑战。在此情况下,我们必须充分保障这些数字信息资源能够长期、方便和稳定地被广泛利用,保障在收集、采购或生产这些资源时同时获得必要的法律授权、技术知识和经济安排,拥有可靠的永久使用权。保障即使在特殊情况下广大用户仍然能够方便、可靠、稳定地获得和使用这些战略性信息资源〔1〕。而要实现这些保障,就必须实施数字资源长期战略保存工作。
由于数字资源长期保存是一项复杂的系统工程,单独的某个机构根本无法解决所有的问题,需要包括政府、图书馆、商业组织等在内的各个组织机构的通力配合。为了更好地促进数字资源的长期保存工作,从整体上进行宏观规划、组织和控制,需要采取相关保存对策。这些对策应考虑以下内容:
数字资源包括以数字方式生成的或从现有的模拟资源转换成数字形式的信息。数字资源的形式多种多样,而且日益增多,包括文字、数据库、静止的和活动的图像、声音和图表、软件和网页等。它们存在的时间一般不长,需要有意地制作、维护和管理才能保存下来〔2〕。但并不是所有的数字资源都需要长期保存,我们需要建立一些评估指标确定资源的长久价值和意义后,选择性地进行长期保存。这些指标包括:①资源本身的当前和长期使用价值。②资源本身的长期战略意义。③资源的不可替代性。例如某些资源在类型、内容和产生演变过程上具有唯一性,而有些资源有许多交叉重叠资源或派生衍生资源(例如部分文摘数据库或者全文数据库对应的印本资源)。④资源使用渠道的不可替代性。例如有些全文期刊可以通过出版商、集成商(甚至多个集成商)以及文献传递服务商等分别提供,但有些则只通过唯一的出版商或服务商提供。⑤资源保存的合法保障程度。例如能否获得长期保存以及持续使用的授权和许可等。
数字资源的长期保存首先是保证用户能够长期可持续地、方便及时和充分有效地使用这些资源。根据这个目标,长期保存机制不仅保存数据,还要“保存”数据的可使用性,而且这种可使用性必须做到方便及时、充分有效。因此,数字在长期保存中必须要求:①保存数字比特流,通过对存储媒介的保护或迁移,确保其中的数据能被准确完好地读出。②保存数字格式与处理信息,通过保存有关数字信息编码、格式、标记、结构、压缩、加密等方面的技术方法信息,确保能够识别和解析数字信息内容。③保存数字信息处理环境,例如相关的软件甚至硬件系统,确保能拥有相应的技术工具来识别、利用数字信息。④保存数字信息的内容校验、身份认证、版本演变、知识产权管理机制,确保能可信赖、可靠和合法地鉴别使用被保存的数字信息。⑤争取部分或者全部保存数字信息的知识组织体系信息、组织利用环境。⑥保证数字资源的完整性和可使用性,在资源一旦不能使用时通过其它方式能够及时向用户提供基本相同的服务。
同时,数字资源的长期保存还必须保证其本身的可持续性:法律上的可靠保障、技术上的充分支持、经济上的低成本性、管理上的方便性等。
数字资源长期保存是一项费用高、耗时长、多层面、跨领域的工程,需要政府部门、创制者、出版商、相关企业和机构进行持续不懈的努力。鉴于此,根据数字资源重要性、保存荷载能力、技术系统成熟程度以及系统资源能力,建立分布式长期保存网络,即一个由多个异地分布的长期保存系统紧密耦合而成的虚拟组织,以促进实践中的资源共享、职责与费用分摊以及交流等。积极鼓励众多机构参与,重视合作机制的建立。数字资源的长期保存研究和实践必须以国内和国际合作为前提,国家图书馆、各类高校图书馆、档案馆、研究所、出版机构、政府及软、硬件商都在研究项目中充当不同的角色,发挥着不同的作用。
这种保存网络的功能主要体现在:首先,有助于从整体上协调组织,形成数字资源长期保存布局的合理性。具体来说,在学科内容上,避免出现不必要的重复保存,避免因信息缺乏造成某些内容方面的遗漏;在地理分布上,避免造成服务提供的死角;在经济和技术保障力度上,避免长期保存责任者与数字资源对象组配的失误等。其次,借鉴以往和他人的相关经验和教训,尽可能使自己在长期保存决策制定和方案实施中避免某些失误。第三,展示数字资源发展现状与动态、长期保存发展现状与动态,帮助管理协调者、具体责任者等进行对策研究和制定等。
构建一个保存网络,其成员在研究领域、工作部门、机构性质等方面必然存在差异,如何合理分配成员职责显得尤为重要,因为这会极大地影响到今后长期保存的有序发展。
首先,需要对参加机构的资格进行审查,确立审核标准、审核主体是一个重要问题。它们的选择至少涉及以下因素:①资源保存责任的不可替代性。例如有些资源在国内就没有别的单位采购,有些资源虽然有别的单位采购,但这些单位没有保存责任或保存能力,而有些资源的采购情况则相反。②资源保存责任的可分担性。例如有些资源是由几个系统联合采购的,因此可以考虑分担保存责任、合作保存、委托保存等,但需要解决相应的授予非保存方使用权利问题。③资源保存责任的法律安排。例如有些数字文献资源可能会通过法律或行政制度的安排授权特定单位进行长期保存。例如国内电子图书可以授权由国家图书馆长期保存并在特殊情况下提供公共服务,又如重点数字文献资源可以被要求授权共同信赖的第三方长期保存。④资源保存能力的可负担性。例如有些资源的长期保存(尤其是在保证能及时方便使用的条件下)可能需要太大的负担。
其次,根据承担任务的不同,可将资源长期保存的各实体进一步划分为保存责任者、存储管理者和服务者。①保存责任者承担着计划、安排和管理保存工作并对保存工作直接负责的责任。包括计划管理责任、组织协调责任、协商和质量管理等。②存储者的责任包括资源的接受管理,资源的检查、维护、监控、备份,用户的管理等。③服务者是实现数字资源使用价值的桥梁,是服务权的承受者,也是使用权实现的主要支持者。服务者的责任主要包括启动服务、保证服务质量和进行使用管理等。同时,要对资源提供方和授权用户的责任进行划分。
再次,要建立长期保存责任者的规范流程。数字资源的长期保存,可能由中心机构承担,也可能由某个成员机构承担,还可能委托第三方保存服务商承担,在合作保存时还可能委托另一个文献情报机构承担。建立明确的保存责任者责任规范,可以明确规定责任者在组织上、操作上和管理上的各项责任,同时选择评价可信任的长期保存责任者的认证程序和已承担保存任务的责任者的检验程序。应该采取必要措施吸纳第三方力量来参与对可信任责任者的认证和检验。
在数字资源长期保存中,标准化是以为公共接受的标准来进行数字资源的存储、描述、组织与检索。数字资源长期保存涉及的技术标准主要包括:长期保存元数据、数字资源唯一标识符、文件格式、信息模型、存储空间技术规范等。这些标准应该采用国际和国家标准,例如在系统架构上遵循OAIS参考模型,在元数据上采用成熟的开放标准(例如各种长期保存元数据、METS封装机制等),在数据格式上可借鉴《数字图书馆标准规范建设》项目推荐的开放格式标准,在保存系统的利用机制上可参考《数字图书馆标准规范建设》项目推荐的开放的检索与搜索协议。这些标准规定了数字资源长期保存的术语、概念和参考框架,确定了一个存档系统的基本功能,提出了一个管理数字对象和信息包的信息模型。这些开放的技术与标准将更大程度上消除其更新对数字资源保存所带来的不利影响。
以国家法律形式规定数字资源的作者向保存机构提交一份备份以利永久保存。一旦资源拥有者因种种原因无法再提供时,保存机构可以公开此数字资源供大众使用,这样既能延续学术的完整性又可传承文化。但是在网络环境下,数字资源的缴存正面临着一些法律上的困惑:一是缴存客体不仅是各类正式出版的文献,还有大量由个人或者机构依托互联网络自行创作并传播的作品如网络小说、学术论文预印本、教学课件、网络数据库等在线作品,这样就突破了传统的出版概念和模式,使出版物的含义变得模糊不清,因而很难将这些非由出版机构出版、非经传统出版渠道制作和发行的作品直接纳入缴存范围而依法征缴,且其作者亦无缴存之法定义务。二是互联网络的出现和普及、国际数字产品生产商的跨国经营以及有关版权保护的国际化,也使得数字产品国籍的确定更为困难。在此情形下,依据国内法律建立的缴存制度很难适用于在国外创作或者制作的数字作品或者产品。法定缴存制度的域外效力受到了严格限制。三是像数据库一类的电子出版物由于发布前高昂的制作投入和其产品低廉的复制及传播成本也使得版权人对其作品的控制能力大大降低,出于商业利益考虑,出版商也不愿意将此类数字产品无偿缴存和免费使用。因此,在这种情况下,只能通过平等协商、自愿缴存的方式实现数字资源的缴送和保存。
在数字资源长期保存中,法律是一个很复杂的问题,主要涉及版权法、合同法、缴送制度等等。在数字资源生命周期的每一个阶段中,都需要考虑到知识产权及相关的法律问题,包括:数字资源的收集、存取与保存的法律问题;数据转移时的法律问题;模仿过时软硬件的知识产权问题;为长期保存电子出版物而必须去除出版物中的一些壁垒(如密码、IP控制、阅读器捆绑等)等所涉及到的法律问题。建立数字资源著作权交易中心,可以全权负责资源著作权的保存与合法使用,一方面确保数字资源的永久保存与取用,另外一方面也可以确保合理使用与相关权益〔3〕。
数字资源的服务主要集中在网络上。网络安全问题与网络本身固有的特性有关,所以网络环境的复杂性决定了网络安全的复杂性。因而数字资源极易受到外力的干扰和破坏。数字资源在受到计算机病毒、黑客入侵、磁场、电磁脉冲等的打击时,其对数字资源的破坏程度,类似于图书馆遭遇一场火灾或地震〔4〕。因此,基于危机管理思想,保存机构应该采取数据备份、系统软件备份以及责任体系备份等多重方式,逐步建立安全的长期保存体系。具体实施数字资源安全管理可从以下五个方面着手:①采用社会法律、法规手段,建立安全管理标准和规则。②加强用户认证。用户认证在数字信息的安全中属于技术措施的第一道大门,主要目的是提供访问控制和不可抵赖的作用。用户认证方法按其层次不同可以根据用户持有的证件、用户密码、用户特有的生物特征三种因素提供认证。③授权。这主要为特许用户提供合适的访问权限,并监控用户的活动,使其不越权使用。④加密。加密是信息安全应用中最早开展的有效手段之一,数据通过加密可以保证在存取与传送的过程中不被非法查看、篡改、窃取等。⑤审计、监控和数据备份。保证数字信息的安全,重要的是国家或部门应当制定一个备份机制与规范,对记录的备份规范时间要求、格式要求与份数要求予以规范。备份规范也要考虑不同的工作环境,例如信息中心就应当要求进行时时备份,以防当前数据的丢失。对于数字记录保存部门,应当规定定期备份。
建立数字资源长期保存评估体系,就是从数字资源保存的内容、结构、管理、安全等方面进行综合评估。其中包括数字资源长期保存的内容与保存授权协议规定的状况是否一致;数字资源在内容、结构、背景信息、元数据等方面是否完整无缺损;数字资源是否具备可读性和可利用性,包括信息的可识别性、存储系统的可靠性、载体的完好性等;数字资源是否安全无病毒、不易受攻击和篡改等。
数字资源的保存需要大量的资金投入,如果没有一个可持续的资金支持体系,数字资源的保存将不可能得到有效实施。一般来说,数字资源保存的成本可分为不变成本和可变成本两个部分,前者包括人力资源、软硬件支持、保存所需环境的创建维护及日常管理等,后者主要包括因技术过时所需的数字迁移或数字仿真的费用。前者的费用较易计算,而后者则有很多不确定性。由于国内保存机构资金来源渠道单一(主要是政府),因此在规划数字资源保存计划时,要充分地考虑到可持续发展的问题,寻求多方的支持〔5〕。
随着数字资源长期保存实践的广泛开展,越来越多的研究和工作人员参与到长期保存活动之中,这就需要相应的教育与培训。要充分发挥高等院校的作用,着力培养相关人员的创新精神和实践能力。坚持产学研结合,鼓励和支持保存机构同高等学校、企业、科研机构建立多渠道、多形式的紧密型合作关系,共同培养创新人才,联合开展科研活动。同时加强与国外相关机构的学术交流,促进对引进先进技术的消化吸收再创新,着力造就一批创新能力强的优秀创新人才群体和创新团队。
总之,数字化信息资源是国家信息资源体系中一个重要的内容,也是构建网络化社会和知识社会的基础设施,因此必须把数字资源保存作为国家战略的基本策略加以全面规划和研究,有利于各种资源的合理配置,从宏观上保证数字资源保存计划的有效实施。
〔1〕宛玲,吴振新,郭家义 .数字资源长期战略保存的管理与技术策略〔J〕.现代图书情报技术,2005(1):56-59
〔2〕联合国教科文组织 .保存数字遗产宪章〔J〕.中国档案,2004(2):51-52
〔3〕胡燕菘 .国外数字资源保存政策对我国的启示〔J〕.图书馆杂志,2005(6):26-29
〔4〕陈伟,汪琼 .数字图书馆数字馆藏长期可靠存取问题研究〔J〕.情报资料工作,2003(3):58-61
〔5〕吕志梅 .国外数字资源长期保存的现状、问题及对我国的启示〔J〕.现代情报,2008(5):28-29