林 强
(河北大学 河北 保定 071000)
由于计算机技术和互联网技术的广泛应用,突破亿万的用户通过各种渠道和手段获得或创造了各种各样的信息,加之电子出版物时代的到来,数字资源的长期保存成为这种环境下用户对社会及其相关部门所提出的要求。数字资源长期保存项目的存在是对人类智力资源、文化资源等一切文明的保存与延续。美国、澳大利亚、荷兰等是开展数字资源长期保存项目较早的国家[1]。我国的数字资源长期保存活动也在逐步进行。此外,数字资源长期保存仅依靠图书馆是无法完成的,需要社会各界的通力合作。
开展数字资源长期保存工作,首先,需要建立有效的资源收集与处理机制;其次,针对数字资源存在与应用的特点运用各种技术对其进行处理和保存;再次,数字资源保存是长期项目,稳定的资金与规范的组织是活动的前提与保障;最后,对项目的评估与完善是此项活动不可缺少的环节,能够为下一次数字资源保存提供理论与实践依据。因此,建立良好的数字资源长期保存模式,井然有序地开展数字资源长期保存项目将使数字资源保存更加规范。从战略角度出发,应将数字资源的长期保存看作是可持续任务。
对2009—2010年数字资源长期保存项目进行收集与分析,从中选择了若干项目探讨如下。
AIMS (An Inter-Institutional Mode for Stewardship,机构间数据管理模型)是一个为期两年(2009年10月—2011年10月)的数字档案保存计划,是弗吉尼亚大学图书馆联合斯坦福大学、赫尔大学、耶鲁大学在Andrew W Mellon基金会的组织下成立的,旨在建立一个完善的国内或者国际间的数字档案框架,以保存个人或者组织的数字档案信息。该计划是合作式的团队运行项目,在该项目里,每个合作者(团体)都有各自的领导与基础设施,并且负责人之间可以相互联系,对自己或者另一部门的工作进行评价与指导,从实际工作中吸取经验。
ArchivePress项目是由英国伦敦大学电脑中心与英国国家图书馆数字信息保存部门合作,由JISC (Joint Information Systems Committee,联合信息系统委员会)出资于2009年3月成立的。该项目重在解决博客内容(评论、嵌入式内容和元数据)归档的实际问题。ArchivePress是通过RSS和博客的API(Application Programming Interface,应用程序编程接口)获取博客内容。归档后的内容将被项目所拥有的数据库存储和管理,并保持博客原始的数据结构和格式。该项目人员将这些信息汇集到Wordpress数据库上,作为归档引擎进行保护与利用。目前,该项目已在Google上进行试用。
欧盟领导下的欧洲数字图书馆旨在为后代保存那些具有丰富历史价值和文化价值的图书、电影、杂志、地图、照片、音乐等一系列的文化资源和科技资源。他们通过创建电子博物馆、档案馆及与欧洲的各大成员国图书馆联合,为用户提供保存下来的各种信息,以满足后代的生活、学习和娱乐的需求。该倡议看起来较为分散,但实际上是十分实用的项目,在由欧盟各个成员国组成的委员会的领导下开展各项工作。
2009年的欧洲数字图书馆倡议会议上,通过了针对孤儿和成员国文化遗产的数字化计划;制定了关于运作欧洲数字图书馆与资源使用标准。这项倡议下的欧洲数字图书馆计划可以带动其他相关产业的发展,促进社会与经济的进步,通过对文化产业数字化的保存推动其他行业的发展,如政府信息公开、电子商务、教育培训、人们健康意识、通讯和广播等都得到发展。
数字保护联盟是为了保存英国的数字资源而建立的,并与其他国家联合保护全球数字信息和知识。其保存数字资源的计划为非营利会员组成的联盟实现这一目标提供了良好的经营机制与先导,该联盟的最终目标是推进数字化的保存与管理。从2009 —2011年间的战略构想看,该联盟是以中立、友好、协商的态度去达到满足成员需求、维护良好数字资源、分享数字资源、发展数字保护标准的工作目标。
音像内容建档项目从欧洲发起,是针对那些由于数字时代到来而在格式与形式上都面临着改变的音像内容所采取的保护措施。由于数字化媒体的广泛应用,原来的音像制品将会失去原有的存在环境,那么,就需要为这些音像制品建立档案,并且为这些档案提供良好的保存环境,提供必要的技术支持。用户可以通过网上数字图书馆访问欧洲范围内的所有音像资料。该项目所进行的工作并不是把音像制品进行简单的复制与储存,而是将原有格式进行处理,使之变成当前环境下能访问与应用的文件。在这个过程中要遵循与制订相应的标准来规范保存格式的选择、处理保存内容的技术及提供所保存信息检索技术等过程,不管是对文件的描述还是储存格式的要求,都要在一定范围内按照一致的标准进行。
该项目联合了欧洲一些大学的图书馆,在欧洲基金会、博物馆、档案馆等一些重要合作伙伴的协助下,为工业(infustry)、企业(enterprise)市场需求提供服务。主要的组织者和项目经理组成委员会对该项目负责。
PARSE. Insight(Permanent Access to the Records of Science in Europe, 欧盟科学数据长期保存计划)历时两年,在欧盟第7框架项目下联合了英国、荷兰、德国、法国、瑞士等国家参加,主要是集中研究欧盟提供的数字资源(主要是科学信息),并延长其寿命,改善数字资源的存在环境与利用状况。这需要项目组织者下属的相关技术部门建立数据库来收集这些资源并且为收集资源提供必要的渠道,鼓励和支持社会各界分享他们的数据,同时为这项研究提供技术、方针政策、基础设施上的支持和引导。该项目中提到 “很多数字资源构成了当今欧洲众多智力资源的基础,新一代研究人员需要站在巨人的肩上才能达到事业顶端”。在这里提到的“巨人的肩上”无非就是这些数字资源。保存这些数字资源并且使其能够长时间为人类使用,就能创造出更多的利益。越来越多的数字资源和先进的数字技术的应用缩短了这些资源的生命周期,如何保护好这些智力资本是PARSE. Insight项目所要考虑的问题,正如OAIS(Open Archival Information System,开放档案信息系统)和ISO (International Organization for Standards,国际标准化组织)14721里提到的“要对在短短几年时间里发生变化的媒体和数据资源进行保护,在技术上应对这一不断变化的现实。”
Inter PARES 3( The International Research on Permanent Authentic Records in Electronic Systems 3,文件真实永久保存电子系统国际合作研究第3阶段)是一项大型的跨国合作研究项目,其目的是为制订长期保管真实电子文件的国际、国家及机构政策、战略和标准提供原则和依据,其项目资金由加拿大社会科学和人文研究理事会的社区大学研究联盟赠款。目前已经进行到了第3阶段,主要工作目标是将前两期的丰硕研究成果付诸实践并进一步检验与完善前期研究成果,帮助各级各类机构建立基于电子文件真实性保障的电子文件管理系统和相关的制度、指南、人员培训模式。
项目的开展是在有资金投入的情况下进行的,没有稳定的资金,数字资源长期保存工作就没有得以运行的基础。从所调查的国外项目开展情况上看,资金可以从所属委员会和参与并享有使用权的会员中获得,也可以由公益性质的组织募得。以上只是该类项目在运行过程中获得资金的部分方式,但是从这几种形式中可以看出,资金的来源可以决定资源的使用和组织存在的性质。资金往往是作为启动和开展数字资源长期保存活动的物质基础,有时它还可以决定技术与资料的获得程度。
数字资源长期保存项目的规模与参与者的数量、部门等方面相关。项目的规模在一定程度上决定项目的影响力。如果数字资源保存项目有权威部门的领导、广泛的合作领域、丰富的资源、强大的合作团队和知名企业或者大学的参与,那么便会吸引很多人去关注并加入到这项保存活动当中。
数字资源长期保存对象是整个项目中最关键的部分,只有明确保存对象才能展开一系列相应的工作。在明确保存对象的工作过程中,确定资源的呈现方式和获取方式是进行数字资源保存的初始工作。要对保存对象进行彻底分析,弄清楚从什么地方、以什么方式获得该资源,之后又以什么形式或者格式保护或保存经过技术处理的数字资源,同时,需要对经过技术处理前后的保存对象进行校审与评估,这对数字资源长期保存工作起到了十分重要的作用。
从国外数字资源长期保存项目来看,绝大多数的组织者都属于计算机、档案、图书馆、数据库商等掌握有大量数字资源和先进技术的部门或某个行业及公益部门。由此可见,数字资源长期保存项目的开展是一项综合且需求突出的活动。从组织者的角度去考虑,没有需求就没有开展这项活动的出发点,但从组织者的最终目的上看,对保存后的数字资源的使用可以分为商业性和非商业性,这与整个项目的构建与所要达到的目的是分不开的,同样也是组织者的期望。
总之,一项具有历史意义的保存项目如果没有良好的运行模式,很难达到长期保存数字资源的目的。良好的运营模式可以在一定程度上起到推波助澜的作用。
随着计算机网、有线电视网和电信网三者联合即三网融合的发展,我国传播、出版和IT产业的格局有所改变,在用户对资源的使用和数字资源的保存上需要革命性的变革。但是,对数字资源保存项目的构建不能脱离领导、组织、技术、评估与反馈的环节。
在一个完整的项目模式中,组织是整个项目模式的骨架。组织者是指挥和制订计划的“大脑”,其下面的每个部门各有分工、各尽所能,“组织”就是支撑起整个项目的基础。
(1)主管机构 是整个项目的发起者、组织者、领导者,可以是个体、团体或组织,如项目委员会。委员会需要考虑整个项目的资金往来、资源获取与呈现,对项目进行评估和工作安排。在整个项目的模式构建中,组织者是这个项目的负责人,也是“大脑”,起到管理与协调的作用。
(2)合作者 即愿意与他人共同为这个项目出资或开展必要工作的个体或组织。部门间的合作、企业间的合作、大学间的合作等一切有利于开展工作的合作形式都是可以存在的。但是在合作过程中要协调合作者之间的任务,分清合作的形式和性质。在商业前提下的合作需要组织者和合作方共同承担相应的法律责任和义务,在资源的利用与开发上做到“按章办事”。
资金是开展数字资源保存工作的前提与物质基础。资金的获取有两方面考虑:第一,和资源的价值与保存工作的紧迫程度有关。有重要利用价值的资源需要采取积极的大量的人力、物力进行保存以为用户提供服务;第二,和图书馆、档案馆、大学等机构的重视程度有关。图书馆、档案馆和大学等机构掌握着一些无法靠商业手段获取的信息资源,他们的参与可以完善所要保存资源的内容,从而让更多的用户使用到这部分资源。所以,不管是从商业的角度进行考虑,还是源于对人类文明的继承与分享的情怀,数字信息资源的长期保存都是不可避免的。
特别是在三网融合的环境下,数字资源的保存显得尤为重要。三大部门的领导机构需要在这个共同目标下沟通和协调出现的问题,确保数字资源保存活动的正常开展。在三网融合后的一段时间里,应该有一个共同的领导组织去负责三网的相关事宜,在其领导下将数字资源保存工作长效开展下去是大势所趋。
在技术方面,需要考虑到当前的技术是否适合原来的数字资源,应如何进行下一步的保存工作。在对保存对象的选择环节上,应该充分考虑保存对象的文件格式、状态、内容,并且要对保存项目进行预案分析,应该考虑保存该类数字资源的措施,即对处理过的数字资源再利用、再获取的方式和设备等,也就是要充分考虑到原始数字资源的输入与输出格式与呈现方式。
在三网融合后的数字资源体现形式上,不仅仅是计算机网络上的数字资源是需要保存的对象,那些存在于广播、电视、电信等网络上的数字资源也将会成为的保存对象。
维护与评估环节是必不可少的,因为在项目完成投入使用后的过程中所出现的问题应得到及时更正,并且形成数据记载下来,以对下一个项目的开展提供必要的经验。对项目的评估可以使整个项目在宏观与微观两个层面充分实现交合,确定在缜密的计划下实施的各项工作是否取得了预期的效果,是否达成了一致的意见,但这都需要在另外一个平台去对该项目实行客观的评价。
总之,在三网融合的环境下,数字资源保存的力度和难度将会增加,但是这并不会使数字资源保存活动消失。数字资源保存将会依托先进的科学技术,实现三网资源的整合性保存,把同一类的不同体裁类型的数字资源进行保存。以“三网领导委员会”作为数字资源保存项目的最高领导机构,在其领导下可实现多层次、多形式的资源融合与保存。
通过对国外数字资源长期保存项目的分析与研究,笔者提出了数字资源长期保存项目应在可行的模式中进行,即要有明确的领导者(个人或团体),实行部门负责制,在每个部门都有负责人对本部门工作进行评价和指导,并且对其他部门的工作进行评估;另外要建立健全的资金运作保障机制,为长期保存工作提供坚实的物质基础;与此同时,技术方面要充分考虑本项目对所用技术驾驭能力与用户所处技术环境的匹配问题;最后,为了实现对信息资源长期保存工作的可持续发展,要对所有保存工作和结果进行评估,以为数字资源保存工作提供动力与支持。数字资源长期保存项目在健全的模式下进行,会处于一个长期而持久发展的状态。作为组织者,建立健全一套行之有效的方针政策与作出正确的决策是其首当其冲的任务;实现与合作者之间的良好沟通与合作是开展保存项目的基础;获得或者募集资金是开展工作的物质基础。在技术环节上,要充分考虑被保存资源的客观状态,利用现有技术进行保存,并且要充分考虑到前后格式上的变化。在维护与评估上,积累经验正确评估也是十分必要的。
以上3个方面是整个项目模式的基本要点,从组织者到技术与服务,再到后期维护与评估,这3个方面是不可分割的。在一个项目中这三者也不是独立存在的,他们分别扮演着“领导者”、“执行者”、“用户”的角色。由于社会的发展速度不断加快,对数字资源的长期保存会受到来自技术和资金上的阻碍:技术上的阻碍体现在现有技术与被保存信息是否能充分结合,并能够在未来技术环境下为用户提供稳定而准确的服务;资金上的阻碍是针对投资和利益分配上的协调机制能否促进并长时间的投入到对信息资源的长期保存上来。所以对保存技术的选择和解决资金运作问题显得尤为重要。同时,对保存后的数字资源的使用需要限定在法律条例的范围内,这样才能保证人类的文明更持久地被保存。建立良好的内部协调机制和适当的技术支持是这个模式框架下的实质内容,而这样的模式为数字资源保存工作的开展提供了空间与时间,并朝着简单、多样与实用的方向发展,实现社会效益与经济效益的双丰收。三网融合环境下,资源的多样化和数量的激增将给数字资源保存带来挑战。新的环境对技术、人员、组织和管理的要求更高,各部门需要有机联合,构建合理的法律、技术、人员与资金运营框架,秉持可持续发展的态度去实现我国数字资源的长期保存。
[1]张士男, 闫 昱. 国内外数字资源长期保存现状研究及分析[J].图书情报工作网刊, 2009(1):1-6.
[2]AIMS - Born Digital Collections: An Inter-Institutional Model for Stewardship [EB/OL]. [2010-08-05]. http://www2.lib.virginia.edu/aims/.
[3]Welcome to the Archive Press Website [EB/OL]. [2010-07-28]. http://archivepress.ulcc.ac.uk/.
[4]i2010: Digital Libraries Initiative [EB/O L].[2010-07-21].http://ec.europa.eu/information_society/activities/digital_libraries/index_en.htm.
[5]Digital Preservation Coalition [EB/OL].[2010-07-25] .http://www.dpconline.org/advice/dpc-reports.
[6]Presto PRIME [EB/OL].[2010-08-02]. http://www.prestoprime.eu/project/index.en.html.
[7]About PARSE Insight: Permanent Access to the Records of Science in Europe [EB/OL].[2010-08-01] .http://www.parse-insight.eu/.
[8]InterPARES Project [EB/OL].[2010-08-02]. http://www.interpares.org/.