社会记忆视角下网络信息资源归档路径探析*
——以PANDORA项目为例

2020-07-03 09:48陈慧乐茜罗慧玉罗思静
数字图书馆论坛 2020年6期
关键词:澳大利亚要素记忆

陈慧 乐茜 罗慧玉 罗思静

(华中师范大学信息管理学院,武汉 430079)

21世纪以来,互联网的发展与普及深刻影响着人们的生产生活,引发了人类社会从现实空间逐步向虚拟空间迁徙。网络信息资源记述了虚拟空间中人们在各个领域的痕迹,凝聚着人类共同的社会记忆,是重要的数字文化遗产,但是其长久保存却面临巨大的挑战[1]。因此,做好网络信息资源归档工作,以记录、留存和重现互联网时代社会记忆显得尤为重要。为维护珍贵的数字文化遗产、保存互联网记忆,各个国家/地区相继开展了多元化的网络信息资源归档探索,如美国Internet Archive、澳大利亚PANDORA和英国UKWAC等,这些项目对网络信息资源归档实践产生了广泛而深远的影响。其中,PANDORA是国际上经典的网络信息资源归档项目之一,主要面向与澳大利亚相关的网络信息资源,涵盖澳大利亚社会各个领域,项目运行至今,其经验对其他国家网络信息资源的长久保存和记忆延续都具有重要的借鉴意义。

相较而言,我国网络信息资源归档工作进展缓慢,2002年启动的北京大学网络实验室“Web信息博物馆项目”和2003年启动的国家图书馆“网络信息资源采集与保存实验项目”现在均处于停滞状态。2016年4月,《全国档案事业发展“十三五”规划纲要》提出了针对重要网页资源研究制定采集和归档办法,并由此展开一系列的试点工作。2019年4月,国家图书馆联合新浪公司启动互联网信息战略保存项目,旨在留存所有公开发布的微博,延续互联网时代的中国记忆。总体来看,我国十分重视网络信息资源归档,并在实践中积累了大量经验,但发展水平与国外相比仍存在一定的差距。因此,本文以澳大利亚PANDORA项目为典型案例,深入分析该项目的实践经验,以期为我国网络信息资源归档理论研究和实践探索提供一定的启示。

1 理论基础

1.1 网络信息资源归档相关研究

国外学者对网络信息资源归档的研究相对较早,主要针对网络信息资源的归档意义、归档模式、归档技术与方法、归档问题与挑战等方面展开研究[2-5],且多为探索性、实验性研究。与之相较,国内学者对网络信息资源归档问题研究较晚,直到因特网在中国逐渐应用和普及,才有学者提出网络信息资源长久保存的问题[6]。其后,越来越多的学者开始对网络信息资源归档主体、流程和模式等进行研究。这些研究主要集中在以下4个方面。①归档主体,研究网络信息资源应该由哪些责任主体负责归档。网络信息资源归档是一项系统性工程,仅靠图书馆的力量难以完成[7]。因此,赵展春[8]分析了档案部门在网络信息资源归档中的优势,提出档案馆也应参与其中。赵俊玲等[9]进一步扩展了归档责任主体范围,将形成者、公众、企业和社会团体等主体纳入其中,并构建了归档主体责任体系。②归档业务活动,探讨网络信息资源归档工作应该如何开展。关注点集中于归档流程、采集工具、归档文件格式以及元数据标准等[10-12]。③归档问题,研究网络信息资源归档在技术、法律、责任主体和经济等方面面临的问题与挑战[13-14]。④归档项目,主要对国内外网络信息资源归档项目进行介绍和经验解析。目前,对国外网络信息资源归档项目研究较为丰富[15-16],而对国内相关项目探讨相对较少[17]。这与国内外网络信息资源归档实践发展存在一定的关系,相较于国内,美国、澳大利亚、英国、日本对网络信息资源归档研究相对较早,实践项目成果也更成熟。

总体来看,学界对网络信息资源归档意义、主体责任、归档业务活动、面临的问题和挑战,以及国内外项目经验等进行了较为丰富的研究,为网络信息资源归档实践提供了参考,但已有研究仅仅关注和强调网络信息资源实现路径中某些要素的重要性,而较少从社会记忆的视角出发,对网络信息资源归档实现路径及各要素之间关系进行深入剖析。

1.2 网络信息资源归档与社会记忆的内在联系

档案是经过历史沉淀的“最基本、最稳定、最深层的要素”,在社会记忆建构中发挥着不可或缺的作用。纵观档案产生发展脉络,从古代结绳记事起,历经甲骨档案、简牍档案、金文档案等阶段,到后来的电子档案,档案一直伴随着人类社会不断发展,成为联系过去、现在和未来的记忆纽带。一旦档案丢失,将不可避免地造成文化遗产的流失,并对社会记忆的完整性产生深远影响。

归档是档案形成的关键一环,其工作质量直接影响档案的真实性和完整性,进而影响到社会记忆的延续。作为互联网时代的产物,网络信息资源是指通过互联网可以访问和利用的各类信息资源[18]。它具有重要的凭证价值、情报价值和历史文化价值,然而其更新速度非常快,平均寿命只有44天[19]。如果不及时归档保存,这些具有重要价值的网络信息资源将会伴随网页更新而永久消失,造成社会失忆。基于社会记忆的视角对网络信息资源归档进行研究,一方面能够避免大量网络信息资源流失,延续虚拟空间的社会记忆;另一方面促进档案信息资源建设,帮助人们发现档案工作价值,从而更好地推动网络信息资源归档,发挥其对社会记忆延续的最大价值。

2 澳大利亚PANDORA项目概况

早在1992年,澳大利亚就成立了TF2001调研组,对数字信息的长久保存和利用进行研究,旨在确保未来可长期存取澳大利亚数字信息资源,后调研组更名为TF2001PADI调研组。1996年,TF2001PADI调研组正式启动PANDORA项目,并出台了《澳大利亚电子出版物的国家策略》。该策略提出国家层面数字资源存取的顶层设计,为PANDORA项目的具体计划、实施、调整和完善等各项工作提供了基本方向和指引[20]。之后,澳大利亚又陆续出台了系列政策法规,对该政策进一步丰富和完善,初步形成澳大利亚数字资源长期保存国家战略体系。

PANDORA项目最早由澳大利亚国家图书馆发起,旨在采集和保存与澳大利亚或澳大利亚人相关的网络信息资源,留存国家数字文化遗产和社会记忆。随后参与机构不断增多,现已拥有10个成员,包括维多利亚州立图书馆、澳大利亚战争纪念馆、国家电影和声音档案馆以及北领地图书情报处等机构。PANDORA项目是互联网时代针对虚拟空间中数字文化遗产长久保存和社会记忆延续提出的新课题,它基于社会记忆的视角,提出了网络信息资源管理的新方向,主张对有重要价值的网络信息资源进行归档,以留存互联网上的澳大利亚记忆。为此,TF2001PADI调研组制定了网络信息资源归档政策、归档流程和框架,自主研发了网络信息资源归档系统,形成了澳大利亚数字信息长久保存和利用的多方协作机制。研究PANDORA项目的实现路径,对我国网络信息资源归档理论和实践有重要的参考价值,故本文以网络信息资源采集和归档流程为主线,对PANDORA项目经验进行详细解析。

2.1 PANDORA项目网络信息资源采集

如何从海量的信息中采集具有重要保存价值的内容,是网络信息资源归档工作面临的首要问题,涉及采集范围和采集方式等内容。其中,采集范围决定了网络信息资源能否被归档,网络信息资源因其数量庞大以及其内容间的关联性使得采集范围难以确定。如果不加以挑选、全部进行采集,势必造成资源的冗余;而如果盲目选择其中部分网络信息资源进行采集,则可能会破坏其完整性和系统性。受经费因素限制,PANDORA项目选择以“选择性采集为主,全面性采集为辅”的策略,即在选择性保存有重要价值的网络信息资源的基础上,定期对.au域名的网站进行大规模的全面性采集。不同机构根据其定位不同,采集范围也会有所差异,如澳大利亚国家图书馆主要采集具有国家重要意义的网络信息资源;维多利亚州立图书馆主要采集对本州有重要价值的网络信息资源;澳大利亚战争纪念馆则主要采集与澳大利亚军事和战争相关主题的网络信息资源等。

为有序、高效地推进网络信息资源归档工作,澳大利亚国家图书馆自主研发了一个集成的数字归档系统——PANDAS。该系统主要是针对归档工作流程设计,融入了网络信息资源归档的相关技术标准和要求,能方便不同地理位置的保存主体进行归档,具有较强的实用性和可操作性。在确定采集范围和采集内容后,各保存机构将与网络信息资源版权所有者联系,以寻求网络信息资源采集和保存的许可。在获得授权后,便可通过PANDAS系统的HTTrack爬虫工具采集网络信息,主要包括期刊、报纸、会议录、报告、地图和文学作品等。其中,对专著类网络信息资源采取一次性采集的方式,而对连续出版物则进行周期性采集。此外,PANDAS系统会自动为采集范围内的题名分配一个唯一的永久标识符,并记录在题名的底部,方便用户引用。PANDORA项目还支持在线上传功能,使社会大众、出版商以及网站所有者等主体能够快速便捷地上传所藏的网络信息资源,用户只需在上传文档时附带机构名、负责人名字、电话、邮箱、URL题名、发布日期和发布地点等信息,即可参与到PANDORA项目中。通过广泛收集来自民间的网络信息资源,不仅极大地提高了归档内容的丰富性,而且有效地调动了社会大众参与澳大利亚国家记忆构建的热情,激发了其社会归属感和认同感。

2.2 PANDORA项目网络信息资源归档

PANDORA项目的归档资源数量庞大、类型丰富。截至2020年2月26日,项目归档题名量累计达62 959项,文件数累计达到81 889余万件,数据规模达49.63TB,归档内容涉及政府与法律、商业与经济、历史、艺术、旅游、环境、健康和教育等多个领域。文件涵盖文本、图像、应用程序、脚本、音频和视频等格式,其中主要格式类型是文本和图像。

网络信息资源归档对于保证澳大利亚网络信息资源未来可访问和可利用有着重要的意义,这一业务活动主要涉及处理、存档和发布3个环节。①处理。业务人员可通过PANDAS系统对每个归档题名进行严格的质量检测,包括题名、状态、机构、所有者、采集日期和采集方法等信息,以保证归档资源的完整系统和长期可用。一旦检测出质量问题,归档资源将被移交给IT人员和PANDAS管理员进行处理。此外,针对在线上传的文档或部分内容指向外部站点的资源,则需要通过后处理流程进行质量检测。②存档。符合质量要求的网络信息资源将进入存档环节,业务人员通过点击“存档”按钮,即可提交网络信息资源存档请求,并同步记录存档的日期和时间。③发布。这一阶段,业务人员可为已存档的网络信息资源设置不同类别的标签,以方便用户检索和利用。标签包括实例标签、事件标签、组标签和题名标签,其中后3个为可选标签,业务人员可自行决定是否需要。

3 社会记忆视角下PANDORA项目对我国网络信息资源归档的启示

作为经典的宏观环境分析方法,PEST模型构建了政治(P)、经济(E)、社会(S)和技术(T)的分析框架。通过对PANDORA项目的研究,发现该项目网络信息资源归档过程涉及政策法规、资金、构建主体和技术标准等,主要涵盖管理、经济、社会和技术要素,与PEST框架的分析视角具有较强的关联性。因此,本文试图借鉴PEST模型,结合PANDORA项目本身,将政策法规等归纳为“管理”要素,其与PEST框架中政治(P)相对应;将资金提炼为“经济”要素,其与PEST框架中经济(E)相对应;将构建主体提炼为“社会”要素,其与PEST模型中社会(S)相对应;将技术标准归纳为“技术”要素,其与PEST模型中技术(T)相对应。此外,文化作为社会记忆形成的土壤,其作用不可忽视。人类历史发展长河中,不同地域的群体在社会实践中逐渐形成各具特色的生活方式、社会制度和宗教文明等,并以符号或实物形式留存下来,凝化为群体的社会记忆[21]。在此过程中,文化不仅作为一个基本要素对社会记忆形成产生直接的影响,同时也通过影响生活方式和社会制度等其他要素对社会记忆的形成产生间接作用。因此,本文将文化(C)也纳入其中,构建了网络信息资源归档PEST-C框架。

该框架(见图1)所包含的五大要素间具有一定的内在联系。①管理是影响网络信息资源归档的基本要素,通过制定数字资源长期保存国家战略和推进相关领域立法工作,既能为项目的实施提供政策保障,推动项目发展,也能对经济、社会、技术和文化四大要素产生重要的影响,进而对网络信息资源归档产生影响。②经济要素受到管理要素的直接作用,通过财政政策能直接对归档项目资金进行调节,进而推动或抑制归档工作的发展;同时,经济要素还受到文化要素和社会要素的双重影响,通过文化引导和推动社会参与的方式能够吸引资金流入归档项目。③社会要素和文化要素间的联系更为紧密,二者相互影响、相互作用。文化建设能够促使社会公众参与到网络信息资源归档实践中,而社会公众的参与也有助于形成一定的文化氛围。此外,社会公众的参与和文化建设也在一定程度上会影响政策制订。④技术要素受到管理要素和经济要素的双重影响,通过政策导向或资金投入能够驱动技术创新,推动项目发展。基于此,本文对澳大利亚PANDORA项目在管理、经济、社会、技术和文化要素上的实践经验进行探究,并由此分析该项目对我国网络信息资源归档工作的启示。

图1 网络信息资源归档PSET-C框架

3.1 管理要素的启示

实施全国性的网络信息资源归档,以保存澳大利亚数字遗产和国家记忆是一个庞大的系统性工程,要求在国家层面作出统一部署,PANDORA项目在管理要素上对我国网络信息资源归档有以下启示。

3.1.1 制定数字资源长期保存国家战略

早在1996年,澳大利亚政府便出台了针对电子出版物的专项政策,并在此基础上不断丰富完善,形成了澳大利亚数字资源长期保存国家战略体系,对PANDORA项目实施有着重要的保障作用。

尽管我国政府已出台了《政府网站网页归档指南》和《电子出版物出版管理规定》等政策,但相关政策大多针对某一领域,专指性较强,无法从整体上对全国网络信息资源归档工作提供有效指导,亟需建立我国数字资源长期保存战略,统筹管理全国网络信息资源归档工作。①充分重视数字资源的长期保存,将其推向国家战略高度;②强化国家的主导作用,建立统一规划和领导机制,形成包括信息中心、情报机构、图书馆和档案馆等在内的协同工作体系;③加快出台指导性政策,明确网络信息资源采集和归档各环节中相关主体责任,形成顶层设计,以指导相关理论研究和实践发展[22]。

3.1.2 推进相关领域立法工作

法律层面上,主要涉及两个问题。①版权问题,集中在网络信息资源的采集和利用领域。根据我国版权法规定,网络信息资源的复制权归属于版权所有者,规定范围外的采集和利用行为均是侵权行为,这在某种程度上阻碍了网络信息资源归档工作。PANDORA项目为解决这一问题,积极与版权所有者联系以获取授权。②呈缴制问题,涉及合法获取网络信息资源的政策支持。

目前,我国已经出台《出版管理条例》《电子出版物出版管理规定》和《中华人民共和国公共图书馆法》等系列政策,对电子出版物的法定呈缴作了规定,尚未出版的网络信息则不在法定呈缴范围内。而网络信息资源中有较大比例尚未正式出版,针对这一问题,澳大利亚北领地地区已率先修订了呈缴制度,对网络信息的呈缴进行了法律规定。这给我国网络信息资源归档带来一定的启示:①在当前我国版权法尚未完善的条件下,网络信息资源归档主体可以积极与网络信息版权所有者合作,以获得授权许可;②适时推动网络信息资源版权和法定呈缴领域的立法和修订问题,为相关项目实践提供法律保障。

3.2 经济要素的启示

鉴于网络信息资源归档是一项长期性、耗资巨大的工程,而归档工作价值的发挥往往需要经历较长的时间,项目投资回报周期十分漫长。在此背景下,PANDORA采取了以下两个措施:①采取“选择性采集为主,全面性采集为辅”的策略,在预算允许范围内,最大限度地保障了澳大利亚国家记忆的完整性和系统性;②经费由澳大利亚国家图书馆和各保存主体共同承担。

现阶段,国内多数网络信息资源归档项目也同样面临经费紧张的问题,以国家图书馆为例,该馆所开展的WICP项目经费来源为馆内预算,这给本不富裕的图书馆带来较大的财政负担。未来,在经济要素上要合理调整收支结构,优化资金配置:①借鉴PANDORA项目经验,综合考虑项目预算等因素,制定科学的采集策略;②拓宽项目资金来源渠道,吸引更多社会资本参与其中。

3.3 社会要素的启示

虚拟空间社会记忆构建的重要性促使众多机构开展网络信息资源归档的研究与实践,但如果机构间缺乏合作分工,往往会出现重复性研究或标准不统一等问题,造成资源浪费。PANDORA项目在澳大利亚国家图书馆的领导下,逐步建立了图书馆、档案馆、文化机构和社会大众等主体合作共建的模式,并取得了良好的协同效应。

目前,我国网络信息归档项目已经初步呈现出主体多元的趋势,图书馆、档案馆和企业等多元主体参与的共建模式正在逐步形成。其中,2019年国家图书馆与新浪公司共同承担的互联网信息战略保存项目便是典例。未来,在社会要素上应鼓励不同主体参与,巩固主体共建模式:①建立规范制度,明晰各主体定位和职责;②完善激励机制,通过一定的政策扶持,鼓励更多社会力量参与网络信息资源归档实践;③加强合作,充分发挥各主体的优势,巩固主体共建模式。

3.4 技术要素的启示

网络信息资源只有经过采集和归档等环节,才有可能转化为社会记忆,这一过程离不开信息技术的支撑。通过对PANDORA项目中技术要素进行分析,发现该项目建立了较为完备的技术标准体系,已经制定了数字资源描述元数据标准、数据资源保存元数据等一系列技术规范,能够为我国相关领域实践提供借鉴。

我国已经针对政府网页资源出台了信息文件格式标准、归档元数据参考标准等,初步建立了政府类网络信息资源标准体系,但在其他领域尚存在较大的空白。未来,应从社会记忆构建视角,建立包括归档元数据标准、信息格式标准、网络信息资源采集标准和网络信息资源归档标准等在内的相关标准,确保网络信息资源的标准化和结构化[23],推动网络信息资源的长期保存和使用。同时,要鼓励对外合作与交流,积极参与国际相关标准拟定。

3.5 文化要素的启示

信息技术的发展和互联网的普及正对人们的生产生活方式、思想观念等产生越来越大的影响,也由此催生出多元化的网络文化资源,这些网络文化资源对社会记忆的建构具有重要的作用。而伴随着大众意识的觉醒,越来越多的个体渴望并要求参与到社会记忆建构中。PANDORA项目在网络信息资源归档中强调“以人为中心”的理念,采集范围不仅包括官方记忆资源,更涵盖了大众化、多元化的民间文化记忆资源,在文化要素上对我国网络信息资源归档有一定的启示。

现阶段,我国政府部门主导的网络信息资源归档项目多从国家、城市等宏观层面出发,着眼从国家发展、城市变迁的视角来重构社会记忆,而较少将注意力放在数量众多、类型更加丰富的“小众记忆”[24]。在文化多元化背景下,进行网络信息资源采集时,要积极转变理念,选择更加贴近群众、融入社会的多元化文化资源,特别是具有代表性的组织记忆、社群记忆和家庭记忆,构建多元化的社会记忆文化资源库。

4 结论

互联网语境下,如何有效地归档和保存网络信息资源,留存社会记忆是我们必须面对的时代课题。PANDORA项目从管理、经济、社会、技术和文化五大要素上实现了网络信息资源归档路径,对我国网络信息资源归档实践有着重要的参考意义。要充分借鉴PANDORA项目有益经验,从管理、经济、社会、技术和文化上协同推进,通过完善政策法规、优化资金配置、巩固主体共建模式、建设技术标准体系及构建多元文化资源库等具体措施推动网络信息资源归档工作,从而更好地保护我国数字文化遗产,留存互联网社会记忆。

猜你喜欢
澳大利亚要素记忆
澳大利亚RaeRae五口之家
掌握这6点要素,让肥水更高效
澳大利亚将严格限制2,4-滴的使用
观赏植物的色彩要素在家居设计中的应用
论美术中“七大要素”的辩证关系
儿时的记忆(四)
儿时的记忆(四)
记忆翻新
在澳大利亚骑行
也谈做人的要素