社会记忆视角下的网络信息存档研究

2014-03-30 15:55马芸馨夏曼秋
档案与建设 2014年9期
关键词:记忆信息

马芸馨 夏曼秋

(1.安徽大学管理学院,安徽合肥,230601; 2.安徽大学经济学院,安徽合肥,230601)

社会记忆是一个民族最宝贵的精神资源,社会记忆的保存,对于增强民族与社会的根源性和认同感有着重要的意义。20 世纪90年代,联合国教科文组织启动了“世界记忆工程”项目,旨在遴选和保存最具代表意义的社会记忆遗产,作为一个民族、一个社会的文化徽章。在2001年11月中国人民大学主办的“中国首届档案学博士论坛国际学术研讨会”上,“社会记忆”再次成为研讨的焦点,众多学者在重申社会记忆价值的同时,再次强调了档案部门在社会记忆保存中的责任与使命[1]。

档案部门是建构社会记忆的主要机构,以存档的方式保存大量信息资源,才能维持其原始性,进而如实还原和展示社会演化的历程。在“社会记忆”思想的指导下,档案部门以一种更为负责、更为认真地态度对待各种类型档案的保存,将其作为传承历史,延续文脉的精髓。遗憾的是,身处信息化的大背景下,依托互联网技术和信息技术生成的大量网络资源却并未得到档案部门的关注,也未能以建档的方式加以保存。本文将从档案部门构建社会记忆的角度,初步研究档案部门的网络信息存档。

1 网络信息及其存档探索

在信息时代,网络已成为全球最大的信息资源库。凡是以数字化方式直接发布在互联网上并通过计算机网络传播利用的各种信息资源皆可纳入网络信息的范畴。网络信息的种类可以按照来源、内容、形式等不同标准进行划分,鉴于本文是以档案部门构建社会记忆为视角,而来源原则是档案专业最基本的原则,所以笔者按照来源来划分网络信息的种类:政府网络信息、企业网络信息、科研教育机构网络信息、社会团体网络信息、个人网络信息等。网络信息能够真实地反映政治生态变化、社会发展历程、个人人生体验等,是历史的真凭实据,具有凭证价值;又能够记录事实和经验,提供知识与信息,具有情报价值。

据中国互联网络信息中心(CNNIC)测算,截至2013年12月,中国网民规模达到6.18 亿,全年新增网民5358 万人,互联网的普及率增至45.8%,较2012年底提升3.7 个百分点[2]。很明显,互联网在经济社会中地位提升,反映文化、思想、事件的网络信息大量产生,它们构成了社会记忆的重要部分。此外,网络信息具有实时更新性和易失性。档案部门为构建完整的社会记忆,对网络信息存档就是必要和紧迫的。

国外已经开展了相关探索,其中较典型的是美国国会图书馆网页信息存档(LCWA) 项目和Internet Archive 项目。LCWA,主要提供数字信息的收集、保存和利用服务,它保存了如总统选举、伊拉克战争、911 事件等专题的网络信息[3]。Internet Archive 从1996年成立之初起就开始从事原生数字信息(主要是网页信息)的存档实践,致力于全面采集和保存全球网络中公开可用的信息资源,使现在和以后的学者和研究人员能永久访问[4]。

2 网络信息存档的实施

在借鉴国内外现有经验的基础上,根据传统档案建设管理的流程,笔者认为网络信息存档应该从收集(采集)、鉴定、整理、保管、检索和利用这几个流程展开。其中,采集、鉴定、保管是关键流程,本文将从这三大主要环节对网络信息存档的实施进行探索。

2.1 网络信息的采集

采集是网络信息存档的第一个环节,是开展后续工作的前提和基础,主要涉及采集范围、采集方式和采集时间三个方面。

从采集范围看,“全面而又有所侧重”应当是基本要求。目前,网络信息的采集主要有全面采集、选择采集和联合采集三种方法。全面采集是对所有的网络信息进行收集保存,如美国的Internet Archive 项目;选择采集是基于主题或基于呈缴法律对部分网络信息的收集,如澳大利亚的PANDORA 项目;联合采集是前两种采集方式的结合,如我国国家图书馆的“网络信息资源采集与保存试验项目(WICP)”[5]。笔者认为,网络信息数量庞大,质量良莠不齐,若采用全面采集策略可能会面临技术挑战、经费短缺和权利限制等问题,而选择采集可能会遗失大量社会记忆。故我国档案部门采取联合采集的方式可能更好,既要包罗万象,尽可能覆盖人类的各个知识领域,又要精挑细选,注意有所侧重。

从采集方式看,目前主要有自动采集和人工采集。自动采集是利用采集工具或系统自动对网络信息进行捕获。澳大利亚国家图书馆开发的PANDAS 系统就具备这样的功能[6]。人工采集则是由人对网络信息进行筛选从而确定哪些信息需要采集。两种方式各有优缺点,如自动采集更快捷方便,节省人力、物力,但是采集的信息也许并不能完全符合人们的利用需求,而人工采集虽然能够从利用需求出发进行采集,却过于繁琐。我国档案部门可以综合运用这两种方式,需要全部采集的网络信息采取自动采集,对无法判别利用情况的信息采用人工采集。

从采集时间看,按照网络信息的更新频率实时采集。网络信息是一种不断变化与更新的动态资源,在保持高速增长的同时也在大批消亡,如果不及时采取采集措施,在其消失之后人们将再也无法获取。由于各类网络信息的更新频率不同,若仿照纸质文件按固定时间定期归档的方式进行信息采集,肯定是不可取的,所以笔者建议档案部门根据不同网络信息的更新规律,找出合理的采集频率,按更新频率进行采集。

2.2 网络信息的鉴定

鉴定通常有真伪和价值鉴定两种。此处的鉴定主要是指价值鉴定,即判断网络信息是否有保存价值。网络信息区别于纸质文件的最大不同在于它的软硬件依赖性,需要通过计算机才能为人工所识读。因此,单纯的内容上的有用性不足以构成网络信息保存价值,还必须从技术上保证其可被识读,这就要求鉴定从两方面入手,一是判断网络信息内容的价值(内容鉴定),二是判断网络信息是否具有可读性(技术鉴定)。

从内容鉴定方面看,通过不同的采集手段采集到的信息并不是全都要保存,只有那些反映了真实的社会面貌且有长远利用价值的原生网络信息才有保存的必要。根据网络信息的特点,内容鉴定过程中应遵循两个原则:原生性和价值性。原生性要求保存的网络信息必须是第一手产生的,后经复制、粘贴、转载的不纳入保存范围。价值性要求保存的网络信息必须是真实可信、未经恶意篡改的,具有可兹为凭的凭证价值;或包含一定的知识与信息,具有情报价值;或具有能满足形成机关需求的第一价值;或具有对社会、未来有用的第二价值。

从技术鉴定方面看,是对网络信息真实性、完整性、可读性的分析。真实性是检测网络信息是否是当时当人当事形成的,在形成之后是否经过篡改。完整性是检测网络信息的各个要素是否完备,与其相连接的数据是否收集齐全。可读性是检测网络信息是否可在计算机上正常读出,有没有链接错误或乱码等异常。只有真实、完整、可读的网络信息才能提供利用,具有保存价值。

2.3 网络信息的保管

保管是网络信息存档的三大关键环节之一,对于网络信息的长期存取利用、网络信息价值的发挥、延续数字时代人类的记忆有着重要的作用。网络信息的保管就是要长期维护网络信息的真实性、可靠性、可读性,最大限度地防止和减少损毁以及因为软硬件过时造成的丧失,保证人们在可预料的将来能够获取该网络信息。

从保管方式看,目前对网络信息的保管主要有两种方式:一是将收集到的网络信息保存在项目实施机构的内部网络中,如英国网络信息保存联盟计划UKWAC 建立本地收藏集中保管网络信息[7];二是将收集到的网络信息保存到硬盘或磁带等载体介质上,如芬兰国家图书馆[8]。笔者认为,档案部门将网络信息集中传输至独立的、可脱机保存的载体介质上将更利于网络信息的长久保存和利用。

从保管内容看,第一,保管存储的网络信息内容。对于保管在内部网络中的网络信息,应保管好本地收藏等文件夹;对于脱机保存在载体介质上的网络信息,应保管好存储载体。第二,保管网络信息的各种支持软硬件。网络信息在网络上传播,必须依靠某种专门的计算机软硬件环境才能保存、阅读使用,这就使得我们在保管网络信息的同时,还必须保存该网络信息贮存的软硬件利用环境,包括操作系统、应用软件、硬件设备等,以保证网络信息的长期可读性,以便日后能使用该网络信息。第三,保管网络信息相关的背景信息。这些背景信息包括网络信息的产生环境、产生时间、产生地点、产生原因和受众等,为网络信息提供广泛的社会文化和历史线索,能更完整地保存网络信息。

从保管技术看,针对网络信息读取所依赖的计算机软硬件系统更新换代后,网络信息对新的软硬件环境不兼容等问题,常用的技术有“迁移”和“仿真”,前者是将网络信息转存到新环境中,后者是模拟出旧环境。还有一种保存计算机过时的软硬件设备的技术叫“技术典藏”,强调应保存网络信息的原始运作环境[9]。

3 网络信息存档存在的障碍与突破

目前很多国家及国际性组织都进行了网络信息存档的实践,他们在建设网络信息存档项目的过程中取得了一定成果,也面临了一些问题,这给了我国借鉴与启发。本文将从我国的实际情况出发,分析我国档案部门在存档网络信息的过程中可能面临的问题并对突破方法进行初步探索。

3.1 网络信息存档责任归属不明——确立以档案馆为保存主体的责任体系

目前我国尚无相关规定由哪个机构来收集保管网络信息,是档案馆还是图书馆亦或是形成机关对网络信息进行存档尚不明确,学术界对这个问题的看法也并不一致。责任归属不明致使少有人员或机构收集、保管网络信息,造成海量有价值网络信息的严重流失。

不可否认的是,档案馆一直担负着保存以纸张、磁带、光盘等为存储载体的信息资源的任务,随着现代信息技术的发展及应用,一些大中型档案馆已经基本具备了保存网络信息所需理论研究、标准制定及技术开发等方面的能力,且考虑到由档案部门收藏的网络信息更能反映社会原貌,更能保护好完整的社会记忆,因此档案部门应该承担起网络信息存档的重任。我国各级档案部门可以首先明确各级各类档案业务部门在网络信息存档中的责任,其次借鉴纸质文件收集、归档、保管等一整套业务规范来指导网络信息存档的运作,最终以此为基础建立一整套的责任体系。

3.2 网络信息存档涉及知识产权等法律问题——拓展呈缴法或修改知识产权法

尽管网络信息被认为是公共资源,但仍有越来越多与知识产权相关的法律明确提出了对网络信息保护的规定,一些网站采用了一定的技术保护手段防止复制和保存其网页信息。这种观念上的公共获取与现实中的版权保护之间的冲突形成了网络信息存档领域的知识产权法律问题,即网络信息存档中有关主体是否有权将其捕获到的网络信息加以保存、转换格式、复制拷贝和提供检索等。

目前国际社会为解决此问题的一些探索实践是:一、制定呈缴法。挪威、丹麦已经制定了网络信息呈缴法,并对呈缴的责任者、内容、方式、格式作出相应规定[10]。二、修改知识产权法与其它相关法律。如法国2006年通过的知识产权法规定,生产者或出版者不能用代码或访问控制来阻止授权机构采集其站点的信息[11]。笔者认为我国档案部门可以借鉴国外的经验,做出自己的探索:其一,我国虽没有一部关于网络信息的呈缴法律,但是对于传统印刷型出版物和实体电子出版物的呈缴都有相关的规定。我国可以在纸质与电子出版物呈缴的基础上,将呈缴范围拓展到网络信息领域,对网络信息具体的呈缴范围、呈缴时间、呈缴方式等作出明确规定。其二,我国也可以收缩知识产权对网络信息存档的限制,增加对网络信息的合理使用范围,通过修改知识产权法来实现国家公共文化事业单位对网络信息的合理采集与保存。其三,我国还可以与出版者协商,征求出版者许可发布的范围,或发送版权声明询问可否下载、下载深度,可否公开、何时公开等。

3.3 网络信息存档耗资大——国家财政支持和企业捐资赞助

网络信息存档的目标是永久保存海量的网络信息,数字化存储的信息量大、时间长,所需资金必然多。且项目实验、技术开发都需要进行大量的初始投资。此外,网络信息的价值一般都要经过一段相当长的时间才会显现出来,投资回报周期相当漫长。所以,实施网络信息存档的主体,其经费从何而来是一个严重的问题。

国外比较成功的网络信息存档项目,如美国的LCWA 和IA 项目都是依托国会图书馆的财政支持和商业机构(如Alexa)的捐资赞助来实施的。美国国会图书馆在2003年通过了国家数字信息基础设施和保存计划,获得了1 亿美元的经费支持;2007年美国国家基金会和梅隆基金会资助“蓝带特别小组”,关注数字保存和持续存取在经济上的可持续性发展等[12]。我国档案部门若仅仅依靠馆内自筹是很难满足网络信息存档的资金需求的,在开展网络信息存档的探索时必须考虑争取国家财政支持和企业捐资赞助。

4 结语

网络信息随时可能因为被忽略、遗忘,甚至只是简单的短视行为而快速消失,而这种因历史记忆的丢失而造成的损失将是无法挽回的,作为“构建社会记忆主体”的档案部门秉承着“守护过去,记录现在,铭记未来”的历史使命,在保存网络信息、构建完整的社会记忆大厦的过程中责无旁贷,理应在网络信息存档方面有所作为。

*本文系国家社科青年基金项目“我国非物质文化遗产建档标准体系研究”(项目批准号:12CTQ038)、教育部人文社科青年基金项目“基于群体智慧的非物质文化遗产档案管理模式及其实现机制研究”(项目批准号:12YJC870005)的阶段性成果之一。

[1]钱程程.从档案记忆观视角看档案与档案工作[J].云南档案,2010,05:3-4.

[2]中国互联网络信息中心.第33次中国互联网络发展状况统计报告[EB/OL].[2014- 3- 5]. http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201403/t20140305_46240.htm.

[3]安琳.国外网页信息存档项目及相关问题研究[J].图书馆建设,2009,12:107-110+113.

[4][5]刘青,孔凡莲.中国网络信息存档及其与国外的比较——基于国家图书馆WICP项目的研究[J].图书情报工作,2013,18:80-86+93.

[6]徐健.英国网络信息保存联盟计划(UKWAC)及其启示.图书馆论坛,2007(2):81-84.

[7]谢春林.英、美、澳、挪网络信息保存政策的经验与借鉴[J].情报资料工作,2009,06:40-44.

[8]陈力,郝守真,王志庚.网络信息资源的采集与保存——国家图书馆的WICP和ODBN项目介绍[J].国家图书馆学刊,2004,01:2-6.

[9]陈慰湧,秦建伟.数字信息长期保存研究现状分析[J].浙江档案,2008,01:43-45.

[10]向菁,吴振新.网络信息资源保存发展现状及趋势分析[J].中国图书馆学报,2009,02:34-41.

[11]仇壮丽,许冬玲,卜淑芬.归档网络信息价值判断模型之研究现状与展望[J].档案学通讯,2010,06:61-64.

[12]周毅.论网络信息存档权及其生成[J].中国图书馆学报,2011,01:102-108.

猜你喜欢
记忆信息
夏天的记忆
订阅信息
端午记忆
儿时的记忆(四)
儿时的记忆(四)
记忆翻新
展会信息
信息
健康信息
健康信息(九则)