周文泓 许强宁 高振华 张晓宇/四川大学公共管理学院
网络为新冠肺炎疫情这一全球性重大突发事件提供了关键的信息即时发布、交流、集成空间,也从历史叙事和信息资源产业角度提出海量信息在传播过后如何存续的问题。档案馆、图书馆、博物馆等记忆机构正在全球范围内发起战“疫”材料征集以留存对国家与社会有价值的记录,网络信息涵盖其中。从网上纪念馆、战“疫”记忆库到GitHub上一度登上趋势榜第一的各类存档项目,均反映出网络信息存档是不可或缺的行动。那么目前实践进展如何,已形成哪些实质成果且面临哪些问题,对我国新冠肺炎疫情以及更广泛的重大社会事件网络信息存档,具有哪些启示和可供参照之处?
理论层面在疫情之初就倡导建立针对新冠肺炎疫情的专题档案库[1],作为代表性类型的网络信息如社交媒体存档也得到相应探讨,从为什么与如何做等方面提供了一定见解[2]。此外,以往的重大社会事件网络信息存档以实践案例(如伦敦奥运会)分析实践挑战与策略[3][4]。由此,这些研究帮助明确网络信息的庞大数量、复杂特性与存档价值,并从主体协同、善用技术、制度保障等方面提供了方向。然而,研究对具体进展缺乏行动层的实证支撑,有待形成更具启示性的策略。
因此,本文将对面向新冠肺炎疫情的网络信息存档行动进行全球范围的线上调查,从代表性实践发现行动进展与特征,由此为新冠肺炎疫情网络档案库的全景建设乃至重大社会事件网络信息存档提供启发式策略。
2020年2月13日,国际互联网保存联盟(International Internet Preservation Consortium,IIPC)下设的内容开发小组(Content Development Group,CDG)开展面向各个国家、地区新冠疫情的网页存档项目[5],旨在存取与新型冠状病毒有关的网络内容,包括与新冠病毒感染传播信息、各地为遏制病毒所做的努力以及和疫情有关的医疗、科学、社会、经济、政治等各个方面的信息。项目进程中,可由作为成员的来自世界各地的各类记忆机构提名应存档的网址,感兴趣的群体或公众亦可参与;需在线填写信息并提交表格,包括网址、域名、标题、语言、描述/关键词(选填)、范围、参与者姓名或机构(选填)、主题,通过CDG审核后确定应捕获目标,通过参与者提交与网络爬取获得信息。
截至目前,IIPC已借助Internet Archive提供的工具 Archive-It形成了可在线检索的获得网站访问许可的5000条存档网页资源,具体信息涵盖标题、网址、内容描述、捕获实践、国家、域名等类别。这些资源包含15种语言如英文、葡萄牙文、德文的网络信息,中文信息亦得到一定的捕获,总数排名第13位,如我国应急管理部的疫情专题首页自2020年3月20日以来被存档3次[6]。
以传承国家信息资源与文化遗产为重要职责的档案馆、图书馆、博物馆等记忆机构正在全球范围内面向国家层级从官方视角发起战“疫”材料征集,网络信息成为重要组成。以我国为例,国家图书馆在2020年4月22日发起联合全国各级各类图书馆的中国战“疫”记忆库建设项目,通过面向社会公众的广泛征集活动,完整记录全国人民抗“疫”的真实情境,包括疫情防控中运用的新技术和社会管理形态的变化,如数字化生活、网上办公、线上学习等都被设置在捕获范畴之中。
项目的参与者极为开放,包括全国党政机关、企事业单位、社会团体和社会各界人士,资源类型涵盖文字、图片、音频、视频等多媒体资源以及实物。当前,项目尚处在征集阶段,将成为常态化工作;征集方式包括网络资源采集、多渠道征集、交换及购买,并依据著作权、复制权、信息网络传播权明确征集和使用事项。根据报道,预计年底形成原型系统,满足以互动问答形式在线调取文献的需求。
新冠肺炎疫情作为重大社会事件,其存档情况无疑得到了社会各方关注,不同组织、机构、群体或个人基于各自的存档取向、资源或能力发起多样化的项目。一方面,主流机构如新闻媒介、学术团体、行业协会等有一定行动。如,华中科技大学出版社联合参战医院和海内外传媒机构共同打造武汉战“疫”数字博物馆,向海内外公众征集战“疫”过程中的各类资料,形成在线可用的档案库[8]。项目保存对象是抗“疫”过程中的个人故事与生活,强调真实原创,鼓励医务工作者、患者、各方志愿者、“疫区”群众等作为主要参与者,贡献音视频、文字、图片;内容应描述标题、创作人、联系方式、发生地点。一经录用,提供完整规范的版权保护。
另一方面,拥有不同专长的群体和个人亦参与其中。截至2020年5月,79个项目借助技术开源社区Github平台广泛参与新冠肺炎疫情存档,收集、保存包括数据、新闻、微博、文章等多种类型的资源。其中,以个人为主体构建的新冠肺炎疫情存档项目占比高达84.81%。此类实践一般选择开源软件与服务平台进行分布式共建的网络收集、上传与发布,由社群成员自主选择、收集、保存内容。以“2020新冠肺炎疫情个人故事”项目为例,项目旨在保存我国普通公众在疫情期间的个人生活记录,选择豆瓣网络日志为存档来源,大部分记录来自湖北武汉,反映了战“疫”期间武汉普通市民的真实生活。
实践显示,网络信息存档渐成规模且已有多方成果的直接原因,在于前瞻性的存档布局和行动设计。新冠肺炎疫情这样的重大社会事件有着难以完全管控的随机性,面向各类平台各类主体不同视角和事件角色或过程中存在于复杂传播网络的庞杂信息,需要存档主体有充分的重大社会事件存档嗅觉,从而及时启动存档项目且付诸具体行动。IIPC能成为较早启动项目并已有可供利用的存档结果,原因就在于其本身具有面向国际性事件的存档机制,从设置的内容开发小组到具体的流程都较为成熟。再以我国为例,前期各地方图书馆、档案馆或博物馆征集的资料并没有明确指出包括网络信息,而国家图书馆的战“疫”记忆库项目能将网络信息纳入,很大程度在于它是我国互联网信息社会化保存项目主导方。
在事件维度的牵引下,跨平台、跨主体、跨过程、跨内容的信息存档需要的是多方协同。一方面,多元发起主体立足不同的目标与对象展开多样化行动,不同项目的成果,在信息来源、记录对象、记录视角上相互交叉、叠加、互补,形成还原度更高的档案结果。如,Github平台的多个项目在2月初就着手对国内疫情信息进行存档,以期补足国家图书馆缺失的部分网络信息。另一方面,即使是单个项目,也需要不同主体形成协作网络,从而获得多维度多层级的资源与方法支持。如,国家图书馆主导的战“疫”记忆库已明确指出合作方是各级图书馆与网络平台。同时,这些或大或小的项目无一例外地倡导社会参与。
实体与数字空间的深度融合趋势意味着网络信息存档同其他空间的档案工作在方法、经验、资源上须强化协作,这在新冠肺炎疫情中尤为显著。新冠肺炎疫情除网络信息外形成了大量离线信息或其他形式的记录,共同形成更全面完整的记录结果,且随着线上利用需求的倒逼,这些信息也将进入网络档案库。因此,新冠肺炎疫情的网络信息存档在具体实践中并不只是独立行动,而是作为整个事件档案化体系的有机组成。以国家图书馆的战“疫”记忆库为例,它的提出更具整体视角,在信息对象上涵盖各种空间中形成的各类形式的记录,关键点不仅在于存档范畴的开放性与包容性,也在于它以“库”的形式将存档结果设定为不同形式对象的融合。
纵观新冠肺炎疫情网络信息存档实践,其进展为我国更加系统的存档规划与行动乃至未来更多的重大社会事件网络信息存档,提供了值得深入思考的策略。
网络信息的形成与传播是即时、非线性和碎片化的,面临失真失存的风险,且重大社会事件在记录主体、数量、内容、平台等方面更加复杂,不是短期内可完成的存档任务。因而,存档的及时性体现于尽早展开综合性部署规划,在疫情尚未完全解决、信息将持续增长的情况下就体现为需要在当下制定存档框架与方案。同时,行动层的落实要在疫情后期紧凑展开,可以试点的方式依据存档框架与方案实施更具针对性的行动。
由此,一方面要明确存档目标,以我国可以构建全景映射重大社会事件多方面与持续性过程的网络信息资源完整体系为最终的整体目标,这是驱动记忆领域与社会多元参与的重要力量。另一方面要设定适用不同阶段不同存档条件与要求的过程性方案,循序渐进地落实存档行动。如,在不能一次性捕获所有信息的前提下,依据同重大社会事件的密切度与价值来确定信息捕获的优先级。再如,在无法捕获部分平台完整信息及其元数据的情况下,可暂时“妥协性”地简化格式与元数据要求,既可为后续形成完善信息提供线索,也可在原生信息丢失的情况下保存具有一定价值的不完整样本。
记忆领域从意识、战略、能力、行动等方面,对引领新冠肺炎疫情这一对我国与我国人民而言有着重要分量的社会事件的网络信息存档有着“天然”使命。记忆机构除档案馆外,还包括同样以构建国家记忆为目标的图书馆与博物馆等相关机构,可从专业上提供针对可信档案信息资源建设更加专业的方法与制度指导,且可作为资源基地提供保管和后续的开发利用功能。同时,网络信息的复杂性也意味着应发挥群体力量,实现更具体系与规模的存档,这包括档案的高校学术团体与学者、提供技术和资源支持的社会组织等。其中,可发挥更具庞大基数的网络信息的形成者、传播者和利用者的行动力,通过建立众包型的平台,由网民提供信息、帮助鉴别信息、组织和描述信息、开发信息产品等。
重大社会事件的网络信息存档在我国还处于初步进程中。为实现最优目标,一方面,在我国记忆机构包括档案馆、图书馆、博物馆等具备的馆网跨层级、跨地区、跨系统的连接优势下,将线下征集的规模化行动拓展至网络空间。尽管目前网络信息存档相比发达国家有一定差距,但此前面向社会的征集经验和方法都可立足网络空间进行适应性调整以形成我国模式独具的全国广泛力量的集聚。如,目前在征集宣传上,官方网站、社交媒体、电视媒介等都包含在内。
另一方面,国际上已有实践可从经验与问题的正反两大方面提供借鉴,涉及存档主体、存档范围、存档方法、存档成果的资源化、存档成果的利用等。如,IIPC的内容征集机制与流程以及存档各环节已提供的数十种数字工具,都是可供使用或改良的基础。
本文为国家社会科学基金项目“基于多元数字技术的网络空间参与式归档研究”(项目号:18CTQ037)的研究成果。