卢羿芝
摘要:本文梳理了英国国家档案馆近十四年来政务社交媒体实践的历程、内容与特点,为我国相关专业实践提供参考。基于对英国国家档案馆政务社交媒体存档实践的案例分析和文献阅读,了解其存档实践的发展过程、工作流程和实践特点。英国国家档案馆在政务社交媒体存档实践上发展较早且迅速,对社交媒体存档有着明确的政策、资金、人才和技术支持,并且建设了世界上首个可全文搜索的社交媒体档案库,上述做法对中国社交媒体存档实践有着较好的借鉴意义。
关键词:英国国家档案馆 政务社交媒体 存檔实践
Abstract: To sort out the development, content and characteristics of the government social media practice of the National Archives of the United King? dom in the past 14 years. It aims at providing refer? ent experience to our country in relevant professional practices. Based on case studies of the government social media archiving practices of the National Ar? chives of the United Kingdom and the literature read? ing, this article aims at reveal the development, pro? cess and characteristics of archiving practices. [Re? sults/Conclusions] The social media archiving prac? tice of the National Archives of the United Kingdom starts early and develops rapidly, getting support in policies, funds, talents and techniques. And the ar? chives build the worlds first full-text searchable so? cial media archive, which has better significance for social media archiving practice of our country.
Keywords: The National Archives of the United Kingdom;Governmentsocialmedia;Archiving practice
社交媒体是政府发布、管理和传播信息的重要媒介,是政府与公众沟通的重要工具。但数字信息具有动态性,存在的任何阶段都可能发生改变。存档政务社交媒体,既有利于保存数字时代的政务信息,也能为相关人员提供查证和研究。英国国家档案馆的政务社交媒体存档探索较早,建立了在线社交媒体档案库,并且可通过社交媒体档案库实现全文搜索,其对于我国开展政务社交媒体存档有着较好的借鉴意义。
英国长期致力于存档政务社交媒体,截至2021年底,存档的YouTube、Twitter和Flickr社交媒体账户已超过644个,存档的社交媒体帖子超过190万条[1]。其存档实践大致经历了如下三个阶段。
一是起步阶段。该阶段英国国家档案馆开始探索社交媒体存档。主要表现为,档案馆与互联网记忆基金会在2008年试点捕捉社交媒体内容[2]。并于2010年尝试使用基于Heritrix的标准流程对社交媒体进行存档[3],但仅能对Twitter和You Tube平台的部分资源进行存档,效果并不显著。
二是成立社交媒体档案库阶段。随着政务社交媒体账户的增加,以及大量政府信息通过社交媒体发布。2014年,英国国家档案馆在线社交媒体档案库(Online Social Media Archive, OSMA)正式建立[4],成为英国政府网站档案馆(UKGWA)的重要组成部分[5]。与此同时,英国国家档案馆也正式开始对中央政府部门发布在Twitter和You Tube账户上的推文和视频进行存档。这标志着政务社交媒体将被作为官方公共文件得以永久保存,并被纳入存档实践中。截至2020年,OSMA已拥有超过877000条推文和39900个YouTube视频[6]。
三是社交媒体存档完善阶段。该阶段的主要成绩是改进了社交媒体档案库的页面和搜索功能,以提供更好的用户体验,并大力提升了社交媒体档案库的利用率。
英国国家档案馆开展政务社交媒体存档的实践主要是三项活动,即:对政务社交媒体信息的采集、保存和开发利用。
(一)政务社交媒体信息的采集
政务社交媒体信息采集是由英国政府、英国国家档案馆和信息服务商来协同完成的。在采集政策的制定、采集工具的选取和采集范围的确定等方面,均有特色。
一是采集政策制定上,对存档的主体和范围进行了明确规定。主要表现为发布了《操作选择政策:英国中央政府网站》(OSP27),规定了社交媒体的存档范围[7],主要涵盖中央政府部门、非部委公共机构、皇家委员会等在社交媒体平台上发布的信息。同时,还制订了《记录收集政策》(Records collection policy),要求对于具有历史价值和现实意义的记录应当永久保存,这些记录包括纸质记录、声像记录和来自社交媒体渠道的记录等[8]。
二是采集范围的确定上,对属于皇家版权的政务社交媒体信息进行采集。该处的皇家版权在《版权、设计和专利法》中被定义为:“英国政府的官员和工作人员在职责范围内制作的文件”。采集的文件包括中央政府部门、非部委公共机构等发布在Twitter和YouTube两个平台上的信息[9],并且规定只存档属于皇家版权的社交媒体账号信息,反之则要在版权方授权之后才能进行采集。具体而言,Twitter社交媒体平台的采集范围为国家政府机构、非内阁部门的推文,以及属于UKGWA归档的网站链接。而对于推文的转发、其他用户对推文的评论和政府官员个人账户信息则不在采集范围内[9]。YouTube平台的采集范围则是YouTube上的视频内容,及其标题、日期、标签等内容。
三是采集工具的选取上,采用云捕获的方式。比如其中最早的合作单位互联网记忆研究基金会(Internet Memory Foundation, IMF)是通过Application Program? ming Interface (API)来定期捕获和存档英国政府部门的推文、YouTube视频和元数据[10],并通过提供自定义界面对它们进行访问。另一合作单位MirrorWeb在2018年开始利用云捕获的技术方法[11],通过Twitter API和You? Tube API对新发布的内容进行捕获,此外还能对推文上嵌入的视频和图片进行采集捕获。
(二)政务社交媒体信息的保存
对采集的政务社交媒体信息进行有效保存,不仅能够確立和维护政府的权利和义务,也便于后续开发利用。为了确保政务社交媒体信息的有效保存,英国国家档案馆主要采取了以下措施。
一是将政务社交媒体数据存储在云端。整个过程是由MirrorWeb服务商负责在Amazon Web Services(AWS)混合云上运行,具体如图1。首先是对政务社交媒体进行检验。通过API验证后才对采集的数据进行处理,即在云端处理和创建数据[12]。检验的标准为是否包含社交媒体信息的图像和视频等内容。其次是将通过检验的政务社交媒体数据以JSON或XML格式[13],通过Heritrix和专有工具Electrolyte存储在AWS上[14]。最后将数据以JSON或XML格式从数据库中读取出来,以便后续对数据进行回放。
二是创建数字保存风险评估模型。英国国家档案馆不仅注重存档内容的安全保存,也将保存视为一种风险管理过程。其与计算机科学和统计学领域的专家合作,开发了DIAGRAM模型(数字存档图形风险评估模型)[15]。该模型具有量化风险,保存数据的完整性和真实性,以及确保数字信息连续性访问的特点。在该模型的辅助下,档案工作者可预先分析风险,如存储故障、数据完整性缺失等问题,然后有针对性地开展应对措施。
(三)政务社交媒体信息的开发利用
政务社交媒体存档不仅是对政府数字记忆的保存,其最终目的还包括开发利用,英国国家档案馆主要采取了如下措施。
一是开发社交媒体档案库。该档案库包括Twitter档案库和视频档案库,可实现对存储在其中的数据进行回放[16]。在最新的优化界面中,档案库的页面顶端增加了搜索框,可通过时间和来源项精确检索。同时改进了推特账户和YouTube账户的图标显示,并且增添了推特和YouTube的即时访问链接。截至目前,推特档案库总计存档了内阁办公室、外交与联邦事务部和卫生署等479个政府机构推特账户[17]。视频档案库总计存档了254个英国政府的YouTube账户[18]。
二是建设跨库检索。MirrorWeb通过Elastic? search技术实现了跨社交媒体档案库的全文搜索功能,这是世界上第一个能够进行全文搜索的跨社交媒体档案库,其能够同时检索Twitter档案库和YouTube档案库的内容。
一是注重协同与合作。政务社交媒体存档是由英国国家档案馆主导负责,但具体的技术实现由外包公司承担。英国国家档案馆主要负责对存档范围和对象的界定,以及确定存档的时间、地点、方式、标准和采集的频率。技术实现上是与MirrorWeb信息服务提供商合作,由其提供数据捕获、保存、迁移以及开发利用等。
二是明确的政策制度。包括制订了《1958公共记录法》(Public Records Act 1958)、《操作选择政策:英国中央政府网站》(OSP27)和《记录收集政策》等。尤其是《版权、设计和专利法》和《皇冠版权—政府部门概览》,明确了存档内容所涉及的版权问题,避免了政务社交媒体的版权纠纷。
三是注重打造专业人才团队。英国国家档案馆被艺术与人文研究委员会(AHRC)认定为具有独立开展和领导研究计划能力的机构,在人才团队打造方面主要做了以下工作:一是优化存档团队。负责政务社交媒体存档的人员来自档案学、统计学、数字和网络开发等各个领域,实现了能力与技能互补。二是加强对团队成员技能的培训。英国国家档案馆开发了专门数字保存培训项目,如2020年开展的Novice to Know-How培训项目,主要是面向档案专业人员开展的免费在线数字保存培训项目[19]。
四是为用户提供良好的利用体验。主要表现在不断改进社交媒体档案库的页面展示方式和检索方式。通过对比新旧版本档案库可以发现,新档案库的设计使用了英国国家档案馆的WordPress模板,对导航设计、图标和图片的呈现都做了改进。Twitter和YouTube档案库的账号图标改成了缩略图的形式,直观生动地展示了页面层次结构,使得页面排版和文本内容更为简洁和清晰。其次是实现了档案库的全文搜索功能,即可通过筛选平台和年份等选项提高检索的精确度。
英国国家档案馆作为较早开展政务社交媒体存档实践的先行者之一,其存档的经验值得借鉴。
(一)明确政务社交媒体存档的权责关系
政务社交媒体存档涉及政策、技术、管理等诸多问题,需要多主体协同与合作,其中明确相关主体的权责关系尤为重要。
首先是明确存档的主导机构。对政务社交媒体存档主导机构的划分一般为三类:政府机构主导、记忆机构主导和社交媒体平台运营商主导[20]。在我国,政务社交媒体存档可由国家档案局主导,开展业务指导和监督工作,各级综合档案馆执行,各类专业档案馆协同配合。缘由是我国《档案法》明确规定:“全国的档案工作由国家档案主管部门主管,负责全国档案事业的统筹规划和组织协调”。类似于英国国家档案馆主导的集中式政务社交媒体文件管理模式。
其次是信息服务商的技术支持。由于社交媒体文件产生速度快、类型多、数量大,对技术要求较高。因此由专门的技术公司负责比较合适。信息服务商根据档案部门提出的需求和标准,收集、整理和分析政务社交媒体的信息数据,建设、维护和更新存档的工作平台,为政务社交媒体存档提供所需的设备和技术支持。
再次是第三方媒体平台的底层支撑。第三方社交媒体平台作为内容的生成渠道,是存档部门捕获信息的内容来源,因此政务社交媒体存档对平台具有依赖性。同时第三方社交媒体平台具有保护平台用户著作权的责任与义务,所以也要对存档部门在平台进行的存档工作进行授权。因此存档部门需与第三方运营商合作,通过协议的方式明确各方的权责利。
(二)完善政务社交媒体存档的业务规则
良好的业务规则能对政务社交媒体存档提供指导与规范,需重点在以下方面进行完善。
一是明确存档主体与业务规程。可在《档案法实施办法》中进一步细化政务社交媒体存档的责任主体。在《政府网站网页归档指南》中明确政务社交媒体存档的具体对象、范围和时间,以及收集、整理、移交接收的整个操作规程。而英国国家档案馆政务社交媒体之所以发展成熟,重要原因则是其围绕社交媒体存档项目中所涉及的主体、范围和时间等颁布了《记录收集政策》和《操作选择政策》等一系列文件。
二是明确存档权限。由于我国目前还没有建立相关的社交媒体呈缴本制度,因此在明确社交媒体的版权归属问题上,可考虑在《中华人民共和国著作权法》中予以明确,具体是:第三方社交媒体平台对本平台内容拥有所有权,存档部门和信息服务商要在第三方社交媒体平台的授权下获取数据。同时还需在《信息网络传播权保护条例》中明确政务社交媒体存档过程的侵权行为和法律责任。
三是完善存档标准。可在《电子文件存储与交换格式》(GB/T33190—2016)、《党政机关电子公文归档规范》(GB/T 39362-2020)、《电子文件归档与电子档案管理规范》(GB/T 18894-2016)、《归档文件整理规则》(DA/T 22—2015)等规范中明确政务社交媒体的采集、分类、存储与交换格式、元数据留存等标准。
(三)加大社交媒体存档的专门人才培养
档案人才的培养要顺应新时代的发展,培养专门的政务社交媒体存档人才即是内容之一。
一是通过专门教育机构的人才培养。转变高等教育档案人才培养体系,适应新形势的发展。加快档案学新文科建设,更新教学内容。推动计算机信息技术与档案专业跨学科融合。
二是档案部门的内部培养。强化继续教育,提升在职档案工作者的信息素养和业务技术。首先与高校和档案学会等组织协同合作,开展短期档案信息技术培训。针对存档工作的需要,邀请国内外有关专家和技术人员开展线上或线下的知识培训或讲座。
(四)加强政务社交媒体存档的利用
实现政务社交媒体资源的利用是政务社交媒体存档的最终目的之一,可以从以下方面入手。
一是注重数据库建设。政务社交媒体信息具有重要的凭证价值和信息价值。以用户需求为导向,建立专门数据库,提高社交媒体档案库的利用率。首先是注重便捷性,将多个社交媒体平台的政务信息资源整合为统一的数据库,建设跨库资源数据库。其次是注重多元性和趣味性,建设图片、视频等多模态的子数据库,吸引更多用户使用数据库。最后是将数据库建设外包给专业数据库建设团队,注重数据库的后台管理和监测,确保数据库数据信息的稳定性、安全性和及时性。
二是建设完备的检索系统。检索服务是连接用户与后台数据库的桥梁,是数据利用的关键。检索方式的设置遵从“穆斯定律”和“齐夫最小努力原则”,提高简便性和易用性,增强用户查询的意愿。
英国国家档案馆在政务社交媒体存档的政策、技术和资金争取等方面均取得了不错的效果,值得我国研究与借鉴。特别伴随社交媒体的日益普及,我国各级政府正广泛通过社交媒体平台发布政务信息,对于其有效存档是档案行业应对新实践的需要,应当在政策、技术、资金和人才等领域协助推进政务社交媒体存档。但同时需要注意的是,在大力推荐社交媒体存档实践的过程中,也要注意网络空间的安全,信息所有权的界定和技术设施的完善等方面的问题。
参考文献
[1]Preserving UK Government history for 25 years[EB/OL].[2022-02-15]. https :// blog. nationalarchives. gov.uk/preserv? ing-uk-government-history-for-25-years/.
[2]Vlassenroot E, Chambers S, Lieber S, etal. Web- ar? chiving and social media: an exploratory analysis[J]. International JournalofDigitalHumanities, 2021,2(1):107-128.
[3]MakingtheUKGovernmentSocialMediaArchiveevenbetter[EB/ OL].[2022- 03- 25].https: //laptrinhx.com/news/making- the- ukgovernment-social-media-archive-even-better-R93Rk6A/.
[4]TheNationalArchivesMakesSocialMediaPartoftheNa? tionsOfficialHistory-Videosandtweetsarchivedonlineasthepub? lic record [EB/OL].[2022- 02- 16].https://cdn.nationalarchives. gov.uk/documents/press-release-social-media-archive.pdf.
[5]Webster P, Clough P, Demartini G, etal. Exploring entitycentric methods in the UK Government Web Archive[C]. CEUR Workshop Proceedings, 2016, 1611.
[6]The social media archive is now fully searchable[EB/OL].[2022-02-16]. https :// www. nationalarchives.gov.uk/about/ news/the-social-media-archive-is-now-fully-searchable/.
[7]OSP27:UK government Web Archive[EB/OL].[2022- 02-26].https://cdn. national archives.gov.uk/documents/informationmanagement/osp27.pdf.
[8]Records collection policy[EB/OL].[2022-02-26].https://cdn.nationalarchives.gov.uk/documents/ information- man? agement/records-collection-policy.pdf.
[9]The National Archives.Operational Selection Policy OSP27: UK Central Government Web Estate[EB/OL].[2022-02-24]. http://www.nationalarchives. gov.uk/ documents/information-manage? ment/osp27.pdf.
[10]Archiving socialmedia[EB/OL].[2022-02-20].https:// blog.nationalarchives.gov.uk/archiving-social-media/.
[11]MakingtheUKGovernmentSocialMediaArchiveevenbetter[EB/OL].[2022-02-20].https://blog.nationalarchives.gov.uk/mak? ing-the-uk-government-social-media-archive-even-better/.
[12]Captures in the cloud[EB/OL].[2022-03-22]. https:// netpreserveblog. wordpress.com/2021/02/09/making-the-ukgovernment-social-media-archive-even-better/.
[13]EspleyS,CarpentierF,PopR,etal.Collect,preserve,access:Ap? plyingthegoverningprinciplesoftheNationalArchivesUKGovernment WebArchivetosocialmediacontent[J].Alexandria,2014,25(1-2):31-50.
[14]SEC 17a- 4[EB/OL].[2022- 05- 8].https://www.mir? rorweb.com/solutions/regulatory-compliance/sec-17a-4.
[15]Barons M, Bhatia S, Double J, etal. Safeguarding the na? tions digital memory: towards a Bayesian model of digital preser? vationrisk[J].ArchivesandRecords, 2021,42(1):58-78.
[16]UK Goverment Web Archive[EB/OL].[2022-02-14]. https://www.Nationalarchives.gov.uk/webarchive/.
[17]Twitter Archives [EB/OL].[2022-02-16].https://we? barchive.nationalarchives.gov.uk/twitter/.
[18]Video Archive- UK Government Web Archive[EB/OL].[2022-02-16].https://webarchive.nationalarchives.gov.uk/video/.
[19]New digital preservation training for archives[EB/OL].[2022-03-26]. https :// www. nationalarchives. gov.uk/about/ news/new-digital-preservation-training-for-archives/.
[20]張晓娟,李沐妍.政务社交媒体文件的管理模式研究[J].信息资源管理学报,2018,8(03):45-53.
作者单位:广西民族大学管理学院