袁轶男
(南通市崇川区文化艺术中心,江苏 南通 226000)
在数字时代,社交媒体是政务信息发布、舆情监测、文化传播、知识构建的主要阵地,而社交媒体数据也成为网络治理、信息管理、舆情分析的主要数据源,因此,社交媒体数据的长期保存极具重要性。但就目前来看,我国社交媒体数据的长期保存不管是从隐私方面还是政策方面都存在一系列问题,严重制约了我国社交媒体数据归档方面的发展。本文就数字时代我国社交媒体数据的长期保存问题提出了相关的策略,力求推动我国社交媒体归档事业的发展。
社交媒体是互联网中信息生产和交换平台的统称,是提供社会性网络服务的工具或平台。现阶段,最主要的社交媒体包括微信、微博、知乎、抖音等,用户可以在社交媒体上分享自己的经验和看法。社交媒体正以一种全新的互动交流方式改变着人们的工作生活,它既是信息传播、获取的过程,也是知识创造、分享的平台。社交媒体数据就是社交媒体中创造、传播的信息,在数字时代,社交媒体数据极大地推动了社会的发展,其长期保存的问题也成为当下图书馆情报行业关注的热点。
在数字时代,社交媒体数据具有3个特点。首先,社交媒体数据的传播速度快,能即时反馈。社交媒体数据的传播快,主要是由于其交互式传播的方式,即民众既可以即时接收信息,同时也能即时将信息传播出去[1]。其次,社交媒体数据具有原创性。社交媒体的每一个用户都有创造和传播的能力,用户可以以图片、文字、视频、音频等形式分享自己的创作内容,同时也能对其他用户的创作发表看法。最后,社交媒体数据具有传播人性化的特点。在大数据时代,社交媒体能分析和挖掘用户感兴趣的内容,自动向用户推送用户感兴趣的内容,同时用户也能自由地选择想接收的内容和接收的时间。
档案是各项工作最真实和原始的记录,能起到凭证的作用,是判断工作的历史依据,而社交媒体数据在某种程度上能反映相关职能部门的职能活动,具有档案属性,能起到凭证的作用,应当予以妥善保存。在大数据时代,用户的个人信息、原创内容、社交信息都以数字代码的形式存储在社交媒体的服务器中。我国在《关于办理刑事案件收集提取和审查判断电子数据若干问题的规定》中明确指出,“在初查过程中收集、提取到的电子数据可作为证据使用”[2]。因此,在产生法律纠纷时,社交媒体数据可以作为法律的凭证来维护用户的合法权益。另外,政务社交媒体平台发布的内容包括医疗、教育、养老、就业等,与民众生活息息相关,社交媒体数据的保存能为政府的公务行为提供证据。
现阶段,许多公共行政部门开始在社交媒体发布消息,这是互联网环境催生出的新型网络问政方式,是政务活动与社交媒体的一种结合。利用社交媒体平台,政府机构能实现政务公开,更好地占据舆论阵地,提升政务信息的传播速度和扩大传播范围,实现政民互动。在数字时代,政务社交媒体平台承担了政府的部分职能,能够体现我国党政机构借助互联网技术逐步地深入群众、深入基层,更好地服务大众。
在传统媒体时代,报纸、杂志等“一统天下”,话语权多由官方掌握,很多的文化记忆往往是官方记忆。而随着社交媒体的出现,信息的传播主体变得多样化,用户也可以成为传播者,另外,传播内容、传播媒体也更加丰富,越来越多的用户成为文化的传播者。在数字时代,“大众记忆”逐渐成为社会的记忆,用户在社交媒体发布的内容,在一定程度上反映了当时的文化,也是时代的缩影。在数字时代,图书馆及其他的文化机构都逐步加入了社交媒体,并且发布了很多与区域相关的历史、文化、城建、科教等内容,这些内容很好地记录了一个区域文化、历史的发展,极具文化价值。在数字时代,官方发布的内容下面往往包含有大量的公众评论,这些评论在一定程度上决定了社交媒体数据的受众程度,对于构建区域文化记忆意义非凡。
在大数据时代,通过数据分析就能从用户发布内容、检索内容中准确地分析出用户的职业、兴趣、政治立场等个人隐私内容。国外曾对Facebook的制度化存档问题做过调查,支持存档和不支持存档的用户各占一半,这意味着用户还没有意识到社交媒体数据存档的重要性。另外,在不支持制度化存档的用户中,约有80%的用户担心制度化存档会让用户丧失对数据的控制权,同时也担心自己的社交媒体数据存档后被一些不法分子恶意利用等[3]。在大数据时代,个人信息泄露的问题层出不穷,尤其是现在,社交媒体已经成为民众工作和生活的重要组成部分,社交媒体数据的长期保存必然会出现用户个人信息的泄露。因此,要实现社交媒体数据的长期保存,就要在个人隐私、社会价值之间寻求一个平衡点,在得到用户授权的情况下有选择、有范围地进行数据的保存。
技术的限制是社交媒体数据长期保存最客观、最直接的障碍。首先,传统的存档技术主要采用Web Archive技术,包括两种形式的存档,即基于比特的存档和基于内容的存档。在网页的保存中,主要采用基于比特的存档形式,保存的内容包括样式表、JavaScript 编写的脚本内容、HTML文件等,其目的是方便用户在Web浏览器中查看[4]。而图片、文本、视频等采用的是基于内容的存档形式。Web Archive技术是目前社交媒体最常用的存档技术,但这种技术不够先进,同时很容易造成原格式的丢失和数据的交互性缺失。其次,随着我国各级政府、企业及科研团队等入驻社交媒体,社交媒体需要保存的数据量越来越大,并且需要进行批量的数据采集,但由于大多数社交媒体数据捕捉的速率有限,很难达到要求。最后,对海量数据进行长期保存主要是为了日后发挥其价值,数据的数量不断增加,数据的格式类型也更加丰富,因此对数据加工的软件硬件等都有了新的要求,目前的技术同样也达不到这个要求。
数字时代,我国在社交媒体数据存档方面也制定了相关的政策,并颁布了《中华人民共和国档案法》(修订草案)《中华人民共和国侵权责任法》《中华人民共和国网络安全法》等法案,在一定程度上推动了社交媒体数据归档工作的开展,但在实施的过程中也出现了一系列的问题。首先,社交媒体数据的价值判断问题。在数字时代,社交媒体数据的数量非常庞大,其价值判断标准很难统一,有关部门曾提出几个问题作为社交媒体数据价值判断的标准,但在实际的应用中,这些问题的实操性很弱,图书、档案部分很难做出判定[5]。其次,政府机构制定了一系列的管理政策,但各部分选择的数据类型不一,最后形成的社交媒体档案形式各异,没有一套统一的归档标准,因此后续的工作很难推进。最后,数字时代的社交媒体存档工作是需要多主体协作开展的,如何界定归档工作的主体和范围,以及如何明确责任主体是社交媒体数据归档工作中必须要解决的问题。
我国社交媒体存档工作起步较晚,相关政策不够完善,在很大程度上制约了社交媒体数据的长期保存。在数字时代,社交媒体数据的长期保存要做到政策与标准先行。具体工作可以从以下几个方面开展,首先,要借鉴国外的存档实践,立足于我国的国情,制定具体的政策和标准。例如制定数据的采集标准、存储结构及长期保存技术体系等。其次,由于社交媒体的数据量非常庞大,所有数据的长期保存难以实现,因此,国家档案部门要搭建其基本的管理原则和管理方法,优先对政务社交媒体进行归档,并且,政务社交媒体账号发布的内容与评论是一个数据整体,其中一些独到的观点及转发时的评论都是民众意见的真实反映,具体纳入归档的数据范围还需要制定相应的标准及专家的研究。最后,在数据保存方面,美国、英国等国家有一整套的数据加密、检测、备份、迁移等长期保存策略,并且有相当完整的技术架构,包括动态网络存储方式、语义存储方式、分布式存储方式及云技术存储方式,这些策略都能为我国的社交媒体数据长期保存提供参考[6]。
社交媒体数据的长期保存是一项繁杂且持续的工程,需要投入大量的人力、物力、财力等,单单依赖图书馆是难以完成的。在国外,社交媒体数据的归档工作主要是由图书馆和档案馆主导,科研机构、企业参与的多元协作机制。在数字时代,社交媒体是民众活跃的主要阵地,其中蕴含了大量有价值的信息,图书馆和档案馆作为保存人类文化遗产、传承中国文化的主要机构,有义务采集、储存这些有价值的数字资源。为了更好地保存社交媒体数据,要建立起多元协作的组织结构。立足于我国国情,图书馆和档案馆应主动承担社交媒体数据长期保存的使命,承担主要责任,努力争取社会资源支持,积极寻求多方合作,在政策和法律的支持下,联合其他文化机构、第三方商业机构,形成多元协作的组织形式,推动社交媒体数据长期保存工作的顺利开展。多元协作的组织形式是社交媒体数据长期保存的发展趋势,多元协作的组织形式能充分利用各个机构的优势,理顺各方关系,促进各机构的深入合作。另外,不管是哪个主体都要与社交媒体的服务商签订合作协议,获取数据采集和管理的权利,协助服务商进行数据管理,从而确保工作的正常推进。最后,要从政策方面入手,制定合理的政策,明确归档工作中的领导主体,确定责任归属,完善监督机制。
社交媒体数据保存的最终目的是实现归档资源的利用。在开展存档工作时,馆方要注意工作开展的层次性。社交媒体数据长期保存工作是一项长期的任务,在规划中一定要避免“追赶潮流”、大规模地建设数字图书馆和数字档案馆,要循序渐进,根据各地文化发展情况,选取数个实验点,开展存档工作。从而在具体的实践工作中评估项目的价值、效益及不足等,并在后续的发展中及时挑战发展策略。在长期的探索中,我国已经逐步开展了社交媒体数据归档工作,很多存档资源已经被再次利用。为了实现归档资源的利用,图书馆要完善数字图书馆的检索和访问机制,开发和利用多媒体检索、智能检索、语音检索等,为用户提供智能化、精准化的检索服务。另外,要把握数字时代的发展趋势,深入挖掘社交媒体数据的价值,利用大数据及时对存档的数据进行深层次的开发和利用,针对不同的应用场景、服务需求等,为用户提供多元化的资源利用方式。
在数字记忆时代,社交媒体数据作为网络信息资源的重要组成部分,其长期保存问题是图书馆情报领域研究的重点内容。文章就数字时代我国社交媒体数据长期保存的必要性及制约因素提出了相关的策略,借此望能拓宽图书馆、档案馆、政府机构、企业等之间的合作路径,推动归档工作体系的规范进程,促进社交媒体数据资源再利用。