王雪宁 董庆兴 宋志君 张 斌
(1.华中师范大学信息管理学院,武汉,430079; 2.武汉大学新闻与传播学院,武汉,430072;3.武汉大学大数据研究院,武汉,430072; 4.南京大学信息管理学院,南京,210023)
互联网技术的发展给人们带来丰富信息的同时也降低了错误信息的传播门槛和成本。大量错误或尚不能确定真实与否的信息在社交媒体上传播,使得用户很难在良莠不齐的信息中找到自己所需要的可用信息。这种现象严重破坏了网络信息生态环境,降低了人们对网络信息的信任度。因此,防控社交媒体上泛滥的错误信息,已成为亟待解决的难题。错误信息作为社交媒体信息管理领域的一个重要研究议题,其传播、演化的仿真研究[1-2]以及基于社交网络的识别和检测研究[3-4]已取得一系列成果,但错误信息防控还没有引起学者们的广泛关注。信息管理领域虽然已有根据用户的行为特征探讨辟谣效果[5-6]的研究,错误信息检测、传播研究也会附带讨论一些防控策略[7],但整体来看,研究大部分停留在政策建议层面,使用科学研究方法探索错误信息防控的研究较少。了解多个学科错误信息防控的研究成果,有助于信息管理领域的学者进一步开展该方向的研究。已有关于错误信息的综述虽然不少,但主要集中于传播机制、形成原因、影响因素、检测方法等主题,很少有对防控策略进行系统的整理。此外,信息管理领域的研究大多聚焦于错误信息用户和传播渠道。而从信息生态的角度来看,信息、信息人、信息环境之间相互联系、相互作用,三者共同影响整个信息生态系统的演变和发展[8]。因此,面对错误信息对信息生态造成的危害,有必要从信息、信息人和信息环境这三个角度来分析错误信息的防控机制。所以,本文以提供了分析信息、信息人、信息环境三者互相影响、共同演化机制视角的信息生态理论为基础,结合错误信息传播前预防、传播中阻碍、传播后纠正三个阶段,系统、整体地把握错误信息与防控策略间的互动规律,更全面地梳理和概括社交网络中错误信息的防控策略。
错误信息(misinformation)有狭义和广义之分。狭义的错误信息指无意传播的虚假或不准确的信息[9]。广义层面上的错误信息不区分传播者的意图[10-11],包含在社交媒体上传播的所有假的或不准确的信息,如虚假信息(disinformation)、假新闻(fake news)、内容虚假的流言(rumor)等。虚假信息与狭义的错误信息相对应,指刻意制造并故意传播的虚假或不准确的信息[12],两者关键区别在于主观意图,即信息是否故意用于欺骗。假新闻是故意制造的伪新闻式虚假信息,是虚假信息概念的一个子集[13]。英文语境下的rumor指信息来源不明且被广泛传播的讯息,可能真实也可能虚假[14]。中文语境下的“谣言”有明确的信源,并且内容虚假[15]。本文保持传统“谣言”概念的负面意义,使用中性的“流言”翻译英文的rumor,用“谣言”来指代那些被证实为假的流言[16]。流言在概念上虽然是中性,但大多数研究中还是有强烈的负面含义。防控流言的研究主要是对内容虚假且在社交媒体上产生不良影响的信息提出阻断和纠正策略,因此本文把流言防控研究也视作错误信息防控研究的一部分。
任何社交媒体用户都可以在网络中发布信息,现有的技术很难测量和捕捉所有生产、传播这些信息的组织或个人的真实意图。而无论制造或传播信息是否有故意欺骗的动机,错误信息、虚假信息、假新闻以及谣言等概念,都是指可能对社交媒体造成破坏性影响,内容不完整、不准确、缺乏科学证据的信息[17-18]。所以本文不明确区分这些概念,采用广义的错误信息这个总括概念,将虚假信息、假新闻、谣言等作为子概念纳入错误信息防控研究述评的范围。
现选取中国知网(CNKI)、万方数据库和Web of Science 核心合集(含SCIE、SSCI、A&HCI、CPCI)数据库作为本研究的数据源,以“错误信息/虚假信息/假新闻/谣言”“控制/防控/干预/纠正/阻断/遏制”和“misinformation/disinformation/rumor/fake news”“interven/govern/correct/rectify/fight/against/combat/contend/mitigate/relieve/alleviate/prevent/control/interrupt ”等关键词进行主题检索,检索截止时间为2021年2月10日。本文针对的是社交媒体上的错误信息,所以在中英文数据库中排除了医学、生物学、环境学、会计等不相关的学科领域。首先,由两位研究者独立检索文献并统一检索结果,共得到中文论文322篇,英文论文1172篇。为防止文献检索的遗漏,研究者在Web of Science 核心合集中以“misinformation/disinformation/rumor/fake news”为关键词进行检索,以相同的学科类别过滤规则筛选后得到5565篇文献。通过浏览5565篇文献的标题和摘要,补充了214篇遗漏的文献,最后共计得到1708篇中英文文献。然后,两位研究者独立阅读了1708篇中英文文献的正文部分,排除评论、社论以及只有政策措施的建议类文章,保留对提出的防控策略有具体的研究设计和研究结果的论文。对于不能被准确判断或筛选结果有争议的文献,第三位研究者加入讨论,协助筛选工作,最终得到225篇文献。文献数量的年度分布如图1所示,可以发现,错误信息防控研究的文献在总体上呈递增态势,其中,2010年的7篇文献包括2010年及以前年份的文献数量,因为检索时间为2021年2月,所以图1中2021年文献不完整。
图1 错误信息防控研究的主要年份及发文量
在多学科学者的关注下,已有错误信息的研究综述主要分为三大类:一是错误信息文献的研究情况,如学科领域、研究方法、年份分布、核心作者分布等[19];二是对错误信息的特征、分类、演化与影响因素等的梳理[20-21],这些研究从心理学、网络科学、传播学等学科角度,对健康医疗[22]、营销[23]、突发事件[24]等主题的错误信息研究进行系统综述;三是对错误信息的传播模型[25]、检测模型[26]、防控策略[27]的总结。已有防控策略综述主要从防控概念、模式、实践应用[28],主体(民众、权威等)、客体(技术、法律等)和主客体[29]等视角分析错误信息的防控策略。但是,很少有学者从错误信息传播的时间序列角度梳理相关文献。错误信息在社交媒体上传播时,存在不同的传播阶段,即错误信息未产生或未传播至节点时,属于传播前阶段;错误信息传播至节点并要从该节点继续传播时,属于传播中阶段;错误信息经过节点后,属于传播后阶段。相应地,不同的传播阶段适用的防控策略也有区别。鉴于此,本文计划根据社交媒体中错误信息传播前、中、后三个阶段,分别梳理可以预防传播前、阻断传播中、纠正传播后的错误信息的防控策略。
本研究根据文献中防控策略所属的阶段(错误信息传播前、中、后)对筛选得到的225篇文献进行分类。将围绕“错误信息预警和阻止其产生”主题的文献40篇归类为错误信息传播前的预防研究;将围绕“切断传播路径、阻塞传播节点及增大传播阻力”主题的文献91篇归类为错误信息传播中的阻断研究;将围绕“改进纠正有效性、提升纠正效率”主题的文献94篇归类为错误信息传播后的纠正研究。三阶段防控的文献数量年份分布见图2,图中每年三类防控文献数目之和分别对应图1中该年文献的总数目。
图2 错误信息三阶段防控研究的主要年份及发文量
此外,错误信息处于一个复杂多变的信息生态系统中,这一信息生态系统是信息、信息人和信息环境相互关系的总和[30]。错误信息作为一种特殊的信息,在维系信息人与信息环境交互时,带来了信息生态污染[31]。因此,文章结合信息生态的分析视角,分别从信息、信息人及信息环境的角度归纳每一个阶段的错误信息防控策略。从信息的角度,关注围绕错误信息本身的防控策略;从信息人的角度,梳理对不相信错误信息、相信错误信息、传播错误信息的人群制定的防控策略;从信息环境的角度,归纳与社交媒体平台有关的防控策略。综上,形成对错误信息防控策略的横向时间序列分布、纵向信息生态视角的综述框架,如图3所示。
图3 基于信息生态理论错误信息防控综述框架
错误信息泛滥加重了社交媒体中的信息污染,预防错误信息产生可以从源头上降低错误信息的负面影响。联系信息生态理论,本文从预防错误信息产生、提高信息人识别错误信息的能力以及预警信息环境污染三个方面进行文献梳理。
在错误信息产生前进行预防,可以减少社交媒体中错误信息的产生数量。但是,错误信息的具体内容是很难被精确预测的。因此,学者们试图通过预测比较容易产生错误信息的信息主题,锁定最有可能产生错误信息的信息范围,以便提前生产、传播相对应的正确信息,满足人们的信息需求,进而预防错误信息产生。主题预测通常是基于信息的文本特征,如邓胜利等[32]借助情境特征与文本特征的差异,识别出最有可能成为错误信息的话题。Vicario等[33]对社交媒体中的信息进行文本提取和情感分析后,引入错误信息的早期预警框架,通过用户的两极分化情况和确认偏差信息以识别潜在的错误信息,进而对需要预警的错误信息主题发出警告。此外,某类主题的信息随着大量用户生产、传递、消费会变得流行,与之相关的错误信息也会增加。因此,信息流行程度这一指标可用于预测容易产生错误信息的信息主题。现有的流行度预测模型主要基于发现网络特征或将方程拟合到变化的时间函数中,根据早期信息状态预测错误信息热点主题的分布情况[34-35]。
增强信息人在社交媒体环境中的识别能力、推理能力和适应能力,一定程度上可以预防对错误信息的“感染”[36]。目前主要通过信息疫苗接种和提高信息素养来提升信息人的甄别能力。接种理论的策略是通过培养信息人抵抗错误信息的心理抗体,以降低之后对该类错误信息的信任程度[37]。常见的形式是基于结果的接种,即提前向信息人提供反驳错误信息的内容,使人们较早形成正确认识,进而增强抵抗错误信息的能力[38]。效果更好的是基于原因的接种,即通过揭示错误信息产生和传播的原因、方式、过程来增强人们识别错误信息的能力[39]。如错误信息的在线推理游戏,用户可以通过参与游戏了解常见的错误信息是如何产生的,以此培养心理抗体[40-41]。疫苗接种至少可以保持一周的稳定效果[42],但并不是一劳永逸。并且,信息疫苗接种具有针对性,无法帮助人们预防未预见的错误信息。所以,预防错误信息的关键在于从根本上提高信息人对信息的甄别能力[43],一个重要途径是提高人们的信息素养[44]。信息素养是一种随信息社会发展不断演化的综合素养,体现信息人获取、分析、评价、利用信息以及解决信息问题的能力[45]。延长信息人接受信息素养教育的时间[46]、将信息技术课程与其他学科融合[47]等方法,有助于提高信息人的信息素养,增强识别错误信息的能力。
信息环境是信息生态系统运行和发展的环境,是信息人开展一切信息活动的外部背景和条件。社交平台、政府和媒体有必要采取一些手段预防错误信息污染信息环境。首先,声誉激励和问责机制是预防信息环境污染的有效方式。声誉激励和问责机制通过激励讲真话这种能提高正面声望的奖励机制以及追究散播不实内容的惩罚机制,营造鼓励真实、打击作假的信息环境氛围[48]。社交媒体平台实施奖惩手段的前提是有法律法规的支持[49],因此,通过建立健全相关法律法规、增强对网络造谣行为的追究力度,可以减少社交媒体平台上错误信息的产生[50]。Poliitifact网站从2007年开始检查政客的特定言论,并对政客开展信誉评级,降低政客言论的不透明性[51]。其次,信息的风险评估机制也有助于保护信息环境。政府在社会管理的各个层级建立风险信息采集的常态化机制,可以及时预控高风险信息的发展态势[52]。最后,主流媒体需要通过科普专业知识、积极传播具有事实依据的信息,满足公众对信息的需求,避免错误信息比与之对应的真实信息先行传播[53]。
社交媒体中的错误信息往往比真实信息传播得更快、更远、更深、更广[54],制定有效的策略遏制错误信息的进一步扩散至关重要。从信息生态的视角来看,可以从阻断错误信息传播、阻止信息人传播错误信息、提高信息环境中的传播阻力三个方面梳理既有文献中的错误信息阻断策略。
社交媒体上的错误信息,在以信息人为节点、信息人之间的社交关系为连边的网络上传播。阻塞错误信息传播主要有两种方式:一是切断信息人之间联系的连边或减少信息传播的链路数量[55-56],二是利用正确信息与错误信息在网络上的竞争传播限制错误信息扩散。一方面,阻塞一组关键链路以限制错误信息的扩散范围,可以最小化错误信息的污染程度[57-58]。如Kimura等[59-60]提出一种自然贪心算法,得到错误信息平均污染最小化问题和最高污染最小化问题的良好近似解,并证明该算法在阻塞错误信息传播方面的表现优于利用介数和出度移除链接的启发式算法。在此基础上,Yao等[61]针对特定错误信息污染场景,提出一种基于最大边际增益规则的贪心算法,阻断网络中部分链路。然而,贪心算法时间复杂度高,很难扩展至大型数据集。于是学者们提出LDAG、IRIE等启发式算法[62-63],这些算法有效减少了运行时间,但与贪心算法相比,所选链路的传播影响范围较小。为此,Borgs等[64]提出更有效的反向影响采样方法,提高算法运行效率的同时还达到了近似贪心算法的精度。另一方面,发布正确信息以激活一组关键链路,可以阻塞与其对应的错误信息传播[65]。Budak等[66]在竞争独立级联模型下研究影响阻塞最大化(IBM)问题,但研究仅适用于独立级联模型的有限扩展,也没有解决算法运行效率的问题。对此,He等[67]首次引入竞争线性阈值模型,利用线性阈值模型在局部有向无环图中的高效计算特性,提出CLDAG启发式算法平衡运行效率和阻塞效果。鉴于两种信息相互竞争是一个动态的过程,Wu等[68]提出两种竞争传播模型,描述正确信息和错误信息竞争传播过程,并设计CMIA-H、CMIA-O两种启发式算法提高运行效率。
信息人作为信息传播网络中的一个节点,是错误信息传播过程中的发出点和接收点,对其进行控制是阻断错误信息的一种有效方式。信息传播的动态特征决定了全面监控节点代价高昂,所以找到影响力大的节点(种子节点)并将其清除或封闭,是阻止错误信息扩散的关键。Kempe等[69]最先基于独立级联和线性阈值模型挖掘网络中的种子节点,提出一个贪心算法,为识别并阻塞节点奠定了研究基础。为了较好地平衡算法精度和时间效率,学者们综合了改进的贪心算法和启发式算法来筛选种子节点集,减少运行时间的同时保证了阻塞效果[70-72]。此外,网络中的节点密集连接会形成社区结构,社区中的节点与社区外的节点连接相对稀疏。因此,在社区中寻找种子节点的成本低于在整个网络中寻找种子节点的成本[73-75]。Ghoshal等[76]针对不相交和有重叠的社区结构,优先考虑社区间的边缘节点,利用静态概率策略识别种子节点,并将正确信息注入种子节点以阻断错误信息传播;Li等[77]提出多元社区影响最大化(CDIM)问题,根据激活节点的数量和对社区多元性的影响程度识别种子节点,突破了现有研究仅考虑激活节点数量的局限性。需要注意的是,不论是控制节点还是阻断链路,都需要避免不当屏蔽,令阻断策略不致影响信息人正常的网络体验。Wang等[78]在构建动态谣言传播模型的基础上,引入用户效用函数作为时间阻塞约束,为每个节点分配一个容忍时间阈值,保证节点正常使用网络;丁学君等[79]根据信息人个体特征和社交网络结构特征构建了双曲折扣效应函数作为时间阻塞约束,更清晰地体现了阻断策略对用户网络使用的影响。
阻断错误信息传播一定是在不影响正确信息传播的前提下进行的。因此,保证正确信息传播无误甚至促进其传播的同时,增强错误信息的传播阻力是信息环境中较为合理的阻断策略。社会交换理论表明,当传播信息收益大于成本时,信息人才会主动分享信息。所以通过评估错误信息可信度、标记和警告错误信息等加强其传播阻力的方式,增加信息人分享错误信息的成本,可以使信息人面对错误信息时更为理性和谨慎[80]。除了依靠政府制定的传谣处罚法规来增加谣言的传播成本[49],社交平台常常通过添加众包评分功能[81]、建立可信度分析系统[82]以及其他信息可信度评价手段,帮助用户识别和评估信息的可信度和准确性。如Alrubaian等[82]利用声誉组件、可信度分类器引擎、用户体验组件和特征排名算法这四个集成组件,组成可信度分析系统;Gopal等[83]通过机器学习和启发式方法辨别网站数字供应链使用中的异同,评估网站可信度。还有学者利用标记、警示提醒信息人,进而降低其分享错误信息的可能性[84-85]。不同标记方式的干预效果不同,Moravec等[86]提出自动认知和故意认知这两种错误信息标记的方法发现,两种方法结合起来的干预有效性大约是单一方法的两倍。
对于已经受到错误信息污染的信息生态,需要及时纠正错误信息并清除错误信息对信息人和信息环境造成的负面影响。本文从与错误信息对应的纠正信息、需要接受纠正的信息人以及存在错误信息的社交媒体平台三个方面进行文献梳理。
为防止错误信息造成更严重的负面影响,需要及时地将其纠正。纠正信息本身的信息来源和内容质量影响着信息人对纠正信息的接受程度。当信息人感知到纠正信息来源真实和可信,通常会对纠正信息的信任程度较高[87]。随着时间的推移,纠正信息的内容质量会继续影响信息人对其的信任程度[88]。因此,针对误导性较强、传播范围较广的错误信息,需要使用可信度高和内容说服度强的正确信息纠正[89]。但是纠正之后,错误信息仍然可能会对人们的记忆和推断过程产生持久的影响,即错误信息有持续影响效应[90]。针对这种现象,众多学者利用实验验证纠正方式的效果发现,直接纠正优于间接纠正[91]、简单纠正优于复杂纠正[92]、以逻辑为中心的纠正优于以事实为中心的纠正[93]等结论。学者们在比较多种纠正方式后发现,提供充分证据或替代性解释的纠正方式效果最好[94]。需要注意的是,错误信息重复出现后,人们对错误信息的信任程度显著增高,可能因为重复出现加深了人们对错误信息的印象[88,92]。
错误信息的持续影响效应严重影响着错误信息纠正的有效性,并且纠正也只能尽量减少人们引用错误信息的次数,很难彻底消除其持续影响效应[90,95]。从信息人的角度来看,影响纠正效果的因素有态度(动机)和认知能力两种。在态度方面,信息人更容易信任与自己先前的信念符合或接近的信息[96-97],而当接受纠正信息需要改变原始态度时,会强烈抵触与原有态度不一致的纠正信息[98],即使被纠正也会很快又根据原先的态度看待相关信息[99]。在认知能力方面,通常工作记忆能力较低[100]或缺少某种知识却不自知[88]的人更容易信任错误信息。他们往往根据启发式认知做出自以为是正确的决定,即使被纠正也会在很大程度上保留认知偏见[101]。此外,纠正信息对信息人的影响会随着时间推移逐渐减弱。主要原因是人们对纠正信息的记忆逐渐变得模糊,甚至可能将其与错误信息混淆。通常中老年人的记忆能力低于年轻人,但对年龄是否会对错误信息纠正效果产生影响学界还存在争议[87,92],需要大样本研究进一步验证。
错误信息严重污染了信息环境,需要社交媒体平台、政府监管部门和专业媒体等相关组织协同解决这一问题。研究发现,错误信息纠正机制在不同平台上的有效程度不同[102],而各平台之间的错误信息数据互通,有利于对信息进行有效地实时采集和关联。因此,相较于单平台纠正,跨平台纠正的效果更好[103]。政府应当快速公布事实纠正社交媒体上的错误信息[104],加强同新闻媒体、社交媒体平台等社会主体间的联系,强化协同防控,进一步提高信息环境中错误信息的清除效率[105]。主流媒体需要注重信息核实,在保证自身不生产错误信息的前提下,主动、及时地交代事件的起因、进展,输出全面、客观、积极的观点,有针对性地澄清事实[106]。并且,一切纠正手段都需要符合人们的阅读习惯,如根据公众情绪和认知能力的变化采取易于民众接受的方式发布信息,减少次生错误信息的产生[106]。
从当前的研究趋势看,预防、阻断和纠正是错误信息防控的三种重要策略,其中错误信息的阻断研究更为成熟。这些从不同学科背景出发而提出的错误信息防控策略,丰富了错误信息的治理研究,但错误信息的防控研究仍需要继续探索和完善。文章对上述内容进行分析和思考后,总结了目前研究中存在的一些不足,并提出几点探索方向。
本文整理了已有的错误信息防控的研究成果,概括了其中主要的防控策略(见表1)以及不足。
表1 信息生态视角下错误信息传播前、中、后三阶段的防控策略
在已有的错误信息预防策略中,信息流行程度是预测错误信息主题中的重要参考指标。通过流行程度识别出的错误信息主题大多与容易引起关注的公共事件有关,而流行程度较低的错误信息主题就很难被预测。其次,很多研究提出提高信息素养是提高信息人识别错误信息的能力的关键,但只依靠学校教育和因岗位需求而开展的信息素养培训,还不足以实现社交媒体用户信息素养的普遍提升。
在已有的错误信息阻断策略中,很少有学者会从成本和收益的角度探讨错误信息阻断策略的影响。一些信息阻断策略能净化信息生态,但也有需要考虑的副作用,如遏制错误信息传播对正确信息传播效率的影响,阻塞节点对用户网络使用体验的影响,以及奖惩机制对平台吸纳用户的影响等。一项错误信息阻断策略实施前,其成本和收益都应该经过仔细权衡。例如,通过标记、警示提高信息环境中错误信息的传播阻力时,相关人员应该考虑一种后果,即人们降低对被标记的错误信息的信任的同时,会比原先更信任未被标记的信息——而未被标记的信息并不一定正确。
在纠正错误信息时,首先要保证信源的公信力和内容的说服力,其次要保证纠正方式易于理解。已有的纠正方式中,向错误信息提供替代性解释的纠正效果比较好[95],但对于很多无法找到替代性解释的错误信息,需要探索其他高效的纠正方式。目前纠正策略有效性的比较研究还不充分,现有的两三种纠正策略之间的比较研究无法为选择最合适的纠正提供有效的决策依据。如何实施最为有效的纠正策略,是未来一个值得深入研究的问题。
本文针对现有研究的不足,分别从错误信息预防、阻断、纠正三个阶段出发,对未来研究的发展趋势提出几点展望。
(1)预防强危害性信息,制定信息素养增强方案
首先,研究者可以通过预估信息的危害程度预防错误信息。阻止那些虽然不够流行但容易产生较大危害的错误信息产生,仍然能够降低错误信息的负面影响。该方法不再仅依赖当下的信息数据,还可以参考以往造成过严重危害的信息,合理推测可能需要预防的信息。其次,在预防信息人“感染”错误信息方面,考虑到信息人的年龄、行业、受教育程度以及周围信息环境等情况的不同,信息人初始信息素养水平、预期提高的信息素养水平以及面对的信息类型等也有所不同,根据不同人群的具体需求制定有针对性的信息素养增强方案,是研究者今后需要关注的问题。
(2)考虑阻断的副作用,权衡策略的成本与收益
错误信息阻断策略可行的前提是不能大幅影响节点的网络体验、正确信息的正常传播及整个网络环境的和谐发展。想要了解阻断错误信息产生的收益和成本,研究者需要量化错误信息的治理效果和可能造成的副作用,在阻断模型中添加约束条件,权衡阻断策略的成本与收益。
(3)优化纠正方式,增强纠正效果
首先,研究者可组合已有的纠正策略,参考前人设计验证组合策略的纠正效果。其次,鉴于信息人对信息的混淆和遗忘会减弱纠正效果,在纠正信息里重复错误信息可能会导致熟识逆火效应,纠正时应该避免这一点[92]。在降低错误信息负面影响的同时,增强正确信息带来的正向影响也是非常重要的。利用丰富纠正信息的呈现形式、标注纠正信息的关键内容等方式加深人们对纠正信息的印象,可以强化人们对正确信息的记忆。最后,研究者需要探索评估纠正策略效果的科学方法,并针对不同错误信息给出具体的纠正策略。
(4)联系相关研究成果,加强工程实践方法应用
错误信息防控很难独立研究,需要加强与错误信息的流转机制、检测模型等研究的联系。此外,很多防控研究还停留在政策建议层面,研究者需要更多地使用科学研究方法探索错误信息防控,例如利用机器学习和深度学习技术,实现动态、实时、多源的防控策略。