石韦颖 何康 贾全鑫
【内容摘要】新冠肺炎疫情肆虐全球,社交媒体空间呈现出“信息疫情”的局面,信息环境高度复杂和不确定。本文探究了社交机器人在新冠肺炎议题在线讨论中的参与行为。
【关键词】社交机器人;新冠肺炎疫情;社交媒体
一、引言
随着新冠肺炎疫情在世界范围内迅速蔓延,社交媒体上涌现出海量的疫情相关信息,这些信息亦真亦假,有人说,这种情况构成了网络环境中的“信息疫情(Infodemic)”。作为用户人数最多的全球化社交媒体之一,推特(Twitter)已成为当今社会重要的数字公共领域,无疑也是“信息疫情”存在的主要空间。
社交机器人是一种在社交媒体上拥有账号并能够承担任务,利用算法生成内容的自主机器人,①在社交媒体上与人类用户共同存在,②并活跃在政治选举、公共健康议题、社会热点事件等在线讨论中。社交机器人会模仿人类行为与其他用户互动,③试图干预网络舆论甚至影响人们的线下行为。在“信息疫情”的背景下,推特(Twitter)平台上有关新冠肺炎疫情的相关讨论中,社交机器人的参与情况是怎样的?社交机器人与人类用户之间的意见是否相异?社交机器人与人类用户之间的连接和互动情况如何?这些问题的探讨具有一定的现实意义。
为解答上述问题,本文爬取了推特(Twitter)平台上2020年前3个月有关新冠肺炎疫情讨论的推文数据,对新冠肺炎疫情在线讨论中社交机器人的参与行为,特别是其与人类用户的互动情况进行了探究。
二、文献回顾与拟研究的问题
(一)社交机器人参与舆论表达
在智能时代,包括人工智能在内的相关互联网技术对传播领域乃至社会领域的改变已经发生或即将发生。④社交机器人广泛参与政治事件在线讨论,实施信息操控,甚至干预舆论表达。在中美贸易谈判、⑤2016年美国大选、⑥2016年英国脱欧投票、⑦2017年法国总统大选、⑧2018年美国中期选举⑨等政治事件网络讨论中,人们均发现社交机器人活动的痕迹。研究发现社交机器人会通过关注他人来提升自我影响力,大量散播谣言、分享垃圾信息、传播具有党派立场的消息,进而影响选民意见。研究还发现,社交机器人参与网络讨论的比例随事件推进而增长,在2016年美国大选3次辩论中,社交机器人参与比例从23%上升到27%,⑩在2017年德国竞选活动中,社交机器人参与讨论比例从竞选前的7.1%上升到竞选期间的9.9%。
社交机器人同样活跃于公共健康议题、社会热点事件的线上讨论,如对麻疹疫苗接种的讨论、美国佛罗里达校园枪击案爆发后的讨论中均有社交机器人参与,甚至强化网络意见的极化。在新冠肺炎疫情的在线讨论中,亦有学者发现社交机器人的参与。2020年1月21日美国出现了该国宣称的第一例新冠肺炎患者,2020年3月13日美国政府宣布全国进入紧急状态,Ferrara选取这两个时间节点期间有关新冠肺炎疫情的推文进行分析,发现疫情期间有大量社交机器人账号被创建,并且在创建后不久就高强度地投入到疫情的网络讨论中。本文同样是对新冠肺炎疫情期间社交机器人参与行为的探究,但由于数据采集时间有所区别,本文首先要厘清的问题依旧是社交机器人的参与情况,随着事件的发展社交机器人的参与比例是否发生变化,故而提出以下研究问题:新冠肺炎疫情在线讨论中社交机器人的数量和发文量是多少?新冠肺炎疫情在线讨论中社交机器人的数量是怎样随时间变化的?
(二)社交机器人与人类的交互
社交即互动。社交机器人对人类的模拟行为,不仅是在网上表达和传递意见,社交机器人还会与人类发生互动行为。社交机器人与真实人类用户互动的过程往往也是社交机器人影响人们意见转变的过程,因此成为研究的重要关注点。
相关研究发现“人—机”互动明显少于“人—人”互动比例,但“人—机”之间的交互利于信息的大范围传播。如Stella等人对2017年加泰罗尼亚公投事件的研究发现,在交互模式上人类主要与人类互动(76%),仅有19%的社交机器人主动与人类互动,在网络结构上人类的中心地位是社交机器人的1.8倍,社交机器人倾向于与具有影响力的用户互动以提升自己的影响力。Shao等人对低可信度来源文章的探究也有相似发现,在传播初期社交机器人会通过回复、提及用户吸引关注者,人类也往往容易受此影响并分享社交机器人发布的内容,进而导致低可信度消息滚雪球式扩散。在骚乱或暴乱事件中,社交机器人同样能够引发信息大范围的单向传播,甚至在某些情况下与人类直接交换信息,并倾向于向人类直接传递恐惧信息。“人机互动”也存在着党派差异,Luceri等人在研究中加入政治倾向性这一变量,将社交机器人划分为保守派和自由派,发现保守派社交机器人与人类、与社交机器人的互动分配更为均衡,相对而言,自由派机器人更偏向于与人类互动。
社交媒体上的互动包含点赞、评论、转发、提及等方式,社交机器人使用多种互动方式达成不同传播目的。张洪忠等对中美贸易谈判议题的探究发现,社交机器人常使用新闻类话题标签以快速传递信息,更频繁地@媒体或热点人物来扩大其影响力。师文和陈昌凤的研究发现在中国议题下,相比人类用户,社交机器人更愿意通过转发促进信息扩散,并通过提及人类用户提升信息可见度,以期营造意见气候,但较少进行回复和引用。由此也可见,转发和提及是社交机器人常用的互动方式。
新冠肺炎疫情期间社交媒体上充斥大量混杂的信息,疫情信息传播情况复杂,比如疫情期间推特(Twitter)上有大量假消息被发布。信息存在极大不确定性的现实背景也引发对社交机器人与人类用户互动和连接关系的新思考,这些互动和连接是否会呈现出与既有研究不同的新特点?本文拟以“转发”互动为切入点进行考察,“转发”是社交机器人最为常用的互动方式之一,“转发”尤其是“直接转发”是一种基于认同的行为,带评论转发还蕴含着观点的交流,相比“提及”包含更丰富的互动讯息。本文将从信息传播扩散路径著手,探究哪些人或哪类账号是转发推文的消息源、谁又成为转发传播链中的关键节点或意见领袖,因而提出下列研究问题:新冠肺炎疫情在线讨论中社交机器人和人类用户的“转发”互动是怎样的?社交机器人和人类用户“转发”的账号及其内容有何差异?
三、研究方法
(一)数据采集与处理
2019年12月31日,中国向世界卫生组织通报了湖北省武汉市的一组肺炎病例,世卫组织确认了这是一种新型冠状病毒,由此国际上开始正式关注新冠肺炎疫情。本文采用推特(Twitter)API获取2020年前三个月有关新冠肺炎疫情的推文数据,并在此基础上构建了一个由4万余条推文数据组成的小规模随机样本,其中包含独立用户4万多个。
(二)社交机器人检测
本文采用开源工具Botometer识别社交机器人,Botometer是美国印第安纳大学开发的检测工具,使用机器学习算法进行特征识别,操作便捷,是目前社交机器人检测中最为广泛使用的检测工具。根据Botometer检测结果将账号二分为真实人类用户、社交机器人。
四、社交机器人参与疫情讨论情况
(一)社交机器人数量及其发推量均在7%左右
经分析发现,4万多个独立用户中社交机器人不足3000个,占比仅为6.88%。在4万多条推文数据中,社交机器人发布推文数量不足4000条,占比仅7.34%。
(二)时间序列上社交机器人数量出现增长
在时间序列上,参与讨论的社交机器人与人类用户数量均随时间推移大幅上升,两者变化趋势相似,且用户数量峰值的出现时间与全球疫情发展的标志性节点事件出现时间吻合(见图1)。如图1所示,在图中标记①的部分,自2020年1月21日开始参与讨论的用户数量开始增多,这一天美国境内出现了当时认为的第一例新冠肺炎确诊患者。在图中标记②的部分,参与讨论的用户数量剧增,并在3月12日达到峰值,3月12日参与讨论的社交机器人有123个、人类用户有1839个。在这一阶段世卫组织评估新冠肺炎为大流行病,3月9日美股年内第一次、历史上第二次熔断,3月12日美股年内第二次、历史上第三次熔断。图中标记③的部分,参与讨论的用户数量达到数据观测期间最高峰值,3月18日社交机器人峰值数量是168个,3月19日人类用户峰值是2244个。这是由于在3月中旬疫情继续蔓延,疫情影响继续加剧,美股年内第三次熔断,特朗普发推文称新冠病毒为“中国病毒”引发热议。图中标记④的部分,尽管参与讨论的用户数量有所下降,但讨论热度仍较高,参与讨论的社交机器人数量出现的两次峰值分别是139个、123个,在3月末这段时间确诊病例不断攀升,美国成为首个确诊病例超过20万的国家,日本东京奥运会因疫情而推迟。
简言之,在新冠肺炎疫情在线讨论中,尽管社交机器人数量与人类用户存在量级上的差异,但两者都随时间推移明显上升,其中参与讨论的社交机器人从每日1—2个增长到每日100多个。
(三)社交机器人发布的推文中转发推文占七成
推文可以分为“原创”和“转发”两大类,其中“转发”又可以细分为不带评论转发的直接转发和带评论转发两种。这可以从推文文本来进行判定,在推文文本中不含有任何“RT @”的推文归类为原创推文,含有“RT @”的推文是转发推文。具体来说,如果A直接转发B的推文,在A的推文文本中会出现“RT @B”,即A的推文文本由“RT @B+B的推文”构成;如果A转发B的推文并进行了评论,A的推文文本由“评论+RT @B+B的推文”构成。
经统计发现,第一,社交机器人和人类用户发布的推文中绝大多数是转发,原创推文整体较少,社交机器人发布的推文中七成以上是转发,人类用户发布的推文中八成以上是转发;第二,在转发的推文中,直接转发比例远高于带评论转发,相比社交机器人,人类用户更倾向于带评论转发(见图2)。从推文类型来看,转发推文占据绝大多数,用户之间的转发互动十分频繁,这也是本文选取“转发”来考察互动的原因之一。
五、社交机器人和人类用户转发互动情况
社交机器人与人类用户的转发互动可以通过推文文本追溯,推文文本中的“RT @”成为判断转发互动关系的重要标识。本文采用Python程序从推文文本中提取“RT @”的用户,经统计分析,社交机器人转发推文中共“RT @”1800个用户,其中274个是社交机器人;人类用户转发推文中共“RT @”14198个用户,其中762个是社交机器人。换言之,从社交机器人发布推文追溯,社交机器人较多地转发人类用户发布的内容,存在“人→机”转发路径(84.78%);社交机器人会转发社交机器人发布的推文,存在“机→机”转发路径(15.22%)。从人类用户发布推文追溯,“人→人”是转发互动中比例最高的互动路径(94.63%),同时也存在“机→人”转发路径(5.37%)(见图3)。
也就是说,在推特(Twitter)上有关新冠肺炎疫情的相关讨论中,社交机器人和人类用户之间存在交错相织的转发路径(见图4)。在转发互动形成的扩散网络中,社交机器人类似于“扩音器”,将人类用户的观点放大,或是二次传播其他社交机器人发布的内容。有少量社交机器人赢得了人类用户的信任,发布内容被人类转发。
六、“人机”转发用户频次前50的比较分析
为进一步探究社交机器人与人类用户在转发互动上的异同,我们对社交机器人转发最多(“RT@”频率最高)的前50个用户、人类用户转发最多的前50个用户进行了比较分析。将两组各50个用户划分身份类别(见图5),其中个别无法确定身份的账号被归为其他类。结合账号身份特征及其推文内容,从两组用户的相同点、不同点两方面进行阐释。
(一)相同点:媒体和政客是主要消息传播源
第一,媒体组织、演员或媒体工作者是主要消息来源。转发频率最高的前50个用户多为媒体组织账号、演员或媒体工作者,媒体组织账号如CNN、《纽约时报》。演员或媒体工作者包括电视節目主持人、制片人、记者和演员,如转发频率最高的前三名用户中两位(Bill Mitchell和Charlie Kirk)都属于媒体工作者,且两人都是特朗普的支持者;第二,政客发布的消息被较多转发。特朗普是转发频率最高的用户。
从相同点来说,转发遵循名人效应,网络大V发布的推文被转发可能性更高。在人类用户和社交机器人转发频率最高的前50个用户中,有28个是一样的,这也说明人类用户和社交机器人在参与舆论表达中关注的议题或采用的策略存在相似性。
(二)不同点:机器人较多转发特朗普支持者的推文
第一,社交机器人多转发支持特朗普的内容。比如,作家John Solomon称新冠肺炎病毒为“中国病毒”的推文被社交机器人大量转发,转发者还包括特朗普的长子小唐纳德·特朗普,小唐纳德·特朗普本身也是社交机器人转发较多的用户之一。又如被转发较多的作家Jim Hoft是支持特朗普的政论网站Gateway Pundit的创办人。
第二,人类用户会转发白宫推特(Twitter)账号发布的消息,白宫被归类为政府,社交机器人会转发特朗普政治竞选团队推特(Twitter)账号发布的消息。
第三,在被社交機器人转发最多的前50个用户中,有两个是社交机器人,一个是已被冻结的账号。其中一个社交机器人是Mark Kirin,Botometer得分3.9分,它发布的推文文本是非常凌乱的、读起来不通畅、较无逻辑,还包含大量符号表情,内容包括中国政府将维生素C列为抗击疫情药物、新冠肺炎疫情死亡率远不如流感、特朗普不应该使用“中国病毒”、不认可新冠肺炎病毒类似于严重季节性流感的观点等。另一个社交机器人是JoJo,Botometer得分是3.5分,其推文较多地@他人、使用话题标签,具体内容涉及中国研究员申请药品专利、反对特朗普言论、居家隔离等。另外,推特(Twitter)上被暂停使用的账号和社交机器人之间存在相关性,本文研究中发现的用户@StormIsUponUs虽然无法确定其账号被冻结的具体原因,但有较高可能是个社交机器人。尽管上述两个社交机器人都发布反对特朗普的言论,但这并不能断定说社交机器人都在反对特朗普。结合前文来看,疫情相关讨论中既有支持特朗普的社交机器人,也有反对特朗普的。
第四,人类用户会转发短期内受到大量关注的普通人发布的推文,而社交机器人不会。人类用户会关注到在网络上迅速获得大量点赞和转发的鲜活的、真实的、平凡人的故事,比如美国姑娘Bjonda Haliti的染疫日记,网名为sketchy lady的女子出现“所有新冠病毒的症状”却无法进行病毒检测的求助帖,又比如洛杉矶一位高中毕业生邀请奥巴马为2020届毕业生演讲的请求。
第五,人类用户对疫情、健康相关消息关注更多,较多转发专家学者发布的推文,如医疗专家Dena Grayson、前奥巴马医疗保健主管Andy Slavitt发布的消息。
七、结论与讨论
本文对维持(Twitter)空间有关新冠肺炎疫情讨论中社交机器人的行为进行了探究,主要有以下三点结论及延伸讨论。
第一,在推特(Twitter)空间有关新冠肺炎疫情讨论中社交机器人数量总体占比约7%,社交机器人数量随事态发展大幅增长。尽管社交机器人参与比例从总体来看较低,但讨论中少量的社交机器人仍然可以影响舆论,甚至影响线下的实际行为,如Ross等人的模拟实验中2%—4%的社交机器人即可反转舆论。在Zerback等人利用社交机器人进行的“草皮运动”(Online Astroturfing)实验中,同样发现社交机器人确实能够改变被试者的意见。随着社交机器人技术的不断进步,社交机器人对人类行为的模拟程度更高,对社交机器人参与网络舆论表达的存在及其影响需要更细致地考量,期待后续研究的推进。
第二,新冠肺炎疫情讨论中社交机器人与人类用户之间存在交错转发的互动模式。首先,与已有研究结论相似,社交机器人会转发人类用户发布的推文、机器人发布的推文,人类用户也会转发社交机器人发布的推文,“机→机”转发比例高于“机→人”比例;其次,转发互动存在显著的名人效应,媒体组织、演员或媒体工作者、政客是讨论中的“意见领袖”。这与已有研究的发现有所相同也有所区别,在韩运荣等对涉华舆论的研究中,推特(Twitter)上传统媒介组织开设的账号是议题相关信息的主要传播者, 媒体工作者是重要的“意见领袖”,媒介及艺术工作者往往多传播情绪性意见。但Hagen等人在所谓俄罗斯干涉2016年美国大选调查的在线讨论中发现社交机器人会削弱媒体人、专家等传统行动者(Traditional Actors)的影响力,并通过放大支持特朗普的信息影响网络情绪,这与本文的发现有所区别,本文发现媒体组织等依旧是社交网络中具有强传播力、影响力的行动者。
第三,推特(Twitter)空间的社交机器人较多转发持有支持特朗普立场的用户的推文,会更关注特朗普与2020年大选的相关内容,而人类用户会转发专家学者对疫情的看法、普通人在疫情期间的真实经历。然而也并非所有的社交机器人都在支持特朗普,也有反对特朗普立场的社交机器人,社交媒体上的社交机器人像人类一样拥有政治倾向性、拥有多元化的观点。在社交媒体上部署这些社交机器人的个人或团队也是多元构成的,一项对欧洲49个国家2247位欧洲通信领域专家的调查发现,有257位(11.5%)表示他们所在的组织正在使用或计划使用社交机器人。这些机构或组织或属于不同国家、或有着不同利益驱动、或持有不同政治意见,恰恰也表明了社交机器人背后使用主体的多元构成。
本文也存在一定的局限性。第一,转发行为一定程度上代表着对某种观点的认同,本文没有对转发背后多大程度上改变了人类用户的态度,这种影响是强化、弱化还是扭转进行探究;第二,社交媒体上的互动除“转发”之外还有其他形式,本文只选取较具代表性的“转发”来分析,未来可以从其他互动方式入手进行补充完善。
注释:
①Howard P N, Woolley S, Calo R. Algorithms, bots, and political communication in the US 2016 election: The challenge of automated political communication for election law and administration. Journal of information technology & politics, 2018, 15(2): 81-93.
②张洪忠、段泽宁、韩秀:《异类还是共生——社交媒体中的社交机器人研究路径探讨》,《新闻界》2019年第2期。
③Ferrara E, Varol O, Davis C, et al. The rise of social bots. Communications of the ACM, 2016, 59(7): 96-104.
④喻国明:《关于智能时代新闻传播学科建设的若干思考》,《教育传媒研究》2020年第2期。
⑤张洪忠、赵蓓、石韦颖:《社交机器人在Twitter参与中美贸易谈判议题的行为分析》,《新闻界》2020年第2期。
⑥Howard P N, Bolsover G, Kollanyi B, et al. Junk news and bots during the US election: What were Michigan voters sharing over Twitter. CompProp, OII, Data Memo, 2017.
⑦Bastos M T, Mercea D. The Brexit botnet and user-generated hyperpartisan news. Social Science Computer Review, 2019, 37(1): 38-54.
⑧Ferrara E. Disinformation and social bot operations in the run up to the 2017 French presidential election. arXiv preprint arXiv:1707.00086, 2017.
⑨Luceri L, Deb A, Badawy A, et al. Red bots do it better: Comparative analysis of social bot partisan behavior[C]//Companion Proceedings of The 2019 World Wide Web Conference. 2019: 1007-1012.
⑩Howard P, Kollanyi B, Woolley S C. Bots and automation over Twitter during the third US presidential debate. 2016.
Keller T R, Klinger U. Social bots in election campaigns: Theoretical, empirical, and methodological implications. Political Communication, 2019, 36(1): 171-189.
Yuan X, Schuchard R J, Crooks A T. Examining Emergent Communities and Social Bots Within the Polarized Online Vaccination Debate in Twitter. Social Media+ Society, 2019, 5(3): 2056305119865465.
Kitzie V L, Mohammadi E, Karami A. “Life never matters in the DEMOCRATS MIND”: Examining strategies of retweeted social bots during a mass shooting event. Proceedings of the Association for Information Science and Technology, 2018, 55(1): 254-263.
Ferrara E. # COVID-19 on Twitter: Bots, Conspiracies, and Social Media Activism. arXiv preprint arXiv:2004.09531, 2020.
Stella M, Ferrara E, De Domenico M. Bots increase exposure to negative and inflammatory content in online social systems. Proceedings of the National Academy of Sciences, 2018, 115(49): 12435-12440.
Shao C, Ciampaglia G L, Varol O, et al. The spread of low-credibility content by social bots. Nature communications, 2018, 9(1): 1-9.
Ku?en E, Strembeck M. You talkinto me? Exploring Human/Bot Communication Patterns during Riot Events. Information Processing & Management, 2020, 57(1): 102126.
師文、陈昌凤:《分布与互动模式:社交机器人操纵Twitter上的中国议题研究》,《国际新闻界》2020年第5期。
Pulido C M, Villarejo-Carballido B, Redondo-Sama G, et al. COVID-19 infodemic: More retweets for science-based information on coronavirus than for false information. International Sociology, 2020: 0268580920914755.
Ross B, Pilz L, Cabrera B, et al. Are social bots a real threat? An agent-based model of the spiral of silence to analyse the impact of manipulative actors in social networks. European Journal of Information Systems, 2019, 28(4): 394-412.
Zerback T, T?pfl F, Kn?pfle M. The disconcerting potential of online disinformation: Persuasive effects of astroturfing comments and three strategies for inoculation against them. New Media & Society, 2020: 1461444820908530.
韩运荣、漆雪:《Twitter涉华舆情极化现象研究——以中美贸易争端为例》,《现代传播(中国传媒大学学报)》2019第3期。
Hagen L, Neely S, Keller T E, et al. Rise of the Machines? Examining the Influence of Social Bots on a Political Discussion Network. Social Science Computer Review, 2020: 0894439320908190.
Wiesenberg M, Tench R. Deep strategic mediatization: Organizational leaders knowledge and usage of social bots in an era of disinformation. International Journal of Information Management, 2020, 51: 102042.