陈璟浩 谢献坤
(1.广西大学区域社会治理创新研究中心 南宁 530004;2.武汉大学大数据研究院 武汉 430072)
西强我弱的国际舆论格局由来已久,我国在国际舆论中长期处于被动“挨骂”状态,中国的国际形象在国际舆论环境中很大程度被扭曲,与真实情况“反差”很大,我国在国际信息传播中的“逆差”、软实力与硬实力“落差”非常明显[1]。为此,如何改变当前国际舆论力量的对比,增强我国国际传播力和话语权,有效维护我国的国际形象,保障国家安全,已成为我国对外舆论工作的一个重大挑战。
2021年3月24日,关于H&M抵制新疆棉花的信息在我国新浪微博、豆瓣等网站发酵,引发了国内外网民就是否支持新疆棉花、是否存在强迫劳动等问题的激烈争论,“新疆棉花”事件在网上被闹得沸沸扬扬。该事件是一起典型的国际涉华突发事件,对该事件国际、国内舆情进行分析,有助于了解当前中西方两个既有联系又相互分割的网络舆论场中网民的主流观点、立场、信息的交流、传播特色等。具体来说,本研究试图回答以下问题:涉华突发事件网络舆情的国际、国内传播趋势、传播信源、主要观点和传播社会网络如何,它们各自有何特征?是如何相互影响和作用的?是否存在共通的语义空间及相似的传播网络结构?
回答上述问题,有助于我们全面认识涉华突发事件国内外网络舆情传播的普遍规律、客观联系和特征差异,为我国构建对外话语体系,精准传播渠道,优化传播效果,增强国际话语权,降低和化解国际舆情风险,重塑国际形象提供有益参考。
Twitter在推动国际信息交流沟通方面发挥了重要作用[2],而微博作为“中国版Twitter”在国内舆论环境建设中也扮演着重要角色,两者在影响力、功能和结构上有许多相似之处,但由于防火墙的存在,它们几乎无重叠的服务范围[3]。这为学者们对比分析国外和国内两个既相似又互异的舆论场提供了难得的机会,相关研究逐渐增多并引起重视。通过回顾已有研究,发现有关Twitter和微博的比较分析主要集中在用户行为、舆情特征两个方面。
其中,用户行为对比分析,主要考察不同社交媒体用户,在不同政治社会环境下行为的异同。如:通过对Twitter和微博用户的访问方式、写作风格、讨论主题、情感倾向和页面停留时间的对比,揭示不同平台用户行为差异[4]。调查微博、Twitter、Facebook等五种社交媒体用户在平台上与匿名用户交流的行为和动机,验证影响网民与陌生人交流的主要因素,并分析不同因素在各平台中的作用大小[5]。对用户在不同平台中发布表情包进行对比,探索不同国家用户在网络中的情感表达[6],及情感态度对商品价格的影响[7]。
不同平台舆情特征对比分析,这一方面既有综合研究,也有专题研究。综合研究主要对比分析不同社交媒体平台舆情传播的网络结构[8]、传播策略[9]、情感表达[10]、网络热点[11]的异同等。专题研究则对诸如校园霸凌[12]、旅游推广[13]和中美贸易战[14]等特定主题的舆情特征进行比较。另外,受新冠疫情影响,近年也有一定数量的研究,对比分析疫情期间Twitter和微博的舆情特征,如:比较中美两国网民在不同平台发布信息的差异[15]、比较封城前后伦巴第和武汉网民在两平台发布的言论[16]、分析不同平台用户在发布疫情虚假信息和科普新闻上的差异[17]。
综上所述,当前对于Twitter和新浪微博的对比分析还处于起步阶段,研究仍有很大拓展空间。主要表现在:不论是综合研究还是专题研究,现有成果多聚焦于比较不同社交平台网民行为和舆情特征,探讨政治、经济、文化等因素在其中的作用和影响,对特定事件的跨平台舆情比较探索不足。这便造成了对涉华突发事件舆情成因认识不清,规律把握不准的情况,不利于我国政府应对和处置舆情。因此,开展国际涉华突发事件国内外网络舆情的比较研究,既能丰富现有研究成果,又能为政府决策提供理论参考。
2.1数据来源本文使用的数据主要来自Twitter和新浪微博。其中,Twitter代表国外网络舆情,新浪微博则代表国内。之所以这样选择,是因为Twitter是当今世界上最大的国际微博客服务提供商,2021年,Twitter每天有1.92亿活跃用户,主要分布在美国、英国、日本、巴西和印度尼西亚。新浪微博则是我国国内最大微博客服务提供商,2021年,其日活跃用户达2.29亿,服务群体主要为中国民众。新疆棉花事件爆发后国内外许多个人、机构、组织在上述两平台发布了大量信息,为本研究提供了丰富的国际、国内舆情数据。
Twitter数据本文采用开源软件Twint获取,检索时间从2019年7月1日至2021年4月24日,之所以选择从2019年7月1日开始检索,是因为经检索发现,Twitter平台上与该事件相关的信息最早见于2019年7月1日。检索词为“Xinjiang cotton”,对检索结果进行过滤,去除重复数据、空值、噪音等,最终保留数据29 003条,数据属性包括:Tweet发布时间、用户名、Tweet内容、语言、回复数、转发数、点赞数等。
微博数据本文采用新浪舆情大数据平台来获取,该平台拥有新浪微博全量数据库,每天存储新浪微博数据超过6 000万条[18]。检索时间为新疆棉花舆情事件在国内爆发直至消退时间区间,即:2021年3月24日至2021年4月24日,检索词为“新疆棉花”,对检索结果进行清洗后,最终导出数据77 585条,数据属性包括:微博内容、网址、地域、发布日期、账号名、账号类型、情感属性、转载量、转载账号等。
2.2研究方法本文采用Excel软件进行基本数据统计和展示;利用LDA(Latent Dirichlet Allocation)模型来挖掘舆情中的主题信息,具体方法为:通过调用Python的第三方库Sklearn及可视化工具pyLDAvis对采集语料进行挖掘;利用自编JAVA程序和Gephi软件进行社会网络分析。
根据研究需要,本文还采用BERT模型(Bidirectional Encoder Representation from Transformers)分别对采集的Twitter和Weibo语料进行文本分类。其中,通过对Twitter语料初步分析,课题组将其分为“支持新疆棉花”、“抵制新疆棉花”和“其他”三个类别,代表国际网络舆论中的主要立场;通过对新浪微博语料初步分析,课题组将其分为“支持新疆棉花”、“反对污名化”和“其他”三个类别。BERT模型本文采用的是Hugging face公司开发的Transformers开源包[19],该开源包提供了各种预训练模型库,用户可以通过下载预训练模型,并在自有数据集上进行微调(Fine-tune),从而建立自己的文本分类模型;BERT模型文本分类步骤为:a.招募三名研究生分别对Twitter语料和新浪微博语料进行标注,将语料归入上述预设类别,Twitter和新浪微博数据,分别标注数据4000条,其中两名研究生标注,一名研究生进行比对,若出现标注不一致,则由第三名研究生进行仲裁;b.将标注好的数据70%作为训练集,30%作为测试集,分别在BERT-base-uncased(英文)和BERT-base-chinese(中文)预训练模型上进行微调,训练模型迭代次数Epoch为5,BathSize为16,MaxSeqLength为300,LearningRate为2e-5,最终Twitter和新浪微博训练模型的准确率、召回率及F值如表1和表2所示。c.Twitter和新浪微博各类别数据分布如表3和表4。
表1 Twitter语料BERT微调模型文本分类准确率、召回率及F值
表2 新浪微博语料BERT微调模型文本分类准确率、召回率及F值
表3 Twitter语料各类别分布
表4 新浪微博语料各类别分布
3.1舆情传播趋势对比分析
3.1.1 国外传播趋势分析 对2019年7月1日至2021年4月24日期间Twitter的数据进行时序分析,发现,在国内爆发新疆棉花舆情前(2021年3月34日前),新疆棉花事件在国际互联网中已发酵许久,并伴随着多起标志性事件而呈现出多个传播高峰。具体包括:a.2019年7月澳大利亚广播公司ABC调查节目《四角方圆》发布关于我国新疆地区的报道;b.2019年10月,部分跨国品牌宣布停用新疆棉花;c.2020年9月,国际时装公司H&M发布关于抵制新疆棉花的声明,同期美国国会通过了相关禁令法案;d.2020年12月,美国研究员郑国恩就新疆棉花事件发表了独立调查报告,同期英国广播公司(BBC)也发布了相关报道;e.2021年1月,特朗普政府宣布禁止进口所有来自我国新疆地区的棉花和番茄产品;f.2021年3月新疆棉花事件在我国互联网发酵引爆。总的来看,在新疆棉花事件中,国家行为、主流媒体、跨国企业是国际互联网舆情引爆的主要推手,对舆情传播扩散有着重要作用。
从舆情类别上看,在国内舆情引爆以前,国际舆情受西方国家行为、主流媒体和跨国企业的影响,态度以抵制新疆棉花为主,这一方面反应了,这些涉事主体对于舆论的强势影响,另一方面,也凸显了在此期间我国在国际网络舆情场中的话语真空。国内舆情引爆后,受国内舆情外溢影响,国际上支持新疆棉花舆论显著增多,网络舆论场出现了支持与抵制言论对冲的状况。对国内舆情爆发前后,国际互联网各类舆情变化情况进行统计,发现,在国内舆情爆发前,Twitter中支持新疆棉花的舆论只占到总数的6.57%,而国内舆情爆发后支持的舆论飙升至总数的34.05%。
3.1.2 国内传播趋势分析 对微博2021年3月24日至2021年4月24日期间的舆情数据进行时序分析趋势图绘制,如图1所示。可见,国内舆情对事件反应强烈,在国家部门、主流媒体、明星、企业、社会组织、意见领袖、网民的共同参与下,舆情在短时间内迅速达到波峰。这其中包括:外交部、商务部、新疆人民政府对事件的共同回应,央视新闻、人民日报、环球网等的密集报道,大陆、香港、台湾等地明星的表态支持,国内电商平台、服装企业、线下实体店等的力挺,中国棉花协会、消费者协会等的澄清,媒体编辑、专家学者、知名人士的发声,以及国内网民的线上线下支持活动。总体来看,此次事件中,上至我国政府部门,下至企业及社会大众,对事件反应是迅速的(事件前3天发布信息占全部信息量的33.69%),立场和表态是极其一致的(69.20%的信息明确表达了支持新疆棉花,反对污名化的态度),这一方面展现了,我国社会应对外部威胁的强大凝聚力;另一方面也反应了,我国社会反对污名化的坚定决心。
图1 微博中新疆棉花事件网络舆情传播趋势图
3.1.3 国内外传播趋势对比分析 对2021年3月24日至2021年4月24日Twitter和新浪微博中的新疆棉花事件网络舆情趋势进行对比分析,如图2所示。可见,与之前事件在国外爆发,国内无人问津大相径庭,Twitter和新浪微博呈现出了一致的涨跌趋势。针对这一现象,课题组对该时间区间中Twitter文本进行了内容分析,发现:出现这一情况的主要原因是国内舆情外溢至Twitter社交平台所导致的,即:大量义愤填膺的国内民众,通过登录国际互联网,在Twitter上发布支持新疆棉花、澄清相关事实的信息。此现象从另一侧面也表明了,国际、国内舆论场存在严重的信息屏障,事件未在国内爆发前,国际信息进入国内互联网艰难而缓慢,同时,国内真实情况也难以在国际上传播表达,导致国际舆论场虚假信息横行,容易招致国外不知情网友误解。
图2 Twitter和新浪微博新疆棉花事件舆情趋势对比图
3.2网络舆情信源对比分析
3.2.1 国外舆情信源分析 对Twitter舆情信源进行统计分析,发现发推数量超过3条的账号占到总账号数的12%,他们发布的全部推文占到所有推文的44.41%,信息集聚特征较明显。对“支持新疆棉花”和“抵制新疆棉花”两种不同立场账号进行排序,各类别发布信息前20账号如表5、表6所示。由表可见,两类账号在粉丝数、身份类别上有很大差异。在“支持新疆棉花”前20账号中,有6个账号为中国官方媒体,他们粉丝数众多,发推数量靠前,在Twitter中采用的传播策略与国内类似,主要通过密集发布信息来引导舆论。另外14个账户除1位作家、1个政府账号,1个媒体账号外,其余11个账号均为个人账号,他们粉丝数少,影响力小,更多是受事件影响,情绪性发帖。在“抵制新疆棉花”前20账号中,有6个账号自称为国际人道主义组织,14个账号为其他个人或组织,他们在Twitter中有一定数量拥趸,发布的信息图文并茂,有较强的编辑水平,内容有很强的目的性、误导性和煽动性。对比发现,支持类账号更多采用广播式宣传策略,而抵制类账号更多采用劝导式策略,前者略为生硬呆板,后者灵活,代入感强。
表5 Twitter发布“支持新疆棉花”信息数量前20账号
续表5 Twitter发布“支持新疆棉花”信息数量前20账号
表6 Twitter发布“抵制新疆棉花”信息数量前20账号
3.2.2 国内舆情信源分析 对新浪微博舆情信源进行统计分析,发现发布微博数量超过3条的账号占到总账号数的14%,他们发布的全部微博占到所有微博数据的51.44%,与Twitter类似,信息集聚特征明显。对“支持新疆棉花”和“反对污名化”两种类型账号进行排序,各类别发布信息前20账号如表7、表8所示。由表可见,发布两类信息的账号有一定的同质性,但也存在稍许微妙差异。总体来看,在发布“支持新疆棉花”类型信息最多的20个账号中,可谓是八仙过海,各显神通,各种身份账号均积极参与,即有政府机构、官方媒体,也有自媒体、企业家、个人等网络意见领袖,甚至还有少许账号因借机炒作、借势营销而被微博平台封号(根据内容分析判定),对这些账号发布信息进行回顾,发现口号较多,信息表达丰富性不足。在发布“反对污名化”类型信息最多的20个账号中,课题组发现,与前述信息类型不同的是,发布这类信息的账号有9个媒体账号,账号背景多样性少于“支持新疆棉花”类型账号,对内容分析发现,这些账号信息内容多为对污名化我国行为的回击及国内抵制洋品牌行为的评论。总体来看,得益于我国民众坚强的凝聚力及国内广泛的传播矩阵,在关键时刻,各类型媒体账号信息内容在短时间内表现出了惊人的一致性和同步性。
表7 新浪微博发布“支持新疆棉花”信息数量前20账号
表8 新浪微博发布“反对污名化”信息数量前20账号
3.2.3 国内外舆情信源对比分析 对Twitter舆情信源和新浪微博信源进行比较分析,发现具有以下方面异同:a.在信息集聚程度上,Twitter和新浪微博信息集聚程度比较相似,均呈现少部分账号发布了大部分的信息现象。b.在信源身份上,Twitter前20账号身份类型较为单一,主要为国际人道主义组织,他们长期布局,具有较为清晰的账号定位、明确的宣传目标和稳定的受众人群。微博前20账号身份类型更为多样,媒体账号多定位为综合频道,个人账号定位相对模糊且传播影响力较小。c.在信源内容上,Twitter前20账号专指性强,内容维度多样,具有一定的误导性和煽动性。新浪微博前20账号内容同质性高,报道维度有限,内容常滞于“就事论事”;d.在传播策略上,Twitter前20账号长期跟踪事件,通常主动出击,每当国际上出现标志性节点,总能发现他们活跃的身影。新浪微博前20账号则为短期被动应对,信息爆发密集而紧促,运动式宣传特征明显。
3.3网络舆情话题对比分析
3.3.1 国外舆情话题分析 运用LDA主题模型对Twitter语料按照“支持新疆棉花”“抵制新疆棉花”和“其他”3个类别分别进行文本挖掘,得到舆情主题11个。其中,支持新疆棉花类主题4个,抵制新疆棉花类主题4个,其他类主题3个。在支持新疆棉花类文本中,讨论的主题有:a.当前采棉工作环境较好,已基本实现机械化;b.种植棉花使新疆少数民族得以脱贫致富;c.新疆棉花质量很好,在纺织品市场上供不应求;d.支持新疆棉花,抵制污名化新疆的西方企业。在抵制新疆棉花类文本中,讨论的主题有:a.新疆地区是否存在强迫劳动;b.停止进口所有来自中国地区的棉花和番茄产品;c.新疆维吾尔族孩子的教育问题;d.就新疆问题对中国采取行动。在其他类文本中,讨论的主题有:a.无印良品的新疆棉产品引发消费者争议;b.对行业协会BCI背景进行讨论;c.BBC关于新疆棉花的报道引发争议。结合主题类别、信源及内容进行分析,发现Twitter中“支持新疆棉花”的话题,除话题3外,其余话题基本为国内媒体和网民所发。在“抵制新疆棉花”的主题中,舆情内容往往较为主观、武断,且带有较强的意识形态偏见。在“其他”主题中,一些在事件中扮演角色特殊,行事风格独特的企业、组织和机构则引发了较大争议。
3.3.2 国内舆情话题分析 与Twitter话题分析类似,课题组利用LDA模型对微博语料进行挖掘,从“支持新疆棉花”“反对污名化”“其他”三类文本中分别得到舆情话题共10个。其中,支持新疆棉花类话题3个,反对污名化话题4个,其他类话题3个。在支持新疆棉花类文本中,讨论的主题有:a.支持新疆棉花,向抹黑我国的行为说不;b.推荐去新疆旅游,及支持新疆长绒棉;c.支持国产服装品牌。在反对污名化类文本中,讨论的主题有:a.抵制污名化中国的洋品牌;b.对污名化我国的行为,进行强有力的回击;c.国内抵制H&M的实际行动;d.国内明星与抵制新疆棉花的西方企业解约。在其他类文本中,讨论的主题有:a.讨论部分国家双标,不关注核废水的排放问题,却造谣我国强迫劳动;b.部分国内企业借势炒作,哄抬服装价格;c.讨论一些国际组织和个人在新疆棉花事件中为私人利益罔顾国家利益。由此可见,在新浪微博中,无论是官方还是民间,我国社会对待新疆棉花事件立场是空前一致的。既有义正辞严的官方回应,又有朴素真实的民间行动。话题情感既表达了对污名化我国的西方国家及洋品牌的不满和愤怒,同时,也突显了我国民众的爱国情怀及民族自信。当然,通过对“其他”类别语料挖掘,课题组也发现一些投机取巧、重个人利益而轻国家和集体利益的组织和个人,即便深藏幕后,在冲突漩涡中,也难逃民众的火眼金睛。
3.3.3 国内外舆情话题对比分析 对Twitter和新浪微博舆情话题进行对比分析,发现除双方均认可的新疆棉花优良品质外,国内外舆论场在此事件中鲜有共通的语义空间。在Twitter中,欧美话语体系盛行,他们利用大部分外国民众对中国的真实情况的不了解及一些国家历史上类似的惨痛经历,引发西方受众潜意识共鸣,促使信息采信和快速传播。在新浪微博中,我国政府及官方媒体言辞犀利、观点强势,民间话语激动且愤慨,这使得中西两个舆论场对话维度严重不一致,呈现出“自说自话”现象。
3.4网络舆情传播社会网络分析
3.4.1 国外网络舆情传播社会网络分析 运用Gephi社会网络分析工具对Twitter数据进行分析,发现,在Twitter中,“新疆棉花”事件属于“关键点”传播模式[20],即:关键节点对信息传播起到了至关重要的作用。由于在“关键点”传播模式中,除关键点外,其他用户对信息转发并不积极,传播过程结束较快,信息传播范围主要依赖于关键节点影响力。对Twitter数据中的11 503个节点进行统计分析,发现其中有6 358个节点在Titter上向其它节点传递了信息(节点出度大于0),占到所有节点的55.27%,说明在此话题中,强势节点对舆情传播具有重要影响,信息传播基本局限在强势节点的影响范围。
3.4.2 国内网络舆情传播社会网络分析 采用相同方法,对新浪微博舆情数据进行分析,发现,新浪微博传播模式与Twitter传播模式类似,属于“关键点”传播模式。对新浪微博数据中的81368个节点进行统计分析,发现其中有30063个节点在新浪微博上向其它节点传递了信息(节点出度大于0),占到所有节点的36.95%,可见在国内舆论场中信息集聚趋势相对明显,信息传播主要依赖于关键核心节点引导,话题衍生和扩散动力不强。另外,新浪微博传播节点呈现出了两类比较分明的传播角色,即:一部分节点主要对外传递信息,如:央视新闻、观察者网、小疆有话说,一部分节点被网民提起(@符号)较多,如:H&M中国、耐克、任嘉伦等。
3.4.3 国内外网络舆情传播社会网络对比分析 对Twitter和新浪微博社会网络数据进行比较分析,发现,Twitter传播网络平均加权度为1.772要远高于新浪微博的0.922,这说明相较于国内舆论场,“新疆棉花事件”在国外舆论场中讨论更为频繁,网民交流也更为活跃。将Twitter与新浪微博传播网络的平均聚类系数和平均路径长度进行对比,发现在相近平均路径长度水平下,Twitter聚类系数为0.023,远高于新浪微博的0.004,说明Twitter传播网络中“小世界网络”特性更为明显,即:Twitter传播节点之间连接关系更为紧密,信息在网络中传递的速度更快。另外,在新浪微博中,传播关键点占所有节点的36.95%,远低于Twitter的55.27%,说明,新浪微博信息的集聚程度比Twitter更强,即:信息集中于少数具有较大影响力的账号手中,由他们主动向外发布和传播。
依据上述对比分析结果,总体来看:a.在传播趋势上,由于事件始发于国外,舆情在Twitter中传播时间更漫长,影响也更为广泛。而在国内,由于信息屏障存在,事件知晓时间较晚,但关乎国家利益,舆论反应强烈,短时间内即达传播峰值;b.在信源类型上,Twitter中发布信息前20信源身份类型较为单一,发布信息策略性强,新浪微博发布信息前20信源身份类型较为多样,但发布信息较为被动,且许多账号定位多元;c.在舆情话题上,Twitter中话题以欧美语系为主,新浪微博中话题激荡着强烈的爱国主义精神,中外两个舆论场鲜有共通的语义空间;d.在舆情传播网络上,相较于新浪微博,Twitter传播网络“小世界”特性更为明显,网民交流更为活跃,但信息集聚程度不如国内。
综上,为加强我国应对国际突发事件涉华舆情的能力,有效开展国际舆论引导和舆论斗争,展现真实立体全面的中国,课题组给出如下建议:
a.建立对重点国家、重要国际组织、跨国企业的涉华国际舆情跟踪机制。不同国家、不同组织、不同企业在国际舆论场中的传播影响力是不同的,往往国际威望越大、拥有资源越多、关系网络越复杂的实体所拥有的传播影响力越大。因此,对各类实体国际影响力进行评估,建立重点监测实体清单,及时发现、评估这些实体所发布和传播的涉华信息,有助于我国政府第一时间回应和处置舆情,避免事态扩散和恶化。
b.针对国际涉华敏感问题,有计划、有组织、有步骤地开展对外舆论引导。对于一些涉华敏感问题,特别是关系我国繁荣与稳定的涉疆、涉藏、涉港、涉台等问题,应对其煽动意图、宣传策略、传播手段等进行长期跟踪、全面分析,分解其运作逻辑。同时,在对外回应和传播方面,建立相关垂直领域的传播平台和矩阵,对敏感问题进行深入调查、持续澄清,甚至在恰当的时候主动出击,有计划、有组织、有步骤地开展对外舆论引导。
c.抵制一切污名化我国的行为,对反华势力的挑衅坚决予以有力回击。国际上部分反华势力长期肆无忌惮的对我国进行造谣和抹黑,给我国的国际声誉和形象带来了恶劣影响。一些国际组织、跨国企业及个人,为了自身利益,常充当马前卒,编造和传播有损我国利益的负面信息。为此,对于一切企图污名化我国的行为,必须采取强硬手段,予以坚决抵制和回击。
d.优化对外沟通交流机制,探索共通的语义空间,提升国内外互信水平。受政治体制、意识形态、文化传统等因素的影响,当前我国与西方社会的沟通交流机制还有待进一步优化。从本文案例来看,在涉华敏感议题回应上我国还较为被动,传播策略单一、传播手段枯燥、与国际社会沟通交流的技巧欠缺。为此,对国际舆论环境、舆情特点进行深入分析,探索共通的语义空间,提升国内外互信水平,便成为当前对外传播亟需解决的关键问题。