基于语料库的《纽约时报》对新冠肺炎疫情涉华的报道及态度研究

2022-04-21 07:19张聪颖
关键词:纽约时报主题词语料库

张聪颖

(山东建筑大学外国语学院,山东 济南 251010)

一 研究背景和研究目的

新冠肺炎疫情以其传播速度快、感染范围广、防控难度大,给中国带来了前所未有的挑战。新冠肺炎疫情发生以来,中国采取了全方位的政府和社会总动员,以及果断有力的防控措施,成功抗击疫情,既有效保护了国内人民的生命健康,又对国际卫生安全作出了极大的贡献。

创办于1851年的《纽约时报》是美国权威的报纸之一,在美国政治与社会方面具有广泛的影响力。“国会研究的问题有90%来自《纽约时报》和《华盛顿邮报》的头版。”[1]《纽约时报》不仅在美国具有强大的影响力,而且在全球拥有庞大的读者群,《纽约时报》新闻网站每月拥有超过30 万的独立访问者,它的报道和评论文章被世界其他报纸和新闻社直接作为新闻来源。新冠肺炎疫情对于中国乃至全球的影响巨大,受到国际社会的广泛关注,中国政府的应对策略和社会的各方面反应在世界视野中被直观具体地呈现出来。而极具国际影响力的《纽约时报》在新冠肺炎疫情期间涉华报道时的关注点集中在什么地方?在报道时能否遵循自称的“客观、公正、不偏不倚”?以何种态度和视角构建中国形象?这些问题是本文研究的目的和重点。

二 研究方法

本文通过自建语料库将定量和定性分析相结合。在新闻传播学领域,传统的文本分析囿于有限的样本数量和定性研究的窠臼,无法满足大数据时代对内容挖掘的广度和深度要求,而语料库分析方法的介入,通过计算机快速、准确地处理文本数据,使自然文本的数据化和结构化成为可能。

(一)语料来源

本研究以“coronavirus”(冠状病毒)为关键词,搜集了《纽约时报》一个月内(2020年1 月8 日—2020年2 月7 日)对新冠肺炎疫情的所有报道和评论,共385 篇文章,以此自建了一个小型语料库,语料库的形符总量为200 486。

本研究所使用的语料库分析软件是WordSmith Tools(Scott,2015),主要用于生成词表和主题词数据库(显著性值设定为p<0.0000001)。主题词是指在一个由相同主题文本构成的小型语料库中,具有超常使用频率的词[2]。在对主题词进行分析时,需要根据研究目的选择参照语料库。Berber-Sardinha(2000:7)[3]认为,参照语料库大于目标语料库5 倍可最大限度地产出主题词。因此,本研究用来做对比的参照语料库是英国国家语料库 BNC(British National Corpus),包含了 4 124个文本共100 106 008个词,库容是观察语料库的50倍,能够确保统计结果的可信度。

(二)研究设计

1.搜集《纽约时报》2020年 1 月 8 日—2020年2 月7 日关于新冠肺炎疫情的所有报道和评论,并转换成纯文本格式。

2.统计每日报道的数量。

3.建立词表数据库。利用软件对自建小型语料库进行处理,生成词表数据库(word list database),再用参照语料库(BNC)生成一个词表,内含词频、百分比、语料库总量等信息。

4.建立主题词数据库(keyword list database)。通过软件对比自建语料库和参照语料库,生成主题词数据库。

5.进行关键主题词查询及联想词重组。打开主题词数据库,查看关键主题词及其联想词表,对联想词表还可进一步作堆块处理(clumping)和匹配分类(match clumps)。

三 研究结果及分析

(一)报道数量分析

本研究选取 2020年 1 月 8 日—2020年 2 月 7日作为样本的原因在于:首先,这一段时间是新冠肺炎疫情在中国的爆发期,尤其在武汉市,新增确诊病例和死亡病例都在此时达到高峰。其次,春节假期前后是旅游市场和消费品市场的活跃时期,对中国的经济发展有着全面而深刻的影响。最后,世界卫生组织也在这段时间频繁到访中国并展开调查,因此美国媒体对于中国新冠肺炎疫情的报道比较集中(见图1)。

图1 《纽约时报》2020年1 月8 日—2020年2 月7 日对中国新冠肺炎疫情的报道数量

《纽约时报》对新冠肺炎疫情的涉华报道始于2020年1 月8 日,对新冠肺炎的发病人数和发病地点进行介绍,多次使用“panic(恐慌)”来表达中国民众的反应,“恐慌的原因是由于对2003年的SARS 病毒带来的感染和死亡人数记忆犹新。”新型疾病出现在春节前几周,“春节是中国最重要的节日,届时将有数亿人出行,需要对其传播有所警惕。亚洲其他国家的卫生部门已对中国入境者加强筛查,世界卫生组织将会对疾病密切关注。”

从2020年1 月21 日以后,报道的数量逐渐增多,2020年 1 月 24 日和 1 月 31 日分别达到了 34篇和36 篇,如此频繁的报道,在《纽约时报》上是不常见的,充分表明了《纽约时报》对新冠肺炎疫情关注程度之强。2020年 1 月 8 日—2020年 2 月7 日整个一个月的报道周期中,新冠肺炎疫情对美国的影响很小,为什么美国媒体对新冠肺炎疫情的涉华报道呈现出如此大的关注程度和报道力度呢?这和美国媒体在新闻报道中尤其是国际新闻报道中,为了迎合新闻价值、市场价值、受众需求而倾向于选择负面新闻有关。在国际事务方面,美国的新闻除去要员出访以外,涉及最多的是示威、动乱、政变、革命、灾难、独裁、冲突、战争等[4]。因此,美国媒体这次依然抱着隔岸观火的心态,对新冠肺炎疫情在中国的传播表现出异常的关注。

(二)主题分析

议题设定的概念来自于传播学理论,由Cohen最早提出,媒体对一个议题的报道取向及数量,能够影响公众对该议题的重视程度(Cohen,1963)[5]。语料库依托计算机的优势,能够快速准确地在大规模文本中提取主题词,对主题词的分析可以让我们了解到《纽约时报》到底报道了什么内容。通过计算机生成的主题词库,并对其进行分类,我们了解到《纽约时报》报道的内容如下。

(1)时间:Lunar New Year,holiday.

(2)地点:China,Wuhan,Hubei,Seafood market,Beijing,Shanghai,Korea,Thailand,Singapore,United States,Australia,Wenzhou,epicenter,global.

(3)疾病描述:virus,epidemic,pneumonia,disease,illness,syndrome SARS,MERS,Ebola,flu,symptoms,fever,coughing,incubation.

(4)疾病影响:spread,infect,outbreak,death,kill,pandemic,emergency,contain,deadly,transmission,crisis,fears,rumors,toll,confirmed.

(5)相关人物和主体:cases,patients,officials,citizens,residents,experts,Xi Jinping,passengers,nationals,Trump,WHO,travelers,authorities,media,airlines,airport,hospital,Weibo,WeChat,Twitter,Facebook,CCTV,Reuters,transportation,stocks,tourism,economy,wildlife.

(6)措施:masks,quarantine,lockdown,cancel,restriction,evacuate,measures,vaccine,prevention,suspend,screen,shut,close.

通过对主题词的相关索引行进行分析,可以得出以下结论:

在公共卫生事件报道中,《纽约时报》依然不放弃对敏感问题过度发挥。表示地点的关键词中,HongKong(K=1005.8;P=0),Taiwan(K=687.7;P=0)是《纽约时报》关于新冠肺炎疫情涉华报道中,除了湖北省武汉市以外涉及最多的地名。中国香港和中国台湾的新冠肺炎病例并不多,缘何成为《纽约时报》的报道重点?多年来,香港问题、台湾问题始终是美国关注中国的焦点问题,“美国和中国的所有问题中,最具煽动性的就是台湾问题。”[6]即便是看起来和政治毫无关系的公共卫生事件的报道,依然离不开这个焦点。如2020年2 月4 日的《纽约时报》刊登了一篇题为“台湾当局称大陆在疫情期间限制台湾加入世界卫生组织是‘卑劣’行为”的报道,报道了台湾当局抱怨大陆因为一个中国原则禁止台湾参加世界卫生组织会议,而导致其对疫情信息了解滞后,台湾方面只能从美国和日本等国了解相关信息。虽然在文章中也指出了中国政府对此的反驳,看起来报道引用了“中立”的立场,但单从文章标题看,很容易被误读。

《纽约时报》除了对新冠肺炎疫情发生后中国政府的应对和感染人数关注以外,对于新冠肺炎疫情对中国经济的影响更是表现出极大的关注。新冠肺炎疫情下中国的经济“economy”(K=195.4;P=0)在《纽约时报》每日的经济版中几乎都有提及。美国对中国经济极度关心的原因在于:在美国看来,作为全球第二大经济体的中国,遭受新冠肺炎疫情打击后,经济势必受到冲击,而中国经济的衰退一定会给全球经济造成重创。如《纽约时报》2020年 1 月 29 日发文“coronavirus outbreak tests world’s dependence on China”(新冠病毒的暴发检验出世界对中国的依赖),指出中国经济约占全球经济总量的六分之一,是世界上最大的制造商。不同于2003年“非典”疫情时期的中国,如今的中国经济势头强劲,如果中国经济受到新冠肺炎疫情的影响而衰退,全球经济都会动荡。

经济领域中,《纽约时报》重点关注旅游业和股市。tourism(K=228.4;P=0)和 stock(K=258.5;P=0)在频次和相关性上表现突出。如《纽约时报》2020年1月23 日发文“Stocks Around the World Drop on Virus Concerns,Led by China”(世界各地因病毒引起股票下跌,由中国主导),其抛出新冠肺炎疫情的发生,使春节假期本应该火爆的中国旅游市场萎靡,从而导致世界旅游业和全球经济下滑,亚洲股市跌幅明显,美国和欧洲股票均受到影响下跌的言论,“甩锅”中国。

《纽约时报》的信息来源更多出自社交媒体。除了官方媒体,如CCTV(中国中央广播电视总台)和传统的新闻通讯社,如Reuters(路透社),很多报道则来源于Weibo(微博)、WeChat(微信)、Twitter(推特)、Facebook(脸书)这些社交媒体。其中Weibo(K=602.8;P=0)、WeChat(K=397.6;P=0)远远超过CCTV(K=264.3;P=0)。

在网络信息技术高度发达的今天,以微信、微博、推特、脸书等为基础的自媒体传播媒介具有互动性强、传播快速及时、影响范围广的特点,为公众提供了一个方便快捷的话语表达平台。与传统媒体以传递客观信息为主相比,自媒体“主要传播的是观点和立场”;传统媒体的报道“整体倾向在客观中立的基础上偏向于正面,而在微博的内容,则是态度鲜明,负面倾向较大。”[7]由于网络信息庞杂,缺乏“把关人”,各种偏激、充满个人偏见的信息充斥着网络自媒体。尤其是在新冠肺炎疫情刚刚在中国发生的时期,对新冠病毒的不了解和恐惧导致很多人产生恐慌心理,因此网络自媒体上各种负面、未经查证的信息扑面而来,美国媒体对此进行选择性捕捉,作为其对中国负面报道的依据。如《纽约时报》在2020年1 月28 日发表的一篇题为 “Coronavirus Crisis Exposes Cracks in China’s Facade of Unity”(冠状病毒危机暴露了中国团结外表的“裂痕”)的文章,文章中的所有证据都是断章取义地引用中国网民微博、微信的内容,称中国各个领域的民众对新冠肺炎疫情发生后政府的应对不满,甚至愤怒,看似随意的引用,实则利用这些他们“精心挑选”的负面情绪的宣泄对中国政府甚至体制进行攻击。

夸大疫情对中国的影响,企图突出中国被世界孤立的假象。值得注意的是,“cancel”(取消)(K=567.5;P=0)在关键词中的频率排名中非常靠前,甚至远远高于疫情发生后本应最关注的疫苗(vaccine)(K=419.1;P=0)。与之意义相近的“suspend”(暂停)(K=361.4;P=0)频率也很高。检查它们的前后搭配词发现,“cancel、suspend”前面的搭配词通常是各个航空公司,后面的搭配词通常是航班。如:

1.All Nippon Airways canceled all flights to and from Wuhan.

译文:全日空航空公司取消所有往返武汉的航班。

2.Turkish Airlines says it Suspends flights to China until February 9.

译文:土耳其航空公司表示,将暂停飞往中国的航班,直至2 月9 日。

2020年 1 月 31 日,《纽约时报》发表题为“Airlines Suspend China Flights Over Coronavirus”(因冠状病毒,航空公司暂停往返中国航班)的文章,列举出所有暂停往返中国航班的航空公司。对这一情况如此高报道频率的背后,不难看出《纽约时报》试图构建一个新冠肺炎疫情发生后,被全世界“孤立”的中国形象。

(三)关键主题词和联想词

关键主题词具有两个含义:一是通过与参照语料库对比,该词语在观察语料库各个单篇文本中具有超常的出现频率。二是该词语作为主题词在观察语料库中一系列相关文本的主题词表中具有较高的复现率[8]。在关键主题词中,可以统计出与单个关键主题词构成聚合关系的联想词。联想词是指在主题词表中与关键主题词具有重复同现关系的词语。关键主题词和联想词之间构成了围绕某一主题表达而触发的复杂网络。

图2 关键主题词和联想词构成的网络

coronavirus(冠状病毒)和 authorities(官方)互为联想词,通过对authorities 的索引行进行分析,可以看出《纽约时报》对新冠肺炎疫情发生后,中国政府的反应和表现的评价主要体现如下。

(1)对中国政府所做努力的客观报道。中国政府在新冠肺炎疫情发生后采取措施,包括收治确诊和疑似病例、对密切接触者实施观察、提醒公众采取防护措施、在机场和车站进行体温检测、检查运输活禽的车辆、取消大规模人员聚集、对武汉市乃至湖北省进行封控管理,目的在于避免新冠病毒的大规模感染和减缓病毒蔓延的速度。与此同时,《纽约时报》还对中国政府调查病毒起源、在武汉市建立方舱医院、派出医疗队、控制物价,愿意与国际社会合作共同战胜新冠病毒等进行了报道(见图3)。

图3 authorities 索引行中对中国政府努力的客观报道

(2)对中国政府的不信任和指责。主要体现在:首先,认为政府早期对新冠病毒可能引发的危险重视不够,抓住政府在新冠肺炎疫情发生初期误认定病毒不会人传人的说法不放。其次,对中国政府公布的病例数量存在怀疑,认为政府采取强制手段使最先认定新冠病毒具有传染性的医生保持沉默,除了政府之外,其余渠道无权谈论新冠肺炎疫情。最后,认为中国政府企图用歌颂抗疫英雄的宣传来掩盖网络对其新冠肺炎疫情防控不力的批评(见图4)。

图4 authorities 索引行中对中国政府的歪曲报道

对语料库中authorities 的索引行进行提取,选取《纽约时报》对中国政府的报道,共计263 条,其中对于中国政府在抗击新冠肺炎疫情过程中的批评和指责的负面报道有203 条,正面报道只有15 条(见图5)。

图5 authorities 索引行中对中国政府报道的态度分析

(3)对政府的评价源自第三方。通过对authorities提取关联词,发现其关联词:experts,professor,social media,commenters,residents 都是属 于 人和媒体 的范畴(见图6)。

图6 authorities 索引行中的消息源分析

通过对其同现的索引行进行分析,发现《纽约时报》并不正面批评中国政府,所有对中国政府的指责和负面态度均是通过第三方之口,即一些媒体,尤其是自媒体。除此之外,《纽约时报》还频繁引用所谓“中外专家”的话来指责中国政府在新冠肺炎疫情防控方面的不力。表面上看起来这些负面报道都是引用自第三方,看起来有章可循,实则是借此表达自己的观点和态度。

(四)堆块处理分析

通过对coronavirus 的索引行提取四词词块发现 ,coronavirus 主 要 和 outbreak,cases,deaths toll,spread,epicenter 进行搭配,说明《纽约时报》在报道时,关注点主要集中于新冠肺炎病例、死亡率、传播速度和高发区域(见表1)。

表1 纽约时报语料库前25个四词词块

续表

通过对高频词块 due to the coronavirus,of the coronavirus outbreak 的索引行进一步分析,发现其主要集中于报道新冠肺炎带来的影响(见图7)。

图7 of the coronavirus outbreak 的索引行分析

通过高频词块索引行的提取可以看出,《纽约时报》对新冠肺炎疫情造成的影响,主要是从各个国家对中国实施的所谓“旅行限制”、暂停往返中国航班、大型国际连锁企业停止中国业务,以及股市动荡、石油价格下跌等方面进行描述(见图8 和图 9)。

图8 due to the coronavirus 的索引行分析

图9 due to the coronavirus,of the coronavirus outbreak 的索引行描述主题

造成这种报道倾向的原因,一方面是世界各国对中国在经济上的依存度日益明显,新冠肺炎疫情在中国的发生,必将对全球经济造成影响,因此在报道中多次描述新冠肺炎疫情对旅游业、股市、油价等的影响。另一方面,《纽约时报》抱着隔岸观火的心态,对新冠肺炎疫情在中国的发生反应过度,以傲慢与冷漠的姿态报道一些国家对中国采取所谓的“旅行禁令”。世界卫生组织将此次疫情列为国际关注的突发公共卫生事件,但其一再强调不建议实施旅行和贸易限制,流行病学家布伊博士认为采取旅行禁令是反应过度,会产生巨大的社会和经济影响,也并不能有效地抗击疫情。“这并不能真正保护一个国家免受病毒影响,只是产生了一种假象,好像能把这个病毒限制在中国,但事实并非如此。”[9]

四 结论和建议

(一)主要结论

1.在报道数量上,《纽约时报》沿用美国媒体喜欢关注负面新闻的一贯作风,大规模报道新冠肺炎疫情在中国的发生,最多时单日报道数量达到36篇,远远超过平时对中国的报道。这与甲型H1N1流感在美国出现时媒体的态度大相径庭,“就美国媒体此次疫情(甲型H1N1 流感)整体报道状况而言,不论是《纽约时报》还是美国其他各大媒体,其总体报道规模都不大,甚至还有萎缩的趋势。”[10]对于发生在自家门口的疫情漠不关心,却对中国发生的新冠肺炎疫情表现出异常的关注,很大程度上反映了即便是在公共卫生领域,美国媒体依然是把疫情放在政治框架中去解读,关注的不是健康问题,而是国家利益。对本国发生的新冠肺炎疫情轻描淡写,认为“附带损伤”,即疫情造成的经济损伤远远超过病毒本身的危害,而对疫情在中国的发生及其造成的影响无比关心,大肆报道,其意图不言而喻。

2.在报道主题上,主要集中在时间、地点、疾病描述、疾病影响、相关人物和主体以及措施方面,一定程度上似乎及时、客观地报道了中国疫情的发生和发展情况,但与此同时,对于中国政府公布的疫情数据流露出不信任的态度。而且受其报纸的商业性目的和意识形态的影响,《纽约时报》不仅有选择地漠视中国人民如何众志成城战胜疫情,而且强化疫情肆虐带来的负面影响和世界各国的“恐华”言论和行为,并将疫情的责任指向中国的政治体制,从而使新冠肺炎疫情这样的公共卫生事件被带入意识形态和制度领域。这种“先扬后抑,似扬实抑”的报道策略,操纵了读者的关注点和注意力,误导读者忽略疫情的严峻性,对中国在抗击疫情方面采取的措施“不以为然”。

3.在关键主题词分析中,选取了和“coronavirus”互为联想词的“authorities”,通过对其索引行的分析可以看出,《纽约时报》虽然在一定程度上报道了中国政府在新冠肺炎疫情发生后采取的方案和措施,貌似“中允”“客观”,但与此同时又对中国政府始终抱有怀疑的态度,借第三方之口指责中国政府的疫情应对不及时、数据不可靠、措施不合理。

4.在堆块处理分析中,通过对coronavirus 的四词词块提取发现,《纽约时报》在报道时,关注点主要集中于新冠肺炎病例、死亡率、传播速度和高发区域。对其高频词块due to the coronavirus,of the coronavirus outbreak 的索引行进行分析,进一步发现《纽约时报》在报道新冠肺炎疫情对中国的影响时的两面性:一方面,随着世界对中国的依存度加深,担心在中国发生的新冠肺炎疫情会对全球经济造成影响;另一方面,刻意强调新冠肺炎疫情发生后,各国对中国采取的所谓“旅游限制”,中国处于被世界“隔离”的状态。

(二)建议

1.中国政府和各级部门在公共卫生事件发生之初就要保持信息渠道的畅通,及时向国内外发布疫情的有关信息,使外界能够通过正常的渠道及时了解事情的真相,减少国外媒体歪曲或误报的可能性,增强政府的公信力,树立积极正面的政府形象。

2.培养受众新媒介素养,规范网络行为。在有关新冠肺炎疫情的传播中,新媒体本身的公信力得分达到了5 分制的3.39 分,也就是说,新媒体得到民众一定程度的信任。渠道的多元不可避免要分解民众对官方渠道的依赖,网民对基于专业维度的信任权重将会逐渐增大,而对基于权力维度的信任权重将会逐渐变低[11]。以微博、微信为代表的新媒体因其互动性强、传播迅速、影响范围广等特点,在社会公共事件中发挥着越来越重要的信息交流与传播的作用,但也容易滋生谣言和各种虚假信息,从而被国外媒体利用,成为攻击中国的手段。因此,亟待完善相关法律法规,提高网民素养,规范网络行为。发挥新媒体的传播优势,及时传播疫情信息,讲好中国抗疫故事,分享中国的抗疫经验。

3.建立以中国为主导的公共卫生叙事话语体系,提升国际话语权。危中有机,以构建人类命运共同体为着眼点,通过多媒体互动的模式,全方位展示中国同世界各国一道同舟共济抗击新冠肺炎疫情的大国担当,批驳国外媒体别有用心的谣言,反击国外媒体自相矛盾的叙事逻辑和价值评判标准。

猜你喜欢
纽约时报主题词语料库
基于语料库的清末民初日源外来词汉化研究
智能传感器的智慧战略,新技术创造新价值
运用语料库辅助高中英语写作
取消公文主题词的真正原因是什么?
公文主题词消失的原因浅析
语料库与译者培养探索