张 探, 庞超伟
(国防科技大学 文理学院, 长沙 410073)
进入新世纪以来,对中国国家形象的研究逐渐成为大家普遍关注的热点。大量的研究都采用了相同的方式,即收集某一新闻机构的新闻报道建立语料库,并由此展开分析研究。利用语料库进行批评话语分析(CDA)开始于20世纪90年代,Hardt-Mautner和Stubbs是进行相关研究较早的学者。Stubbs[1]所著的《语篇和语料库分析:计算机辅助下的语言和文化研究》更是引起了学界对这类研究的广泛关注。众多综述性文章曾对批评话语分析产生的背景、发展脉络及应用前景做了详尽的描述和展望,并在与语料库语言学关系做比较的基础上对其应用空间、分析范式、局限性等进行了有益探讨,例如辛斌[2]、田海龙[3]、钱毓芳[4]、杜淼[5]等。运用语料库的方法来开展批评话语分析是当前较为通行的做法,其优势是能够解决CDA早期分析文本数量过少、代表性较差,以及对话语的解释缺少客观性和系统性等一系列问题。事实证明,对于这些问题的解决,语料库确实起到了较好的作用。经过近20年的发展,随着语料库技术和研究方法的革新,基于语料库的批评话语分析已经走向成熟。
国内对这一领域的研究关注也较早,其中涉及中国形象的分析很多也采用了利用语料库的研究方法。这些研究普遍发现,西方多种媒体对涉及中国国家形象的报道存在非客观化的问题,尽管程度有所差异,但西方媒体大都出现过对中国形象有误解、歪曲的报道(经前期文献计量,CNKI数据库中直接分析西方媒体报道中国形象的论文有113篇,其中具有明确观点认为西方媒体有意歪曲中国形象的论文61篇)。这些研究在揭示这一事实的同时,由于收集的文本领域单一、覆盖面窄等原因,也不禁让人产生一些疑问,即对中国国家形象的误解是否仅存在于西方新闻类、直接涉华类的语篇中呢?
鉴于上述情况,本文采用文献计量学的方法,对以往涉及中国国家形象的论文进行计量统计分析,在规避这类语篇所选语料特点的基础上自建一个非新闻类、非直接涉华语篇的“中立语料库”,并以此探究该类语篇中我国形象建构的客观性问题。为达到这一目的,本研究以下面两个问题展开:1.基于语料库对我国形象开展批评话语分析的研究现状是怎样的?(语料来源、研究方法及结论如何?);2.基于非新闻类、非直接涉华语篇的“中立语料库”进行分析是否也可以得出西方媒体存在歪曲我国形象的结论?本文以美国专门研究朝鲜事务的网站“38north”之中国形象的建构为例。
在CNKI上将检索范围设置成全文“语料库+批评话语+中国”的状态,共检索出917篇论文,时间跨度为2001—2017年。这一时间分布也基本符合利用语料库开展批评话语分析的时间。经Cite Space分析后得到图1。
从图1可以看出,最显著的几个节点分别是批评话语分析、话语分析、语料库、意识形态、评价理论等。由于在CNKI中检索时设置的过滤词为“语料库、批评话语、中国”,所以涉及这三个词的节点较多是必然的。但其索引线多数指向了“意识形态”这一节点,从其凸显情况及与其他节点的连线来看,可基本判定这类研究多数是从意识形态的角度出发进行分析的。将“意识形态”一词作为中心节点来探索与其他信息的关系时可以看出,进行这类研究所基于的语料来源有《纽约时报》、《政府工作报告》(英译)、《中国日报》、《人民日报》、COCA 语料库、美国总统就职演说、新闻语篇、新闻报道、政治语篇等(排名不分频率及类别),涉及的语言学方面的理论多来源于系统功能语言学、语料库语言学等,具体理论的应用则涉及概念隐喻、评价理论等。
为进一步甄别语料来源情况,利用Ant Conc 3.4.4分别统计Cite Space标注后的索引信息和未进行分词处理的信息 (由于Cite Space 标注、分词方法与Ant Conc 3.4.4分词方法存在差异,所以进行两个统计以便使结果更加准确),得到以下语料来源情况,见表1(限于篇幅,只展示了除中国刊物、资料外排名前10的西方刊物)。
图1 研究分布基本现状
以文本细读的方式分析基于《纽约时报》《华盛顿邮报》《时代周刊》《卫报》进行的研究,发现此类研究在内容上涉及的基本是我国敏感问题,以政治、经济和军事类话题为主,时代相关性很强。具体情况如下:1.利用《纽约时报》作为语料来源进行中国形象研究的文章共42篇,其中利用语料库进行批评话语分析的共27篇,内容涉及“中国军事武器状况”“占中事件”“中国梦”“中美关系”“南海问题”“钓鱼岛”“亚投行”“雾霾”“大阅兵”“中印骚乱”等问题。2.利用《华盛顿邮报》作为语料来源进行中国形象研究的文章共19篇,其中通过建设语料库进行批评话语分析的共11篇,内容涉及“中国梦”“雾霾”“中国经济增长放缓”等问题。3.利用《时代周刊》作为语料来源进行中国形象研究的文章共13篇,其中通过建设语料库进行批评话语分析的共11篇,内容涉及“大阅兵”“人权”“反腐”“中国梦”等问题。4.利用《卫报》作为语料来源进行中国形象研究的文章共10篇,其中通过建设语料库进行批评话语分析的共7篇,内容涉及“中英关系”“中美关系”“人权”“军备”“亚投行”等问题。
这些文章在研究方法上具有纷繁多样的特点,没有统一的范式,较常使用的方法是利用语料库软件进行诸如词频、搭配等简单检索,或标注后进行时态、句式、情感等探索性检索,利用语言学理论进行阐释,继而进行批评话语分析。用于阐释的理论多种多样,但基本是在语言学分支学科方面展开的。在利用语料库对西方媒体报道中国形象进行批评话语分析的56个研究中,基于词语搭配进行延伸与拓展,然后总结语义韵的研究方法使用最多,且呈加速发展的态势。使用这类方法的文章共有23篇,例如张艳敏[6]、支永碧[7]、张冠男[8]、韩冰[9]、杨晴[10]等。
表1 语料来源情况(部分)
虽然涵盖的内容纷繁复杂,使用方法各有不同,但是这类研究多在结论部分指出西方媒体有意构建非客观的中国形象。例如,朱桂生[11]分析《华盛顿邮报》后得出,通过分类、及物性、文本架构、互文性等手段,该报将中国的“一带一路”倡议歪曲为一种殖民扩张、重利轻义的霸权形象;彭汪鑫[12]研究得出,英美媒体大都为中国贴上了“独裁”、“人权危机”和“中国威胁论”的模式化标签。
就此类研究的语料来源、内容、方法及结论进一步提炼得出其特点:1.语料来源基本为新闻类语篇,且中国均是敏感新闻事件的当事方或直接参与者;2.政治经济类话题居多,时代相关性较强;3.研究方法各不相同,但在检索搭配的基础上总结语义韵的方法使用较多;4.结论多为西方媒体对中国形象的报道存在负面倾向。
为解决问题2所提出的疑问,下面的研究设计在语料选择时尽可能避开上述总结的特点,而研究方法则采用较为常用的提炼语义韵的方法。研究共分三部分展开,首先对语料选择的原因进行了说明,接着详述了利用“扩展意义单位”提炼语义韵的方法,最后对该中立语料库的检索结果进行分析,看是否在该非新闻类语料库中仍能探寻到西方媒体对我国形象有意歪曲的情况。
为尽量避免上述总结的“基本为新闻类语篇,且中国均是敏感新闻事件的当事方或直接参与者,政治经济类话题居多,时代相关性较强”的特点,经多方对比决定利用www.38north.com网站中的语料,建立“中立语料库”进行分析。该站由约翰·霍普金斯大学国际问题高级研究院美韩研究所运营,主要针对朝鲜社情民意、武器研发、国内外关系进行分析,重点在于朝鲜的大规模杀伤性武器[13]。选用这个网站建库的原因,一是新闻类语篇含量很小且讨论话题不直接涉及中国的政治和经济;二是中国未处于朝核事件的当事方;三是有一定数量的中国形象出现,具备建库分析的基本要求(利用WordSmith 5.0统计词频出现“China”和“Chinese”共3010次)。本小型语料库共有1175481词,包含该网站自2010年创办至今的所有文章,共计738篇,截止时间为2017年9月1日。语料库基本情况见表2。
表2 语料库基本情况
在语料库语言学背景下展开的类似研究所使用的方法以在检索搭配的基础上总结语义韵较多,因此本研究也采用类似方法。为找到一个较合适的切入点进行分析,我们选取“扩展意义单位”模型法进行总结语义韵的具体研究。关于这个模型的优点有人曾进行过论述,如扩展意义单位,集语境、意义、功能、结构、目的于一体,是典型的形式—意义—功能的复合体,是比较全面的语言描述模型[14]。
Sinclair[15]总结了扩展意义单位模型的5个层面,分别是“意核”(core)、“搭配”(collocation)、“类联接”(colligation)、“语义倾向”(semantic preference)及“语义韵”(semantic prosody)。根据批评话语的有关理论,话语的主观性决定任何话语都必须体现意识形态。意义单位模型中其他成分的选择同语义韵密切相连,话语意义的表达有若干种语言形式可供选择,而这一选择又是由意识形态决定的,意识形态往往决定语言的再现形式。因此,通过确定“意核”后观察其搭配、类联接等语言形式,进一步提炼出其语义倾向及语义韵,可以较有效地分析出语料中所含的意识形态。扩展意义单位模型的具体分析方法是:以潜在意核 (即节点词/词组) 为中心,由近及远,逐步扩大观察范围,按照搭配、类联接、语义倾向和语义韵的顺序进行分析,直至语义韵的发现[16]。
由于本研究的目的是分析中国形象的构建,因此确定“China”一词作为潜在的“意核”,拟通过观察其左右搭配及部分类联接的形态来总结这类语言形式的选择中所蕴含的语义倾向,进而分析出该语篇中的语义韵。为达到历时研究的对比效果,将所收集的语料库分为2010—2013年(308篇,543072词)、2014—2017年(430篇,632409词)两个子库。
1.“搭配”情况
利用Ant Conc 3.4.4初步检索后发现“China”一词在2010—2013年和2014—2017年两个子库中的索引行数分别为1001和966,数量占所有出现的国家的第三位(第一为North Korea,第二为United State),出现频率则无较大变化,在每篇1.9~3.89次上下浮动。显著搭配词情况比较复杂,多为功能语类,即限定词、指示代词等,而实义词类有名词、动词以及介词等。受篇幅所限,本研究选取国家/地区这类名词作为出发点进行观察。搭配分布情况见表3(因篇幅原因,仅列排名前10的国家/地区)。
由表3可以看出,参与朝核问题六方会谈的其余五个国家(美、俄、日、朝、韩)均排在搭配词的前五位,可见在朝核问题上中国与这五个国家可能常常作为一个整体出现,也从侧面反映出六方会谈对这一事件的积极推动。而这五个国家中与“China”搭配次数最多的除了朝鲜(287次)外就是俄罗斯(195次),可见在文本中中国和俄罗斯搭配出现的频率最高,这也从某一角度反映了这些文本可能将中国和俄罗斯划入了一个阵营,认为在朝核问题上同为社会主义阵营的两个国家联系更为紧密。值得注意的是中国台湾地区,它和“China”搭配出现的次数也排在了前10位,而共现频数仅为1次。由此可见,在描述时,“Taiwan”这个词并没有被当作“China”的一部分进行整体性表述。此类文本有意或无意间利用这些问题对中国内政进行了无形的干涉,使读者产生了一定的理解偏差。
表3 国家/地区类名词显著搭配词情况表
2.“类联接”情况
在扩展意义单位模型后续层面的分析上,由于索引行数偏多,我们随机从两个子库中抽取了300条索引行进行观察和分析。通过观察,语料中“China”节点词左右两侧的显著类联接特征有连接词“and”(以“China+and+CN”和“CN+and+China”为主)和“China+V”的形式(CN代指国家名词,V为动词)。利用Stanford POS Tagger 1.1将这个语料库标注后,用Power GREP检索观察到的语言形式,下面将分别进行讨论。
(1)“China+and+CN”和“CN+and+China”
语言学家认为,话语的语序映照人的思维顺序。陆云[17]认为“英语倾向于采用心理上和实践上凸显的语序,凸显度高的信息一般位于语序中较前的位置。“and”作为一个并列连词连接两个名词,其在语法意义上往往是代表左右双方的平等关系。表4是“China+and+CN”和“CN+and+China”的检索情况统计。从表4可以看出,“China”在这一类联接的形式中处于凸显位置的次数(278次)要明显多于从属地位(193次)的次数;从时间上可以看出,“China”处于凸显位置的次数逐渐增多,处于从属地位的情况则在相应减少。结合索引行的语义分析来看,这些文本的语义倾向会让读者误认为:随着中国军事实力的不断增强,对朝鲜问题越发想要发出自己的声音,也企图联合别的国家一起在这一事件中发挥作用,而在这一联合的过程中中国显然逐渐占据了主导地位。
表4 “China+and+CN”和“CN+and+China”检索情况统计
(2)“China+V”
在“China+V”这一动词的类联接形式中,中国形象充当主语地位,其更多展现的是中国作为主动方所采取的行动。经观察,其语义情形较为复杂(共检索出216条),且“采取行动”类的动词比“态度表达”类的动词数量多。例如在索引行中较为常见的动词有“control、cause、support、buy、give、impose、execute、froze”等。这一类联接的形态给读者传达出一种错误信息,即中国在朝鲜问题上是有许多实际行动的,直接或间接地影响着朝鲜的局势。
(3)“语义倾向”及“语义韵”
Stubbs[18]曾从功能的角度将语义韵划分为积极、中性和消极三类。积极语义韵是指搭配词大多数具有积极的语义特点,消极语义韵吸引的搭配词几乎都具有鲜明的消极语义特点,而中性语义韵词语呈现出错综的语义特点,既能与具有消极意义的词共同出现,也可以与具有积极意义的词共同出现。结合以上“搭配”及“类联接”两种形式的讨论来看,似乎目前所具有的语义倾向是稍有些负面但偏中性的。
但扩大观察范围后随即会发现,与这些名词或动词形式的搭配及类联接结伴出现的往往是具有较强程度的形容词、情态助动词,例如“China and Russia can easily force;China must do more ignores North Korean strategy”。而在诸如“China provides support to;China reluctant to push;China has threaten”的句式中其宾语位置常是“North Korean,Kim Jong Il”或者是核试验的材料等。以“China…force/ignores/push”为例,检索发现共22处后面直接伴随的是朝鲜这个国家的名称或其元首名字;以“China provides”为例,检索发现共有19处内容为中国提供朝鲜疑似核试验的原材料或可以供核试验使用的工业产品;诸如“强迫、威胁、拒绝、忽视”等动词后面伴随的常常是周边国家的名称或某个群体。结合朝鲜核威胁这个话题来看,显然以上结构所主导语义倾向的消极意义十分明显。显然,这一中国形象的刻画具有很浓烈的西方意识形态,消极态度较为明显。与本研究的结论有些相似,王艳娇[19]在其博士论文中详细讨论过《纽约时报》中涉及朝鲜问题时中国的形象问题:“纽约时报对朝鲜的报道多使用贬义词汇,指责中国在韩朝关系中起决定性的作用,中国是朝鲜的最大同盟和支持者,这样就掩饰了它自己在朝鲜半岛与韩国进行军事演习、干涉别国内政的目的,而且是打着正义使者的旗号。”
本文从目前基于语料库开展国家形象批评话语分析研究的现状出发,提出了对中国国家形象的有意识歪曲是否仅存在于西方新闻类、直接涉华类语篇中的疑问。为解决该疑问,首先对国内相关研究的语料性质、研究方法及结论等进行了分析,总结了目前研究所具有的四类特点,建立了一个“中立语料库”,以朝核问题下中国形象的建构为例对此进行了探索。从“China”与国家/地区这类名词的搭配、“China+and+CN”和“CN+and+China”、“China+V”类联接及语义倾向分析的基础上提炼了该语料库中对中国形象所含有的消极语义韵。这一消极语义韵的发现在某些程度上说明了在非新闻类、非直接涉华类语料中,西方媒体仍具有强烈的意识形态并在消极地构建中国形象。由此可见,西方媒体对中国形象的不客观构建不仅存在于新闻等常见的语篇中,在非新闻语篇中也仍可见其端倪。至此,结论对开篇问题已经有了基本的解答,并拓展了基于语料库开展中国形象研究的语料来源。当然,本研究的文本仅来源于一个网站,难免存在局限性,所得出的结论仍然需要在今后得到更多样本综合性研究的论证。
注释:
①f(c)为搭配频数,f(n,c)指节点与搭配词在共文中(±5)的共现频数。