牛桂玲,栗慧敏
(郑州大学 外国语与国际关系学院,河南 郑州 450001)
《政府工作报告》英译本(以下简称《报告》)与美国《国情咨文》(以下简称《咨文》)具有相似的文本属性和政治功能。比较二者的文体风格,分析特定文体特征对外宣效果的影响,对于政治文献的有效传播和国家形象的建构具有重要意义。二者均成文于正式场合,既具有书面语的特征,又基于与受众互动的发表方式,呈现出口语体的特质。因此,准确判断二者的文体风格并不能一蹴而就。
Leech和Short认为,文体是特定人物在特定语境下有目的地使用语言的方式。[1](P9)一般情况下,文体分析涉及词汇、语法、修辞、连贯与语境四大范畴。由于语义范畴可通过其他范畴实现,故不单独列出。[1](P61)而计量文体特征则是基于量化技术手段测算和描述某类文本词汇和句法层面的总体特征。
已有研究重点关注中美政府工作报告在高频词、主题词及搭配等方面的差异。[2-4]少有学者运用统计学方法,从宏观层面分析《报告》英译本的计量文体特征,并将其运用到外宣效果的研究中。目前,计量文体特征多被用于判定文学作品著作权、作者身份和文学翻译作品文体风格。[5-8]而借鉴统计量化法研究实用文体,可帮助研究者更系统、客观地把握其文体风格。[9]
有鉴于此,本文运用语料库及统计学工具对比分析《报告》和《咨文》的文体特征及其对外宣效果的影响。本文将尝试解决以下问题:(1)哪些文体特征可作为判断《报告》和《咨文》文体风格差异的标准?(2)系统聚类能否显著区分《报告》和《咨文》的文体风格?(3)文体特征的差异分析对于提升中国政治文本的外宣效果有何启示?
由于《咨文》篇幅较短,本文选取2014—2019年的《咨文》和2018—2019年的《报告》作为语料,并自建两个容量相当的可比语料库。为精确统计文本特征值,将清洗加工后的每个语料库划分为11个样本,总计22个样本。每个样本词数介于2 866~3 024之间,以保证语义的完整性(见表1)。
表1 22个样本基本信息
将清洗后的语料通过在线标注软件Free CLAWS web tagger进行赋码。为进一步提升标注准确率,本文参考《语料库应用教程》中的CLAWS赋码集,[10](P228-231)对赋码文本进行人工校对,然后将赋码后的22个样本保存备用。
基于特定研究目的,研究者对文体特征的选取呈现出一定差异。相关研究多以Leech和Short提出的词汇、语法、修辞格、语境与连贯作为重要参考。[1](P61)综合以上观点和已有研究对两类文本体裁特征的判断,[2-3]本文初步将以下16个文体特征确定为研究变量:型例比、标准型例比、平均词长、平均句长、句子数、副词比例、数词比例、限定词比例、名词比例、动词比例、被动语态比例、形容词比例、代词比例、介词比例、情态动词比例和连词比例。
本研究筛选文体特征变量的方法是独立样本T检验,即检验《报告》和《咨文》这两组样本的均值是否具有显著性差异。在验证两组数据符合正态分布之后,运用Antconc3.2.4w和Wordsmith 6检索每个样本的文体特征值,将统计好的16个文体特征值与样本标号分别导入SPSSv21中,依次做独立样本T检验。在16个预设变量中,12个计量文体特征的独立样本T检验显著性均低于0.05(见表2)。且除型例比、句子数和连词比例之外,其他9个变量的显著性均为0.000,说明两组样本在这12个变量上呈现出显著性差异。
表2 12个计量文体特征的独立样本T检验结果
为进一步验证12个文体特征值区分两类文本的有效性,可对所有样本做系统聚类分析。该方法是先将所有n个变量看成不同的n类,然后将性质最接近的两类合并为一类;再从这n-1类中找到最接近的两类加以合并,以此类推,直到所有的变量分为几类。[11](P172)系统聚类能够有效识别变量间的异质性,并以此为依据将一批样品区别开来。据此,本文以22个样本为聚类对象,以筛选出的12个文体特征值为聚类依据,探索系统聚类能否有效区分两类文本的文体风格。图1是聚类结果。树状图清晰地展示了21个聚类过程中每次类别聚合的过程,最终将22个样本分为2个类别:样本12-22(《咨文》)聚为一类,而1-11(《报告》)则为另一类。聚类结果证实,以上12个文体特征可作为区分两类文本的重要标准。此外,树状图的纵轴表示不同类别间的距离。由图1可知,《咨文》样本间的距离为0-15,《报告》样本间的距离为0-10,说明与《咨文》相比,《报告》的文体风格更具稳定性、同质性。然而,由于两类别的距离达到了极值25,远远大于同一类别间的差异,辅助验证了系统聚类可明晰地呈现出两类文本的差异,为下文的文体特征分析提供了客观依据。
系统聚类从宏观角度展示了两类文本具有显著性差异。为探索文体风格的微观差异,还需了解哪些文体特征最能区分两类文本以及具体差异表现。表3为两文本的描述性统计结果以及12个文体特征值均值差异百分比。该表显示,《报告》在平均词长、平均句长、名词比例、介词比例、被动语态比例、连词比例、形容词比例这7个特征值上均高于《咨文》,而《咨文》仅在型例比、副词比例、句子数、限定词比例以及代词比例上大于《报告》。同时,两类文本在被动语态上的差异最为显著,即被动语态比例最能区分两类文本,其次是限定词比例、代词比例、形容词比例等。
表3 12个计量文体特征值的对比描述性统计结果
为探究两文本文体差异的微观表现以及形成既定差异的原因,需要对上文中12个文体特征作详细的定性分析。结合被筛选出的文体特征属性,本文将筛选出的12个有效变量细分为两类:衡量句子难度的变量和衡量词汇丰富度的变量。将区分句子难度的变量确定为平均句长、句子数、平均词长和被动语态;词汇丰富度变量为型例比和上文中的7种词类分布。
1.句子难度
在容量相当的样本中,平均句长与句子数成反比。根据表3,样本中《报告》的平均句长均值比《咨文》多5.9727,而句子数却少39.9091,两者形成巨大反差,说明《报告》的长难句数量较多。平均词长也是衡量句子难度的重要指标。由于《报告》的句子数更少,且平均词长更长,也说明了《报告》句子难度高于《咨文》。
被动语态作为一种相对复杂的语法结构,极少出现在口语体中,可作为区分书面语和口语的一个重要指标。表3显示,《报告》的被动语态比例高于《咨文》,表明前者语法结构较为复杂,表达更加正式。
综上所述,《报告》词汇句法难度相对更大,文体风格更加严谨、正式,具有典型的书面语体特征。据此,可初步判断其文本可读性低于《咨文》。
2.词汇丰富度
为进一步验证上述推测的合理性,还需分析型例比和具体的词类分布。型例比是类符与形符之比,它能够反映文本的用词丰富度与用词变化。型例比越大,文本的词汇丰富度越高。从表3两类文本的型例比均值来看,《咨文》高于《报告》,说明其用词更加丰富,变化更多,而这一结论与聚类分析中《报告》文体风格的稳定性、一致性相佐证。虽然标准型例比在衡量词汇丰富度方面更加可靠,但考虑到本文的语料库容量相对较小,而独立样本T检验中型例比的显著性小于0.05,因此,此变量对于区分两类文本词汇丰富度仍具有重要意义。
关于词类分布,《报告》中的名词、形容词、介词、连词比例均高于《咨文》。名词、形容词属于实词,其比例越高,说明文本承载的新信息量越大,从而增加文本阅读难度;介词和连词为虚词,同时二者也充当功能词,说明《报告》中功能词和小句较多,句式相对丰富、复杂。
相较而言,《咨文》中的限定词、代词、副词比例高于《报告》。两类文本的限定词频数(《咨文》1 369词,《报告》554词)、用法差异悬殊,较为复杂。为探索该变量对文体风格的影响,在两文本中分别选取频数排名前十的限定词进行对比(见表4)。每类文本有12个高频限定词,它们的种类相差无几,且有10个限定词完全相同。语义上,this,that,these,those被称为指示限定词,它们可以通过“与言者的‘现在’或‘这里’为参照点”,说明中心词所指“物”与“言者”的指示关系,或通过“属有关系”来回答“是此非彼”的问题。[12](P14)《咨文》中指示限定词的频数比例均高于《报告》,说明《咨文》更倾向于以“现在”或“这里”作为参照点,阐明说话者与所言之物的指示关系,或通过所属关系来明确事物的归属性。这可能与说话者实时演讲,试图用亲近真切的语言与观众共情有所关联,这一假设也基本符合总统演讲的物理环境和心理状态;some,many,much,more等被定义为数量限定词,表达非确切的数量。[12](P16)《咨文》中many,some的频数比例高于《报告》。同时,检索发现,《咨文》中的高频限定词much未出现在《报告》中。虽然more在《报告》中的频数比例高于《咨文》,但more是many和much的比较级,可将some,many,much,more四者频数相加,观察它们在两类文本中的分布情况。四者在《咨文》中的频数及其百分比均高于《报告》,说明《咨文》对内容精确度的要求相对较低,符合口头演讲的特征;在限定词总频数相差悬殊的情况下,《报告》中all的频数和比例都高于《咨文》,表明《报告》强调诸如“全体、全部、都、所有”等集体概念,传递出解决一切问题的坚定信念和不留任何纰漏的严谨态度。
表4 《咨文》和《报告》限定词词表分布对比(取前十位)
《咨文》中代词较多,名词偏少,说明文本承载的新信息量相对较低。总体来看,较高的限定词和代词比重辅助证实:《咨文》具有口语体特征,文本可读性更高。
《咨文》《报告》中副词的频数分别为1 853词、1 025词。表5显示了高频副词数占每类文本副词总数的百分比。由表5可知,《咨文》中时间副词和地点副词的使用频率排在前列,佐证了由限定词得出的结论,即《咨文》带有即兴演讲的色彩。同时,《咨文》副词总量大,但词长较短,语义相对单一。而《报告》中的副词语义丰富,需要结合语境作重点剖析(见下文语义分析)。
表5 《咨文》和《报告》副词词表分布对比(取前十位)
上述分析证实,《报告》正式严谨,词汇句法复杂,具有较强的书面语体特征。而《咨文》信息量较小、且带有即兴演讲的口语体特征,可读性较强,更易被普通民众接受。
3.语义分析
研究文体特征不仅要关注语言形式,如:词类、句法等,还应重视其语义内涵,以更好地判断文本的可读性与外宣效果。《报告》作为政治外宣文献,其高频实义词在很大程度上能够反映国家的方针政策导向,并映射出国家形象。由于《报告》中的名词、形容词和副词具有丰富的语义内涵,且三类词性比例能显著区分两类文本的文体特征,因此,下文将对此三类词做语义差异分析。
通过检索赋码后的文本,发现《报告》中频数不低于10的名词如:development,business,growth,market,innovation,economy,enterprises,consumption,government,services,progress,environment,funds,people,tax,insurance,education,poverty,employment,housing,healthcare,job等,反映了中国关注经济发展、脱贫攻坚等重大难题以及教育、就业、医疗、住房等民生问题。而《咨文》中频数不低于10的名词为America,congress,nation,Americans,people,jobs,tax,economy,world,global,international,party,Republicans,Democrats,democracy,immigration,power,energy,security,trade,allies,border,nuclear,war,terrorists等。《咨文》高频名词显示,美国除关注经济发展和民生问题,还将政党问题、全球共性问题作为焦点,如:移民、能源、安全、贸易战、边界纷争等。
关注焦点的差异与中美两国的国情不无关系。中国当前处于快速发展阶段,面临着可持续发展、产业升级等社会问题和与之相伴的民生问题,而《咨文》高频名词则客观反映了由美国政党制度、移民史和能源配置状况衍生出的一系列问题。
《报告》中频数不低于10的形容词Chinese,economic,financial,stable,strong,full,social,new,major,urban,public,medical,cultural,prosperous,shared,ecological,peaceful,beneficial等,反映了中国经济取得全面、稳定、强势发展,中国寻求新的重大突破,实现城市化和国家富强。同时也显示出中国政府倡导共享、互利、和平的生态发展理念。而《咨文》频数不低于10的形容词American,great,good,strong,fair,safe,best,free,hardworking,brave等,强调了美国强大,勇于担当,崇尚公平自由,努力维护公共安全;但《咨文》中也出现了一些相对高频(频数不低于6)且一定程度上反映美国外交理念的负面含义词,如:illegal,dangerous,terrible,bad,unfair,violent等。放到语境中检索其搭配,发现高频形容词great,good,strong,fair,safe,powerful等倾向于与美国自身搭配,如:
例1 …stepboldlyandbravelyinto the next chapter of thisgreatAmerican adventure,…
例2 So let’s work together,…that will truly make Americasafe.
而dangerous,illegal,unfair,terrible,violent等与周边国家和地区更相关。这说明美国政府认为自身具有强大优势,而其他国家危机重重,对美国有一定威胁。如:
例3 …,so that ifanothercountryplaces anunfairtariffon an American product,we can charge them the exact same tariff…
例4 Year after year,countless Americans are murdered by criminalillegalaliens.
相比中国寻求自我发展和全球互利共赢的形象,美国的官方文件则一定程度上彰显出其优越自负的一面。《报告》高频使用积极性和中性形容词,且总量更多,有利于塑造积极进取、自强求富,谋求共同发展的中国政府形象。
而《咨文》中频数不低于10的副词呈现出对比鲜明的时间差,如:tonight,now,today,recently,ago,just,before,ever,then等,有意强调美国现在与过去相比发生的变化。
相较而言,《报告》中的副词总量少于《咨文》,但蕴含丰富信息。下文展示了《报告》中频数不低于6的副词,可从语义层面将它们分为两类:成果展示类,如fully,steadily,rapidly,consistently,significantly,effectively等,展示了中国经济持续、稳步增长,获得了快速、充分的发展,中国政府的工作成效显著;处事方式类,如prudently,strictly,resolutely,actively,appropriately等,反映了中国政府工作审慎、严谨、恰当,积极作为,有着克服一切难题的决心和意志。
从三类词性的语义内涵来看,《咨文》体现了美国愿肩负使命担当,引领世界各国解决全球共性问题的“国际卫士”形象。而《报告》则较少涉及国际问题,试图构建政府一心为民、努力作为的人民公仆形象,同时彰显了坚持全球互利共赢的人类命运共同体理念。总体而言,两类文本都树立了较为积极的国家形象,外宣效果良好。
本文从宏观和微观角度分析《报告》和《咨文》的文体特征。宏观层面的计量结果表明,系统聚类能够有效区分两者的文体风格。微观层面的句子难度、词汇丰富度和语义分析表明,《报告》更加正式严谨,而《咨文》偏口语化,文本可读性较强。两文本都达到了良好的外宣效果,但为增强《报告》外宣的有效性,译者还应考虑外国受众的文体风格偏好,把握好长短词、长短句、简单句与复杂句的使用比例,增强表达的透明度和文本的可读性,使受众能真切地感受到中国的发展变化、真正领悟中国的政策内涵。