王铭玉,刘子夜
词频分析与中俄政治文献翻译——以2013-2014年中国政府工作报告俄文版与俄罗斯国情咨文对比为个案
王铭玉,刘子夜
(天津外国语大学,天津300204)
在我国译界,政治文献外译凸显重要。文章以2013-2014年中国政府工作报告俄文版和俄罗斯国情咨文为语料,借助词频统计手段对其进行了量化分析与对比研究,发现俄罗斯国情咨文用词的频率整体略高于中国政府工作报告俄文版用词。文章还探究了词频对比过程中的用词差异现象,从量化角度对我国政治文献汉译俄问题提出了对策性建议。
政治文献;翻译;词频统计;量化分析
1 政治文献的定义
我国的政治文献主要指马克思主义经典著作、党和国家重要文献及领导人著作。马克思主义经典著作包括马克思、恩格斯、列宁和斯大林关于马克思主义的相关著作;党和国家重要文献包括中共中央、全国人大、国务院和全国政协的决议、决定、会议公报、颁发的法律、法规及中央领导人的重要报告、讲话、文稿和国务院新闻办公室发布的白皮书等;领导人 著作指中共中央、国家机构、全国政协主要领导人的著作。
2 词频统计对语言学研究的作用
辛克莱尔(Sinclair,1991:30)任何人在研究一个文本时都需要知道每个不同单词的形式在其中的出现频率”。语言研究者不仅要明确语言中存在哪些单位和结构,更要了解这些单位和结构在语言中的出现频率,在定性研究的基础上进一步回答“有多少”的问题。随着“互联网+”与“大数据”时代的到来,语言学研究开始主动“吸收”包括统计在内的定量研究方法。词频统计是语言学计量研究的基础手段,研究者可籍此确定作者的写作风格,甄别伪作;衡量不同语言的相似度;比较不同时期语言的发展特征等(韦晓琴,1985:82-86)。此外,词频统计在外语教学和词典编纂领域也具有广阔应用前景。总之,词频统计的简约性、解释性、实践性和可验证性(李剑冲,2003:104-105)使其成为语言学研究由定性向定量飞跃的“助推器”。
3 词频对比分析对政治文献翻译的意义
词频对比分析对政治文献翻译具有重要意义。首先,对国外政治文献进行词频统计,可量化国外政治文献的常用词汇,为我国翻译同类政治文献提供词汇参考,使译文更贴近目标语,增强译文可读性;其次,对比不同时期政治文献高频词的变化,可分析特定国家相关政策的变化;再次,对同一领导人的相关著作、讲话进行词频统计,可在词汇方面对领导人的语言特点进行量化分析,有助于译文更准确地再现领导人的语言风格。此外,将词频统计、句长统计、句频统计、标点统计综合运用,能为政治文献翻译实践和评价提供多方位、立体化的参考标准。
1 研究对象
中国政府工作报告俄文版(Докладо Работе Правительства)与俄罗斯国情咨文(Отчёт Правительства о результатах работы)每年由中、俄两国中央政府发布,以2013-2014年发布的中国政府工作报告俄文版和俄罗斯国情咨文为对象,对其进行词频对比研究。
2 研究方法
2.1 确立对比标准
中俄在地缘环境、历史传统、意识形态等方面存在巨大差异,不能直接对比两国政治文献的用词。本文以《俄语国家语料库》(Национальный корпус русского языка)提供的词频表为“中介”,将中国政府工作报告俄文版和俄罗斯国情咨文的词频统计结果与词频表比对,从而间接对比、分析中国政府工作报告俄文版和俄罗斯国情咨文的词频差异。
2.2 控制变量
控制变量是比较研究的前提。影响词频统计的因素主要有:文本创作时间、字数、体裁和内容。本研究的主要对象是政治文献,故在体裁上首先得到了控制。下面确定的是其余3个变量:文本创作时间、字数和内容。
(1)控制发布时间。十二届全国人大一次会议、二次会议政府工作报告俄文版分别发布于2013年3月19日和2014年3月18日;2012-2013年俄罗斯国情咨文分别发布于2013年4月17日和2014年4月22日。两国政府工作报告的发布时间相差约1个月,对语言的影响忽略不计。
(2)控制内容。内容上,两国政府工作报告同属一个领域;语体上,两国政府工作报告均属政论语体。
(3)控制字数。十二届全国人大一次会议、二次会议政府工作报告俄文版共用俄语词21 671个(包括标点、数字),含6 271个单词及变形;2012年和2013年俄罗斯国情咨文共用俄语词20 655个(包括标点、数字),含5 749个单词及变形。为控制词量,笔者从中国政府工作报告俄文版和俄罗斯国情咨文中分别抽取出现频率最高的5 500个词及其变形进行研究。
3 研究路径
搜集文本→确立标准→控制变量→统计词频→对比结果→挖掘数据
4 统计结果
笔者将《俄语国家语料库》的词频表按频率高低划分出30个频段,起始频段包含10 000个单词及变形,其余各频段包含20 000个单词及变形。将2013- 2014年中国政府工作报告俄文版和俄罗斯国情咨文出现频率最高的5 500个单词及变形与《俄语国家语料库》词频表进行对比,该5 500个单词及变形在词频表不同频段出现的个数、个数差及差值比(差值比=差值/5 500)如下:
表1 中国政府工作报告和俄罗斯国情咨文单词出现个数、个数差及差值比
续表
频段俄国中国差值差值比频段俄国中国差值差值比 90 001-110 0004 6824 3663165.75%390 001-410 0005 2825 1191632.96% 110 001-130 0004 7894 5092805.09%410 001-430 0005 2945 1281663.02% 130 001-150 0004 8754 6002755.00%430 001-450 0005 3035 1441592.89% 150 001-170 0004 9474 6962514.56%450 001-470 0005 3135 1561572.85% 170 001-190 0004 9984 7492494.53%470 001-490 0005 3215 1691522.76% 190 001-210 0005 0454 7992464.47%490 001-510 0005 3295 1791502.73% 210 001-230 0005 0854 8702153.91%510 001-530 0005 3385 1871512.75% 230 001-250 0005 1184 9182003.64%530 001-550 0005 3485 2091392.53% 250 001-270 0005 1414 9521893.44%550 001-570 0005 3525 2131392.53% 270 001-290 0005 1654 9901753.18%570 001-590 0005 3615 2211402.55%
如上表所示,在这30个频段中,中国政府工作报告俄文版的词汇出现量均少于俄罗斯国情咨文。在最常用的30 000个俄语词中,中国政府工作报告俄文版与俄罗斯国情咨文的单词出现量相差436个,约占总词数的7.93%。在最常用的370 000个俄语词中,两国政府报告用词量的差距缩小至3%。如统计范围扩大到最常用的590 000个俄语词,则囊括我国政府工作报告俄文版中的5 221个单词和俄罗斯国情咨文中的5 361个单词。持续扩大统计范围,两国政府工作报告用词量的差距趋于0。
综上所述,俄罗斯国情咨文用词的频率整体略高于中国政府工作报告俄文版用词。
分析两国政府工作报告的词频统计结果,有两类现象值得关注与研究:(1)一些单词在一国政府工作报告中反复被使用,但未出现在另一国政府工作报告中;(2)相同含义在两国政府工作报告中的表述方法不同。笔者运用数据挖掘技术在众多差异性结果中,根据差异大小挑选出以下8个例子进行论述。
1 конечно(当然)和безусловно(毫无疑问)
конечно和безусловно是常见俄语词,在2013- 2014年俄罗斯国情咨文中分别出现了84次和3次,但在同年中国政府工作报告俄文版中两词均未出现。конечно作为插入语或语气词时可译为“当然,自然,无疑”;безусловно作插入语或副词时可译为“毫无疑问,当然”(大俄汉词典,2001:84)。但在我国2013- 2014年政府工作报告汉语版中,根本未使用副词“当然”、“自然”、“无疑”。因此,政府工作报告俄文版中未出现конечно和безусловно不足为奇。该现象是由两国政治话语体系不同所致,我国政府工作报告要体现“政治自信”,要从语气上表明“准确无误”,一切“似是而非”和“含糊”情况均要坚决避免。
2 относительно(相对地)
在2013-2014年中国政府工作报告俄文版中,относительно使用了19次,但在同年俄罗斯国情咨文中,该词未出现。中国政府工作报告俄文版中относительно大多出现于ровное и относительно быстрое развитие或ровный и относительно быстрый рост的组合,合译为“平稳较快发展”或“平稳较快增长”。借助《俄罗斯国家语料库》和Google Ngram Viewer数据库,俄语中并无ровное и относительно быстрое развитие或ровный и относительно быстрый рост的说法,但这不意味着我国政府工作报告俄文版中不能出现这样的翻译。“平稳较快发展”或“平稳较快增长”是我国政治文献独具中国特色的表述方式。从使用频率上看,选用относительно翻译“平稳较快发展”或“平稳较快增长”中的“较”字最合适。俄语中,除относительно外,还有3个副词能表达“相对”含义:сравнительно、условно和релятивно,它们的使用频率见图1:
图1 относительно,сравнительно,условно,релятивно使用频率
其中,относительно的使用频率最高,релятивно的使用频率最低。在2013-2014年中国政府工作报告俄文版中,сравнительно,условно和релятивно均未出现,即表达“相对”含义时首选单词относительно,这符合俄语语言习惯,也最易被俄罗斯读者接受。
3 примерно(大约)
примерно在2013-2014年中国政府工作报告俄文版中常与数字连用,表达概数含义,共出现14次。同年俄罗斯国情咨文则选用почти,около或приблизительно表达概数含义。почти和около的使用频率明显高于примерно和приблизительно(见图2)。但在中国政府工作报告俄文版中,почти出现0次,около出现4次,приблизительно出现2次,明显少于примерно的出现次数。除приблизительно更书面化外,почти、около和примерно在书面语及口语中皆可使用,加之这4个词在用法上并无明显差别,鉴于此,建议中国政府工作报告俄文版在翻译概数意义时,可相对增加почти和около的使用频度。
图2 почти,около,примерно,приблизительно使用频率
4 медстрахование(医保)和медицинское страхование(医疗保险)
медстрахование是词组медицинское страхование的缩略形式,медстрахование更倾向于译成“医保”,而медицинское страхование的翻译则更倾向于“医疗保险”。在2013-2014年中国政府工作报告俄文版中,二者往往混用,各出现5次,在同年俄罗斯国情咨文中,медицинское страхование和медстрахование分别出现了1次和0次。俄语中медицинское страхование的使用频率远高于медстрахование(见图3):
图3 медстрахование和медицинскоестрахование使用频率
与此类似的还有соцстрахование(社会保险)、экостроительство(生态建设)、экоохрана(生态保护)等“音节型”缩略语,它们由一个单词的词首和另一个完整单词组成,这类“音节型”缩略语的绝对数量虽未超过“首字母型”缩略语,但近年来呈上升趋势。所以,翻译中国政治文献中的特定词汇时,是优先选用“音节型”缩略语还是全称尚有待商榷。
5 еще和ещё(还)
2013-2014年俄罗斯国情咨文中共有488个单词包含字母ё,中国政府工作报告俄文版中ё的使用次数却为0。虽然《俄语正字法和标点符号使用规则》没有规定政治文献必须使用ё(刘昶君,2012:29-31),但鉴于2013-2014年俄罗斯国情咨文中未采用е取代ё,建议中国政府工作报告俄文版保留字母ё的使用,进一步缩小与俄罗斯国情咨文的用词差异。
6 притом(况且)
单词притом属于连词,可译为“况且”、“并且”、“同时”(大俄汉词典,2001:1784)。在2013-2014年中国政府工作报告俄文版中,该词共出现28次,主要起连接作用,有时并无对应汉语译文。然而,该词在2013-2014年俄罗斯国情咨文中未出现。《俄语国家语料库》统计显示,1823-1882年,притом的使用频率较高,但1882年起,该词的使用频率逐年下降,2000年时其使用频率达到历史新低,见图4:
因此,建议中国政府工作报告俄文版减少притом的使用量。
7 автомобиль和автомашина(汽车)
单词автомобиль和автомашина均可译为“汽车”(大俄汉词典,2001:9),但二者的使用频率并不一致。《俄语国家语料库》统计显示,автомобиль的使用频率远高于автомашина的使用频率,见图5:
在2013年俄罗斯国情咨文中,автомобиль及其变形共出现了3次,автомашина未出现。在2014年俄罗斯国情咨文中,автомобиль和автомашина均未出现。可见,在2013-2014年俄罗斯国情咨文中,автомобиль的出现频率高于автомашина的出现频率,与《俄语国家语料库》的统计结果相符。在2013-2014年中国政府工作报告俄文版中,автомашина及其变形出现了7次,而автомобиль仅出现1次。显然,2013年和2014年中国政府工作报告俄文版中,автомашина的出现频率远高于автомобиль的出现频率,与《俄语国家语料库》的统计结果相悖。建议中国政府工作报告俄文版用автомобиль替代автомашина,尽量减少автомашина的使用次数。
8 либо和или(或者)
либо作连词使用时可译为“或”、“或者”(大俄汉词典,2001:917),与или同义。然而,или的使用频率远高于либо的使用频率,见图6。
图6 или和либо使用频率
在2013-2014年俄罗斯国情咨文中,или共出现19次,либо作为不定代词出现在каких-либо结构中仅1次,即在2013-2014年俄罗斯国情咨文中,или的使用频率远高于либо,与《俄语国家语料库》的统计结果相符。在2013-2014年中国政府工作报告俄文版中,или的使用频率反而低于либо的使用频率,или仅出现1次,либо却出现了16次,与《俄语国家语料库》的统计结果相悖。为使или和либо的出现频率与《俄语国家语料库》的统计结果相符,建议中国政府工作报告俄文版使用или替代либо,表达“或者”含义。
综上所述,2013-2014年俄罗斯国情咨文用词的频率整体略高于中国政府工作报告俄文版用词,建议中国政府工作报告俄文版增加《俄语国家语料库》词频表中最常用30 000俄语词及其变形的使用量。具体来说,建议中国政府工作报告俄文版增加почти和около的使用频度,减少притом的使用次数,用автомобиль代替автомашина,用или而非либо表达“或者”含义并保留字母ё的使用。至于在翻译特定词汇时,优先选用“音节型”缩略语还是全称尚有待商榷。
比较中国政府工作报告俄文版和俄罗斯国情咨文中最常用30000俄语词及其变形的使用量是本课题的阶段性研究成果。高频词的使用很大程度上决定了译文与目的语的接近度,高频词翻译是政治文献翻译的基础。
[1] Плунгян, В. А, Сичинава, Д. В. Национальный корпус русского языка: опыт создания корпуса текстов современного русского языка[A]. ЛН Беляева и др.[C]. 2004: 216-238.
[2] Sinclair,J. 1991.[M]. New York: Oxford University Press.
[3] 李剑冲. 2003. 语言学研究中的统计方法[J]. 内蒙古统计, (5): 104-105 .
[4] 刘昶君. 2012. 俄语字母ё趣议[J]. 俄语学习, (4): 29-31 .
[5] 秦颖. 2015. 翻译质量自动评价研究综述[J]. 计算机应用研究, (2): 326-329, 335.
[6] 唐家渝, 刘知远, 孙茂松. 2013. 文本可视化研究综述[J]. 计算机辅助设计与图形学学报, (3): 273-285.
[7] 韦晓琴. 1985. 现代语言科学研究的有效手段—统计法——读查理·缪莱的《语言统计学方法入门》[J]. 法国研究, (1): 82-86.
(责任编辑:吕红周)
“中央文献翻译研究”专栏
主持人语(王铭玉):
翻译研究要关注现实的重大问题,要走出象牙塔,发挥翻译活动在现实政治经济文化生活中的作用,认识翻译在多元文化语境下的使命。包括中央文献在内的外宣翻译研究是近年来在国内新兴的翻译研究方向,并且是具有中国特色的汉译外翻译研究。本专栏的开设是和我国翻译研究的发展趋势相吻合的,也是和天津外国语大学的特色研究相吻合的。中央文献外译作为我国对外宣传的重要文献资料,主要是指党和国家领导人的讲话与著述、党和政府的文件与工作报告、报刊社论等,它直接牵涉到国内外的重大问题和国家、民族的政治立场和观点。这里选取的三篇文章较有代表性,分别从宏观、中观、微观角度来探索中央文献对外翻译的问题:李多和康喆文的《中央文献研究现状的文献计量分析(1957-2015)》一文应用文献计量分析的方法,从宏观角度扫描了58年来中国知网(CNKI)上关于中央文献研究的期刊文章、硕博士论文在研究对象、研究视角等方面情况,分析了研究层面上存在的问题,并针对这些问题提出了相应的思考,具有重要的参考价值;王铭玉和刘子夜的《词频分析与中-俄政治文献翻译》一文以2013-2014年中国政府工作报告俄文版和俄罗斯国情咨文为语料,借助词频统计手段对其进行了量化分析,并提取了8个典型常用词作为比对词汇来研究两种语言在同类文献中的用词差异现象,对我国政治文献汉译俄问题具有不可忽视的启示意义;姜雅明和李梦雅的《中央文献俄译文本语句结构特征探析》一文也选取了政府工作报告俄译本为例,但探讨的却是传统句法在文献翻译中的体现问题,涉及了谓语表达方式、主客体关系、句际逻辑关系、常用固定句型等方面,得出了俄文译本的语句结构特征及政论文本的性质特点,为语法研究与翻译研究的融合提供了有益的范例。
H35
A
1008-665X(2016)3-0001-06
2016-01-04;
2016-02-23
国家社会科学基金重点项目“中央文献术语外译词典(中英、中俄、中日)编纂的理论与应用研究”(14AYY003);天津市教委2012年度社科重大项目“中央文献对外翻译与传播创新研究”(2012ZD040)
王铭玉,男,教授,博士,博导,研究方向:语言符号学、普通语言学、外语教学论 刘子夜,男,硕士生,研究方向:语料库语言学