基于中医英语语料库的中医术语英译标准研究

2022-08-24 07:45张喆徐丽闵玲姚秋慧张玥
中国医药导报 2022年20期
关键词:词频词组术语

张喆 徐丽 闵玲 姚秋慧 张玥

山东中医药大学外国语学院,山东济南 250355

一带一路,语言先行;中医中药,术语先行[1]。中医术语英译标准化是中医药国际化的基础性工作,对中医药国际交流具有重要作用。自1991 年世界卫生组织发布《针灸经穴名称国际标准化方案》以来,各国政府和学术机构相继制定了自己的术语标准[2],其中当前应用最广泛、最具影响力的有两大标准:2007 年12月世界中医药学会联合会颁布的《中医基本名词术语中英对照国际标准》(International Standard Chinese-English Basic Nomenclature of Chinese Medicine,ISNTCM)和2007 年10 月世界卫生组织颁布的《WHO 西太区传统医学名词术语国际标准》(WHO International Standard Terminologies on Traditional Medicine in the Western Pacific Region,ISTTM)。两大标准在基本思路、方法程序等宏观方面基本一致,但由于翻译主体和中文词条选择等方面的差异,在对部分概念的理解运用等微观层面仍存在许多不确定性[3]。

当前对两大标准的研究在以下方面:①根据翻译理论对比两大标准的术语分类和翻译策略异同[4-7];②从条目分类、词汇语法等方面出发,指出两大标准存在的问题[1,8-9];③提出术语国际化标准建设的建议,呼吁从国家战略角度进行国际推广[10];④术语分层构建的设想[11-12]。以上研究聚焦于理论视角,对于优化中医术语英译标准具有重要意义。但是不足之处在于这些研究多是基于研究者自身经验的评判,缺乏统计学数据的支持。鉴于此,本文自建中医SCI 论文语料库,检测两大标准在论文中的使用情况,以实证研究对理论研究进行检验补充。

1 资料与方法

1.1 一般资料

两大标准原始资料:收集ISNTCM 和ISTTM 的官方版本。ISNTCM 由人民卫生出版社出版,ISTTM 从世界卫生组织官网下载(https://apps.who.int/iris/handle/10665/206952)。

语料库原始语料:语料收集遵循如下纳入原则,①SCI 论文。SCI 论文以英语撰写,学术水平相对较高,语言规范标准,可以较好地反映中医术语英译的实际使用情况。②研究内容为中医病案和中医理论。很多中医药SCI 论文为实验研究和临床研究,涉及的中医术语较少,因此不予纳入。基于以上原则,收集《中医杂志》英文版与《美洲中国医学杂志》从创刊到2019 年9 月所发表的论文。经过筛选纳入202 篇文献。

1.2 研究方法

两大标准处理方法:首先将两大标准文件转换为Excel 文件。删除两者不对应的内容,最终获得的比较资料为ISNTCM 收录的中医术语英译(不包括方剂、腧穴和中药)与ISTTM 收录的中医术语英译(不包括古籍名称)。将ISNTCM 与ISTTM 的术语导入到同一个Excel 表格中,使用“开始”菜单中的“条件格式”进行比较,列出不同的词组。然后,将两大标准转换为TXT 文件,导入AntConc(3.4.3w),加载lemma list 与stop list,产生ISNTCM 和ISTTM 词汇表(wordlist),然后将其导入Excel 表格,比较两者不同的单词。

语料库建库方法:将收集的论文转换为TXT 格式,对文本降噪后上传至Sketch Engine(https://www.sketchengine.eu/)。之所以采用Sketch Engine,是因为本研究需要参照语料库以提取关键词表(keyword list),常用的WordSmith Tools 和免费的AntConc 都无法调用参照语料库,Sketch Engine 内置了多个语料库可作为参照语料库。由此建成了中医SCI 论文语料库。

1.3 统计学方法

在语料库Sketch Engine 中,使用其内置的χ2计算工具,计算χ2值。χ2值为语料库中的词组与单词的积分值。

2 结果

2.1 语料库关键词

在中医SCI 论文语料库中,类符为22 913 个,形符为362 675 个。在Sketch Engine 中,以英国国家语料库为参考语料库,得出关键词表。关键词表为单词和词组,其中积分位于前5 名的高频词组:blood stasis,Chinese medicine,traditional Chinese medicine,large intestine,western medicine。积分位于前5 名的单词为Radix,TCM,Rhizoma,Fructus,qi。

2.2 ISNTCM 和ISTTM 的比较结果

在Excel 文件中比较ISNTCM 和ISTTM 不同的词组,结果如下:ISNTCM 含有词组4336 个,其中特有词组为3648 个;ISTTM 含有词组3117 个,其中特有词组为2249 个。两者共有的词组为869 个,共有词组偏少,不同词组居多。

经过AntConc(3.4.3w)统计发现ISNTCM 中类符为2585 个,形符为15 351 个,在ISTTM 中类符为1716 个,形符为9232 个。然后将AntConc 产生的词表导入Excel,进行单词比较。结果为ISNTCM 中特有单词为1219 个,ISTTM 特有单词为348 个,两者的共有单词为1366 个,共有单词超过了各自的特有单词,这说明两大标准的核心单词基本一致,但是由于搭配不同导致大量的特有词组。

在Excel 表格中确定并比较两大标准的词表中的特有单词。按照词频从高到低,选取两大标准中前500 位的特有单词。其中ISNTCM 词频前500 位特有单词为71 个,最低词频为5,而ISTTM 词频前500 位特有单词为32 个,最低词频为3,结果见表1~2。

表1 ISTTM 中词频前500 位的特有单词

根据上述特有单词所对应的中文,找到另一标准中所对应的英语词汇,并在已建立的语料库中检索上述词汇出现的词频。ISTTM 来源词所对应的ISNTCM单词与词频见表3,ISNTCM 来源词所对应的ISTTM单词与词频见表4。总之,对于同一中文词汇所对应的英文单词,语料库提示ISNTCM 来源词的词频一般要高于ISTTM。

表3 ISTTM 对比ISNTCM 词汇在语料库中的频数比较

表4 ISTNCM 对比ISTTM 词汇在语料库中的频数比较

3 讨论

中医术语英译标准到底应该遵循何种原则?洪梅等[13]认为中医术语英译标准需要考虑以下7 个因素:对应性、系统性、简洁性、同一性、回译性、民族性、约定俗成,而有的学者认为中医翻译不需要标准[14]。当前对两大标准的研究视角多集中于术语学和语音学,忽略了中医学兼具自然科学和社会科学的双重属性[15]。

结构主义语言学家索绪尔将语言定义为“一种约定俗成的东西,……一种表达观念的符号系统”,“语言是约定俗成的”这一观点在现代语言学界得到了广泛的认同[16]。在中医术语英译标准化的制订过程中,多采用“约定俗成”的翻译原则。中医术语英译标准化既是学术问题,又是实践问题[17]。因此标准的制订要遵循中医学、语言学、翻译学等学科的语言规约性,而且要检验其在中医药国际传播实践中的接受程度。语料库通过量化指标来客观衡量[18-19],可成为中医英译研究的有效手段。如中医术语中的名词“补”,ISNTCM译为tonification,而ISTTM 译为supplementation。从语言学角度看,两者皆有“补充、改善”之义,但是如何确定标准呢?在语料库中检索可见supplementation 的词频为8,而tonification 的词频为23。故可判断ISNTCM的译法在实践中更易接受。对于理论层面不能解决的分歧,语料库方法就成为一种必要的辅助手段。

表2 ISNTCM 中词频前500 位的特有单词

目前已见于报道的中医英语语料库:北京中医药大学“中医药英文报道专门用途小型语料库”[20],湖北中医药大学“中医英语词汇语料库”[21],甘肃中医药大学“经典中医英语译著或核心教材语料库”[22],南阳理工学院的“《伤寒论》双语平行语料库”[23],天津外国语大学的中医典籍中英双语平行语料库[24]等语料库。这些研究主要使用语料库技术进行中医典籍翻译、中医药报道文本研究和中医英语词汇教学等。因此,通过建设中医语料库,纳入真实语料,检验中医术语英译标准在使用实践中的情况,进一步优化已有标准,在未来研究中仍有较大空间。

此外,在本文中也提取了语料库关键词表。从提取结果可以看到关键词表中包含了大量的中医术语。这些高频词组可以用于编写中医术语英文词典,成为制订中医术语英译标准的素材。

本文使用语料库研究法对中医术语英译标准的制订进行了探讨。但由于自建的语料库规模较小,语料选择存在较大偏差,对术语标准的评判存在着不足。例如,研究发现ISNTCM 的频数整体上都高于ISTTM,但这并不能说明前者优于后者,因为频数高低还受到期刊偏好、不同时期、作者母语等因素的影响。后期研究应加大语料库规模,纳入更多的论文、中医英译典籍等真实语料,同时综合考虑期刊来源、年份、作者等因素对中医术语英译的影响,使研究结果更为全面与客观。

猜你喜欢
词频词组术语
基于词频分析法的社区公园归属感营建要素研究
词频,一部隐秘的历史
云存储中支持词频和用户喜好的密文模糊检索
副词和副词词组
以关键词词频法透视《大学图书馆学报》学术研究特色
有感于几个术语的定名与应用
从术语学基本模型的演变看术语学的发展趋势