语料库驱动的海昏侯国考古关键词及英文翻译研究*

2022-07-12 02:02张金福温淑萍
九江学院学报(社会科学版) 2022年2期
关键词:昌邑英文翻译青铜

张金福 温淑萍

(九江学院外国语学院 江西九江 332005)

南昌新建区的海昏侯国考古名列2015年度全国十大考古新发现。自2015年以来,学术界从海昏侯国遗址、墓主身份确定、出土文物及文献、墓主所处时代的社会历史文化等方面进行了多维度、多层面探索。笔者以“海昏侯”“刘贺”等为关键词在知网进行检索,截止2020年12月底,共有138篇相关论文发表(仅统计CSSCI期刊和国际英文期刊论文),有10部专(编)著出版。这些研究为我们深入了解汉代政治、经济和文化做出了巨大贡献,但进一步梳理文献发现已有研究存在以下一些问题:一是质性研究较多,基于语料库或大量语料的量化研究寥寥无几;二是出土文物及相关研究文献中的核心概念(即关键词)不统一;三是汉语文献较多,英文文献极少(仅两篇);四是在不多的英文文献(包括汉语论文中的英文标题、摘要和关键词)中已出现较为严重的翻译混乱现象。媒介文化研究经典《关键词》的作者雷蒙德·威廉斯认为“文化和传播的核心就是关键词的传播”[1]。《论语》中也有名不正,则言不顺;言不顺,则事不成;事不成,则礼乐不兴”之说。根据以上分析,我们认为要实现海昏文化“创全国旅游5A景区、国家考古遗址公园、世界文化遗产”的建设目标[2],其关键词的梳理-论证-规范及其英文翻译的准确是目前很紧迫的一项任务。

语料库语言学是语言学科中发展最快的学科之一,是“按照一定的采样标准采集而来的,能够代表一种语言或者某语言的一种变体或文类的电子文本集”[3]。目前,语料库语言学存在两种研究范式:基于语料库和语料库驱动。前者是指通过语料库来验证已有理论和观点,是自上而下的研究范式;而后者是指前期没有理论假设,完全利用语料库通过自下而上的归纳法来进行研究。鉴于目前考古界缺乏大型专题语料库,本文将基于自建的海昏侯国考古语料库,采用语料库驱动范式来考察其关键词及其英文翻译。

一、海昏侯国考古语料库创建

(一)关键词定义

不同学科和国家标准对关键词的定义有些差异,也有文献称之为主题词。《科学技术报告、学位论文和学术论文的编写格式》(GB7713-87)给关键词下的定义是“为了文献标引工作从报告、论文中选取出来用以表示全文主题内容信息款目的单词或术语”。《中国学术期刊(光盘版)检索与评价数据规范》(B/T1-1998)释义关键词“是反映文章最主要内容的术语,对文献检索有重要作用”。《文献主题标引规则》(GB/T3860-2009)认为主题词指“从自然语言中优选出来并经过规范化的、表达各种概念的语词”。鉴于考察目的,本文关键词的工作定义为:语料库驱动的,从专题考古语料库中提取并经过人工筛选优化出来的出土文物及相关研究文献中高相关性的名词及名词词组。

(二)语料的选取

《南昌汉代海昏侯国考古语料库》(以下简称为“《海昏语料库》”)的创建是本研究的基础工程。为方便今后多层次多视角检索考察,将同一文献包含汉英两种语言的文本分开归档整理。汉语语料来自136篇国内发表的CSSCI论文(包括汉语标题、摘要、关键词和正文)和9篇专(编)著正文的汉语部分(共10部,因为一部专著全部用繁体字编辑出版未入库)。英语语料由两篇国际英文期刊论文、两部汉英双语编著的英文部分和部分CSSCI论文的英文标题、摘要、关键词组成。将对应的汉英语料进行加工处理,可构建平行语料子库,以便考察汉语关键词的英文翻译情况。

(三)语料的处理

第一步,从知网下载所需论文;用扫描仪扫描识别专著正文;做好文档分类和命名。用“双字母+3位阿拉伯数字”来命名。其中,“LW”代表论文;“ZJ”代表论文专辑;“ZY”代表摘要(包含题目、摘要和关键词);“ZZ”代表专著。“3位阿拉伯数字”代表顺序号。

第二步,通过“迅捷转换器”批量转换下载论文(PDF)和扫描专著(图片)为word格式;人工校对转换错误,并删除论文和专著每页的眉头、页码、图片、表格、脚注、尾注、致谢词以及文内加注(上标格式)等内容。再采用“Word转换向导”实现“doc及docx批量转换为txt”文件。转换完成之后,为了实现字符编码与各种应用软件的兼容性,采用EmEditor进行了“批量转换为带签名的UTF-8的txt格式”;在编辑工具EmEditor上,借助正则表达式,做文本噪音处理。

中文分词是语料处理的难点。中文分词采用结巴分词引擎(一款非常流行中文开源分词包,具有高性能、准确率、可扩展性等特点,目前主要支持python编程语言,其它编程语言也有对应版本),单词之间采用半角空格。考虑到考古学学术词汇的特殊性,我们通过人工识别等办法对文物名称等进行了标注。

为方便语料的平行提取和对比,以中文原文的章节、段落的划分为基准,对相应的英文文本重新进行段落的划分。即在EditPlus(文本编辑软件)程序下,首先对段落边界进行标记(段首键入

,段尾用

)。然后通过运行文本转换与合成程序,自动将段首标记生成为这种格式(这种标记分别表示该段为中文文本第一篇第一段、英文翻译第一篇第一段)。因为英文语料严重不足,且多为论文题目、摘要和关键词。我们只是做了段落对齐处理。遇到中文文本没有对应英译的段落,在英文文本相应位置键入“

Not translated.

”(即“该段缺英文翻译”)。另外,每一篇(部)的标题也作为一个段落来处理,首尾分别用来标记。通过数据导出和平行文本的合成,汉英对应的语料段落便可在ParaConc(语料库检索工具)等的帮助下自由提取。

(四)检索分析

采用AntConc 3.5检索生成词频表、词串频率表和关键词表。词串频率表生成时参数设置为2词到6词,结果分别保存为:2词的词串.txt,3词的词串.txt,4词的词串.txt,5词的词串.txt,6词的词串.txt。关键词表的生成需要有大型参考语料库。考虑到目前国内外还没有大型的考古专题语料库,我们采用“英国利兹大学2.3亿现代汉语语料库词频表”来代替。汉英平行语料子库通过ParaConc检索分析,以便考察汉语关键词的英文翻译情况。

二、基本概貌

《海昏语料库》共有汉字1116715个,汉语词86万个。高频词(出现频率在100词以上的)有1078个,其中名词305个。2词词组201个(仅统计词频在10次以上并且最低在5篇部文献中出现。下同);3词词组78个;4词词组64个;5词词组40个;6词词组26个。限于篇幅,具体的2-6词词组均省略。检索出海昏侯国考古关键词5028个。其中词频排在前100位的关键词如下(已人工删除功能词和异常词汇,按关键性由高到低排序):

刘贺;海昏侯;霍光;出土;西汉;考古;汉代;皇帝;汉武帝;昌邑;孔子;文化;墓葬;研究;历史;发掘;遗址;南昌;昌邑王;文物;黄金;汉书;问题;身份;武帝;太子;史记;墓园;金饼;列侯;中国;制度;宣帝;政治;昭帝;编钟;朝廷;竹简;海昏;诸侯王;纹饰;文字;郡;文献;建筑;大臣;豫章;汉宣帝;马蹄金;天子;价值;资料;乐器;形制;麟趾金;大将军;宗庙;汉墓;江西;李夫人;皇后;器物;秦汉;国家;夫人;将军;漆器;主人;太守;工艺;古代;地位;祠堂;儿子;诸侯;刘髆;画像;丞相;上书;公元前;铭文;汉昭帝;帝位;音乐;东汉;刘弗陵;张敞;战国;墓主;货币;长安;铜器;论语;权力;博物馆;西周;田妃;贵族;青铜;上官桀。

检索出下列169个出土文物名称关键词:“南昌”豆形青铜灯;“昌邑籍田”三足青铜鼎;“元康”“臣贺”“海昏侯夫人”奏章木牍;“昌邑令印”封泥匣;“刘贺”螭纽玉印;“大刘记印”龟纽玉印;龟纽玉印;“海”字青铜印;玉圭;谷纹玉勒;管形玉握;纽钟形玉琀;夔龙纹玉环;涡纹玉璧;陶瓦当;青铜帐钩;包金丝缕琉璃席;饼金;“刘充国印”龟纽银印;“昌邑食官”青铜鋗;平底青铜盆;“昌邑”豆形青铜灯;环首铁刀;铁剑;“中”字褭蹏金;兽面铺首三足玉樽;龙凤纹韘形玉佩;绞丝纹玉环;凤首玉觿;螭纹玉剑璏;凤鸟纹玉璧;贝形玛瑙饰;玛瑙带钩;方格纹硬陶罐;方格纹陶簋;方格纹陶鼎;青铜镯;偶乐车;乳丁纹青铜钲;青铜錞于;山羊纹银当卢;错金神兽纹青铜当卢;鎏金凤鸟纹青铜当卢;青铜马衔、马镳;乳丁纹青铜铃;鎏金青铜牛首饰;鎏金青铜轴饰;错金银兽面纹青铜轴饰;管形青铜辔饰;鎏金青铜车轭饰;鎏金龙首青铜车辕饰;鎏金兽首青铜车辕饰;错金银凤鸟纹青铜衡末饰;鎏金青铜车軎;鎏金青铜辖軎方策;鎏金青铜车轙;鎏金花瓣形青铜盖弓帽;鎏金青铜承弓器;凸棱圜底青铜釜;镶玉青铜嵌饰;青铜蒸煮器;鎏金三足带盖青铜鼎;蹄足环耳青铜温鼎;镂空方形鼎式青铜染炉;凸棱高圈足青铜簋;兽面铺首衔环耳青铜钫;青铜樽;长柄青铜勺;鎏金提梁带盖青铜鋞;带盖青铜鐎;铺首衔环耳青铜锤;鎏金长颈青铜壶;鎏金带盖青铜壶;青瓷双系敞口壶;双系青铜鋗;青铜匜;青铜箕;筒形青铜漏;兽形青铜镇;鎏金镶玉石龟形青铜镇;人形青铜镇;青铜行灯;“李姬家”豆形青铜灯;青铜缸灯;五连枝青铜灯;雁鱼青铜灯;鎏金青铜博山炉;镂空云龙纹青铜熏炉;鎏金龙纹青铜编纽钟;青铜编甬钟;鎏金龙纹青铜甬钟;蟠虺纹青铜甬钟;鎏金青铜钩;鎏金青铜钉;鎏金龙纹青铜甬钟套头;鎏金龙纹青铜编磬套头;鎏金龙纹青铜纽钟套头;鎏金神兽形青铜虡;漆琴;“昌邑七年”漆瑟及瑟禁;老翁漆木俑;老人俑;流云纹漆案;云龙纹漆盘;“李具”漆耳杯;凤鸟纹玉耳杯;木签牌;银釦三子漆奁;多子漆奁;釦银贴金人物动物纹漆笥;贴金嵌宝石青铜镜;“清白”铭文青铜镜;龙凤纹韘形玉佩;玉组佩;六棱柱水晶珠;多面体水晶饰;辟邪形琥珀饰;玛瑙珠;管形玛瑙珠;漆盒;螭纹玉带钩;螭纹龙首玉带钩;嵌宝石青铜带钩;青铜带钩;战国圆首青铜剑;螭纹玉剑首;谷纹玉剑首;兽面纹青铜剑格;螭纹玉剑格;兽面纹玉剑格;螭纹玉剑璏;谷纹玉剑璏;兽面纹玉剑璏;玉剑璏;素面玛瑙剑璏;玉剑珌;螭纹玉剑珌;鹿形青铜镇;凫形青铜镇;墨书饼金;带符号饼金;褭蹏金;麟趾金;钣金;青铜砝码;青铜权;五铢铜钱;人踏龙形座青铜博山炉;弦纹青铜炉;鸭形青铜哨;动物塑像青铜玩具;西周凤鸟纹青铜提梁卣;战国蟠虺纹十二棱青铜缶;战国蟠虺纹铺首衔环耳青铜壶;青铜臼、杵及龙首纹龙形玉饰;熊形石嵌饰;凤鸟形石饰;双狼噬猪纹石嵌饰;龙形石盖纽;螭虎形石饰;琥珀珠;孔子徒人图漆衣镜;矩形青铜镜;《孝经》竹简;《论语》竹简;《诗经》竹简;《礼记》竹简;《春秋》竹简;《易占》竹简。

三、发现问题

如前所述,我们已通过语料库检索工具从《海昏语料库》中分类提取了大量关键词,发现不少问题。但限于篇幅,不能全部展开讨论。下面仅从《刘贺藏珍:海昏侯国遗址博物馆十大镇馆之宝》中随机抽取4件文物名称关键词做进一步地考察分析,阐释汉语关键词提取及其英文翻译中存在的共性问题。

(一)关于汉语关键词的提取

1.文物的名称不统一

表1中第2栏“刘贺藏珍”是彭明瀚编著的《刘贺藏珍:海昏侯国遗址博物馆十大镇馆之宝》[4]中的文物名称。第3栏是在语料库中检索出的该文物的不同称呼,方括号内的数字表示该关键词在语料库中出现的频次。从表一可以看出,文物“孔子徒人图漆衣镜”和“山羊纹银当卢”均出现6种不同的称呼;褭蹏金和麟趾金共出现7种称呼;“昌邑籍田”青铜鼎出现8中不同称呼。这些同物不同名现象提示我们:考古关键词的提取比较复杂,不能单靠出现频率高低来确定。再就是关键词应有分类,即上位词和下位词之别。如,“铜鼎”上位词应是“可移动文物”,“可移动文物”的上位词应为“文物”,“铜鼎”的下位词应为“大铜鼎”,再下位应是“青铜鼎”,依次类推。文物的名称应为最后一个下位词。那么,这些同指但不同位的词是否都列为关键词呢?这是一个需要深入思考,充分论证的问题。因为在文本中,根据不同的语境,泛指和特指(即上位词和下位词)都有其使用的合理性。

表1 四件镇馆文物名称(关键词)及其英文翻译

2.定名标准意识淡薄

《全国第一次可移动文物普查定名标准》(以下简称为《定名标准》)要求文物的定名应“科学、准确、规范”,做到“观其名而知其貌”。并且明确指出古代文物的定名应有以下三个部分组成:年代、款式或作者;特征、纹饰或颜色;器形或用途。有确切纪年的,要“标示朝代、年号和纪年数字”。该《标准》还规定:名称有铭文、款识的,一般应加引号(青铜器、书法、绘画除外)。南昌汉代海昏侯国遗址博物馆编著的《金色海昏:汉代海昏侯国历史与文化展》[5]对文物“‘昌邑籍田’三足青铜鼎”是这样描述的:

“‘昌邑籍田’三足青铜鼎” Bronze Ding(Cauldron)with Inscriptions of “Land Ploughing in Changyi” 高36.8、口径33.5、腹径45.5厘米;失盖,子口,口微敛,冲式穿带耳,深弧腹,圜底,蹄形三足。鼎腹部有“昌邑籍田铜鼎容十斗重卌八斤”7列15字小篆铭文。此鼎造型规整,字迹清晰,是我国首次发现的西汉诸侯王国“籍田”礼仪的实物资料,也是我国自古重视农业生产、以农为本的例证。

结合以上对该文物的详细描述和《定名标准》要求,我们认为该文物的标准名称应为“西汉昌邑籍田三足青铜鼎”。尽管该文物的称呼出现8种形式,但这种标准的命名法我们在语料库里一例都没有找到。另外,《定名标准》将历史文物分为“金银器”“铜器”“货币”等30类,并且规定“每件文物只选择一种类别范围和一种具体类别。如有交叉,应按性质、功能、质地的顺序进行选择。”据此,“褭蹏金”和“麟趾金”应该属于货币,但语料库检索发现,不少文献将其归为“金器”或“金银器”。这说明文物《定名标准》意识淡薄还普遍存在。据此,也可以推测,在我们语料库检索到的文物名称关键词中,还有许多需要用《定名标准》来检测、论证和规范。

(二)关于汉语关键词的英文翻译

1.英文语料不足

语料库检索得知,汉语语料总字数为1116715个,按词来统计也有86万多。而英文语料总词数为80508词(Tokens),仅占汉语语料的7.21%。完整的英文学术论文仅两篇[6][7];相关编著2部为汉英双语。论文配有英文题目、摘要和关键词翻译的有67篇(其中有15篇并不完整,即有的缺题目的英文翻译,有的缺摘要和关键词的英文翻译),仅占总论文数的48.55%。英文语料的不足也反映出学术界对英文翻译研究的欠缺和外译意识的淡薄。

2.关键词的英文翻译太随意

平行语料子库检索发现对汉语关键词的英译太随意,一词多译、错译、简译、拼写不规范等问题比比皆是。如关键词“海昏侯”语料库中出现以下9种不同的英文翻译:Marquis Haihun; Haihun Marquis; Haihunhou; Hou Hun Hou; HAIHUNHOU; the Haihun Marquis; Marquis of Haihun; China sea faint Hou; Sea faint Hou等。“海昏侯墓”也出现以下9种不同的翻译:Marquis of Haihun’s Tomb; tomb of Marquis of Haihun; Marquis Haihun’s Tomb; Haihunhou Tomb; Haihunhou Han Tomb; Haihun Marquis tomb; Tomb of The Duke of Haihun; the Royal lemetery of Hai hun kingdom; Tomb of the Sea faint Hou等。

表1第4栏是将同一文物的名称及变式名称作为检索词,在汉英平行语料库中找到的英文翻译。其中“孔子徒人图漆衣镜”出现3种不同翻译;“三羊纹银当卢”出现两种翻译;“褭蹏金和麟趾金”出现6种翻译;“‘昌邑籍田’青铜鼎”出现7种翻译。如前所述,平行语料库里的英文语料仅为汉语语料库的7.21%,同一文物名称的英文翻译差异却如此之大,变式却如此之多。细致观察,我们还会发现,英文翻译与汉语名称并不对应,简译现象也很普遍。如,“山羊纹银当卢”的两种翻译都没有把“山羊纹”翻译出来。“孔子徒人图漆衣镜”中的“徒人”没有翻译出来。而对“西汉昌邑籍田三足青铜鼎”的最后一种翻译(Jitian tripod unearthed in Haihunhou cemetery with inscriptions of “bronze Jitian tripod in Changyi containing seven dou and weighing 48 jin, the first”)却增添了许多信息,完全是解释性语言描述,不像文物名称了。并且其中很多信息有误。如,“十斗(ten dou)”此处翻译成了“七斗(seven dou)”;“第二(the second)”翻译成了“第一(the first)”等。语料检索还发现另一种青铜文物“鎏金三足带盖青铜鼎”的英文翻译被简化为“Bronze Ding(Ancient Chinese Cauldron)”(汉语大意是“青铜鼎(中国古代大锅)”),与“西汉昌邑籍田三足青铜鼎”的英文翻译一模一样,导致文物名称的混淆不清,根本达不到《定名标准》所描述的“观其名而知其貌”的效果。

四、建议

(一)高度重视汉语关键词的统一及其英文翻译的规范

南昌汉代海昏侯国考古关键词,特别是文物名称关键词不统一不规范既成事实,寻其原因主要还是标准意识淡薄,外译意识不强,重视程度不够的问题。习近平总书记谈及文物工作时指出民族的复兴既需要“强大的物质力量,也需要强大的精神力量”“各级文物部门要不辱使命,守土尽责,提高素质能力和依法管理水平,广泛动员社会力量参与,努力走出一条符合国情的文物保护利用之路”。各级相关管理部门要统揽全局,系统思维,及时纠正工作中的失误。一是要提高认识。要认识到规范汉语关键词及其英文翻译是对外讲好“海昏故事”的基础。要认识到关键词的确定和翻译是一项复杂而严谨的工作,需要从多方面多视角来考量,需要认真对待。二是要加强相关文物保护和传承方面知识、标准和法律文件的学习。三是要广泛调动社会力量参与文物保护利用工作。

(二)成立海昏侯国考古关键词及其翻译研究专家团队

如前所述,关键词的确定及外文翻译需要从社会学、历史学、语言学、艺术学、符号学、跨文化交际以及翻译学等多学科多层面考量论证,因此,必须有相对稳定的专家团队才行。为了向国际社会解读、阐释当代中国发展理念、发展道路、内外政策、思想文化核心话语,中国外文局、中国翻译研究院和中国翻译协会等单位发起并组建了由中央相关部门专家、多语种外文翻译专家和外籍专家参与的“中国关键词”团队。目前,已对“中国军事”“精准扶贫”“中国精神”“中国梦”“一带一路”等23个专题的近1000个“中国关键词”进行论证诠释及翻译。国家层面的这些做法值得我们借鉴。

(三)建立历时监控语料库,随时了解变化,及时矫正引导

活的语言总是随着政治、经济、社会和文化的发展而不断变化的。海昏侯国遗址考古及其文化价值是一个无尽的宝藏。随着研究工作的不断深入,新成果会不断涌现出来。历时语料库是指收集的语料来自不同时代的语言使用样本或长期连续收集某学科领域的语言使用样本而构成的语料库,它是观察和研究语言变化时常用的方法,并且对历时语料库进行分解可以得到多个共时语料库。[8]汉语关键词的提取及其翻译技巧、策略的研究,应该是基于实在的、大量语料的科学论证分析,是描述性而非规约性的研究。定性分析的结果要得到定量分析的支撑才更有说服力。[9]历时语料库可以随时扑捉这些变化,便于及时采取措施予以规范、引导,有效避免类似汉语关键词及其外文翻译不统一、不规范等诸多问题。

猜你喜欢
昌邑英文翻译青铜
古诗词英文翻译,一起领略中国文化之美
青铜之光
崛起·一场青铜资源掠夺战
怎能说没人知道呢
A Study of the Linguistic Features of O. Henry’s Novels in High School English Teaching
昌邑市不动产登记实现“一窗受理、20分钟办结”
英文摘要
Digest
接受美学理论在陶瓷会展宣传册英译中的应用
昌邑东辛庄铁矿矿坑涌水量预测*