探讨互文性视域下法律语言的机器翻译

2013-04-11 08:51崔爽畅
关键词:互文互文性文本

崔爽畅

(浙江财经大学 外国语学院,浙江 杭州310018)

随着国内外信息化进程的发展,对语言的机器翻译从早期简单的词条翻译起步,增加了词性分析、句法分析、语义分析等功能,自然语言处理能力得以提升,并逐步向更高级的智能翻译进化,涉及的学科领域也更为广泛,其中法律语言作为专门用途的应用性语言,遣词造句具备专业性、严谨性和准确性等行业特点,在程式化的机译领域与一般文学作品相比,拥有自身得天独厚的优势。但是现阶段的机译系统依然是功能简陋,对法律语言的翻译效果远不如人意,往往沦为简单的法律词典,智能化功能无从体现。许多专家逐渐认识到机译问题的症结所在:“首先要解决的是语言问题,而非程序设计问题。任何人如果不在语言上下功夫,而单靠若干程序来做机译系统,肯定是徒劳的。”[1]在机器翻译的智能化道路上,要针对法律语言问题下功夫,亟待互文性理论的介入和指引以优化机译效果。

互文性理论与机器翻译领域有着千丝万缕的内在联系。在互文性理论起源过程中,首先值得一提的是瑞士语言学家索绪尔(Saussure),在其《普通语言学教程》中提到,语言符号是音响形象和概念两方面的结合体,即“能指”和“所指”的结合,两者的联系是任意的、约定俗成的[2]。语词作为符号的功能,不在于表指外在的客观事物,而在于其处在语符系统中的差异性,语符由于与其他语符的组合联系具有含义,且通过与系统中其他语符的异同性产生含义。索绪尔对语言符号的研究,意味着能够通过分析“能指”在语符系统中的异同性来获得抽象的“所指”,换言之,意义在本质上是一个选择的过程,选择即是意义,这就暗示了通过对语符形态的分析来实现智能语义识别的可行性。此后,另一位互文性理论的始祖,苏联的符号学家巴赫金(Bakhtin)提出对话理论,认为要理解言语的含义,不仅需要遵循言语间的关系轴,而且应当放到言语所产生的社会语境中,这修正了索绪尔语言学的共时性,给结构主义语言学增添了历时性分析的内容,给机器翻译亦带来启示。机器要更准确地判断输入话语的含义,仅仅基于自足文本预设的语义分析,往往力不从心,因此必须具备更高层次的语境分析的功能,即把文本以外的其他互文信息也纳入逻辑运算。后来,法国符号学家克里斯蒂娃(Kristeva)综合两者理论,正式创造出“互文性”(intertextuality)这个术语,指出每个文本都是在与其他文本相互参引和指涉的过程中产生,都是对其他文本的吸收和转化[3]。从信息技术的发展历程来看,计算机广泛使用的超文本传输协议(HTTP)、超文本标记语言(HTML)和页面中的超级链接,构建了文本、图片、视频、程序等不同信息资源的相互参引,已经属于克里斯蒂娃互文性理论的初步实现。随着辞典编撰、语料库建设等学术活动的开展,语符系统被归纳整理后导入计算机的数据库,为机译系统进行智能概念分析打下了互文性基础。

互文性理论与法律语言的机器翻译研究亦紧密相关。翻译是一种互文性理解与创造活动,翻译的文本性及其涵盖的共时和历时因素,使“翻译研究与互文性理论在多元化语场中相遇并彼此进入对方视野”[4]。法律语言的机器翻译隶属于翻译范畴,从语言客体到译者主体皆具有显著的互文性特征,这为互文性视域进入其机译研究找到了理论上的契合。法律语言学家巴迪亚(Bhatia)指出:“在所有学科专业文献中,法律语篇中一些典型的互文手段的应用是最广泛的。”[5]国内学者亦指出:“法律文本除具备一般文本的共性特征之外,其实现互文转换的另一基础是中外法律逻辑思维模式的趋同性、法律规则基本构成要素的一致性和立法文本结构的相似性。”[6]法律翻译是对法律语言解构和重新建构的过程,在这个过程中,源语、译者和目的语三者相互指涉,各类文本包括法律文本在内相互参引,不同社会文化背景有机融合,互文性凸显。“译者在此过程中兼具读者、阐释者和作者的三重身份,其主体性的正确发挥,在很大程度上决定着翻译的成败,也是翻译活动的魅力所在。”[7]在机器翻译领域,智能计算机充当了译者角色,身处复杂的多元化语场,互文性理论的参考作用同样适用。

互文性理论自产生以来不断丰富和完善,从克里斯蒂娃的广义的互文性范畴分化出以热奈特(Genette)为典型代表的狭义互文性流派,倾向于对互文性做出精确地界定,使之成为可操作的描述工具,这与机器翻译对语言处理过程实现精确控制的预期目标不谋而合,使互文性理论更加贴近技术层面。关于互文性,热奈特另外采用了一个概念更为宽泛的术语“跨文本性”(transtextuality),并分为狭义化的互文性、副文性、元文性、超文性和承文性五种主要类型[8]。参照热奈特的理论,法律语言可划分为五种互文类别,以供机译系统的模块化分析处理。

第一,法律文本中涉及引用、抄袭、改造、模仿、典故等结构的狭义互文性部分。对这部分内容进行处理时,机译系统通过检索互文信号标志,激活对语料数据库中先期预存文本的分析,给意义选择的函数运算提供语境数据[9]。这里的互文信号标志,是指构成输入文本与预存文本之间指涉关系的所有索引语符。譬如法律语言中表示引用的信号标志有“in accordance with”“in conformity with”“subject to”“pursuant to”“under”“herein”等词语,表示抄袭的信号标志就是雷同部分的语符,表示改造、模仿、典故等其他互文结构的内容也有显性的体现样式,例如在各种起诉状、仲裁书、合同协议等文体中,总是能找到关键词、固定格式等同类文体的仿拟痕迹作为信号标志。学者莱姆克(Lemke)又进一步把互文关系分为语类、主题、结构和功能四个方面[10],据此可以展开基于这四类的子模块运算,强化互文转换过程。在此次级运算过程中,狭义互文性主要体现在目标文本与先期预存文本之间语词和结构样式的关联度上。例如国际贸易合同的翻译,英美法系和大陆法系的合同结构遵循不同的惯例,前者在合同前言部分有“鉴于”和“对价”两大说明条款,后者却往往是把这些条款作为背景条款附加说明,这就要求在机译转换过程中,要针对不同法系惯例来套用格式模板,进行“德里达”式互文增删。诸多含有这些特定语词和结构样式的合同都以训练样本的形式预存在数据库里,机译系统通过N元模型、支持向量机等模型方法统计运算,划分特征空间,把目标语言区分为各种不同地域的法规、合同、判决书、论文、教材等类别,并根据不同语类固有的特性进行翻译转换。

第二,法律标题、前言、插图、注释等副文性内容。副文本具有重要的互文参考性,不过并非所有目标文本都直接包含副文本,有时候仅仅是部分语符片段,需要通过检索互文信号标志才能辗转获得一些副文性信息,机译系统对这部分内容的处理,能附加周边语境参数来辅助意义选择过程,从整体上复核狭义互文性模块的计算结果。例如英美法系的国际贸易合同一般是由标题、前言、条款正文和签章证明四个部分构成,标题往往含有单词“contract”或者“agreement”,前言中有表示签订时间的格式字符,并使用“whereas”和“consideration”来陈述“鉴于”和“对价”条款,证明部分多用“in witness where of”(兹证明)术语,这些携带互文信号标志的副文本释放出强烈的语类讯号,对文本意义选择起着导向作用。像美国大通(CHASE)银行普通存款账户协议D条款中频繁出现的词“maturity CD”,仅从词面本身看,“maturity”既有“成熟”又有“到期”的意思,“CD”可以表示光盘,也可以是其他含义的首字母缩写,机译结果存在各种组合的可能。副文性模块通过对协议的标题等内容所释放的语类讯号进行分析,初步判断为银行合同并获得对应的语境类别码,随即可以为“maturity”选择经济类“到期”的意思,再结合协议中包含的对“CD”的注释“Certificate of Deposit”,可以给“CD”选择银行业高频词“存款证”的意思,接着把所得结果按照一定权重系数和狭义互文性模块中对同等目标文本的意义运算结果进行检验,如有差错就调整语境参数再次检验,这样通过设计惩罚函数不断迭代复核循环,直至机译差错阈值最小化。

第三,相关法律解释、评论、说明、论文等元文性内容。热奈特对元文本的定义是“谈论此文本的其他文本”[11],广义上显然包括用户对输出法律文本雏形的评论,所以元文性模块的互文性功能不仅体现在相关法律翻译、法律论文等元文本对意义的限定和明确上,更主要体现在译文雏形和用户对此的评论文本的联系上,把人机对话也囊括到互文概念中。由于法律翻译是翻译活动中特别的专门领域,除语言功能外还产生现实法律效应,尤其需要慎重对待,因此在高效机译基础上引入用户意义评判并赋予优先令牌,乃至统计网络用户或云端智能设备的意义评判作为第三方文本辅助,对意义生成进行复检与修正非常必要,是机译系统在法律语言转换过程中重要的审查环节。例如前面提到过的“Certificate of Deposit”,字面翻译成中文是“存款证明”,但是“存款证明”在国内和“存款单”或“存折”并不是同一个概念,它不能用来提取现金,只是银行出具的资金证明,往往用于出国担保等用途,而美国的“CD”则是可兑现的存款证,简单直译为“存款证明”往往会造成不同文化的理解困扰,这时就需要引入对应元文本来澄清概念,译作业界通用的“存款证”来消除歧义,最后存储两者互文联系以改善后续翻译功能。

第四,组成法律文本与非文本之间关系的超文性内容。从翻译研究方法论来看,热奈特的研究超文本因素的模式,是要构建一个超文本概念框架,即从语言外部看文本的功能[12]。法律文本所处的政治、经济和社会环境因素就是一种超文本,如庭审机制、操作惯例、利益关系等因素,一定程度上制约着翻译方法与策略。譬如对“律师”一词的翻译,在英国初级律师“solicitor”和出庭律师“barrister”相去甚远,后者才有资格出席高级法庭,对应称谓要结合庭审语境才能确定。超文本能为人们所感知,说明它不是完全隐形的,而是或多或少地存在一些可分析的显性成分,如上下文可能出现的庭审地点、案件性质甚至律师名字等,都是可追查超文本因素的显性信号标志。至于像利益关系这样更为微妙的潜在因素分析,人脑的认知尚有瑕疵,对现阶段的计算机来说更是有诸多局限,幸亏包含人机互动的元文性模块在一定程度上弥补了这一缺陷,而科学家也致力于发展基于人工神经元的智能机器,相信随着运算能力的突破和对超文本成分的深入研究,机译系统能更“聪明”地发挥海量信息分析优势,为人类繁重的脑力劳动减负。

第五,构成法律领域各种文本类型等级和关系的承文性部分。承文性由其源流、派生和继起等关系形成,在法律语言的机译领域拥有更广阔的外延,特指构建了以法律渊源、法律部门、法律效力等各种属性为标准划分的文本层级空间,决定着多元空间里不同文本在机译系统意义取向过程中的角色和地位,是机译系统对法律语言的结构、语类、功能和主题展开互文分析的多维框架。例如前述的狭义互文性模块中对两大法系合同结构的转换、副文性模块中对合同的语类判断、元文性模块中对“CD”词义功能的确定,超文性模块中对“律师”这个主题的翻译,都必须基于承文性理论对文本的各项分类,采用模板套用、概率统计、权重系数等技术手段加以实现。可以说,没有类别区分就意味着机器的意义选择缺乏路由基础,即无法实现互文分析,但是承文性模块又反过来依赖于其他模块的互文分析功能,对目标文本与语料数据库中的训练样本进行互文计算,来区别特征空间划分属类。互文分析功能越完善,承文性模块的分类就越精准,反之亦然,这在系统间形成一种相互依存、相互促进的良性迭代状态。随着目标文本不断纳入语料数据库丰富训练样本,机译系统无限延续了机器学习的流程,最终进化得越来越智能。

互文性理论在符号学、翻译学、法学等领域已经展现了强大的影响力,对处于交汇地带的法律语言机器翻译亦具有深刻的指导意义。面对浩如瀚海的法律文献和纷乱繁杂的映射文本,结合语料库等信息化建设背景,在互文性视域下探究法律语言的机器翻译,审视其从翻译主体到语言客体的互文性特点,归纳整理法律语言的互文类别和具体互文表征并应用到信息化过程中,对机译程序设计的实践具有重要的理论启迪,不仅有利于改善智能文本分析功能,使机译系统在法律语言的意义转换过程中,能更精确地选择最接近绝对等值的意义表述,实现机译效果的进一步优化,而且有利于把文本分析功能进一步融入机器学习过程中,使机译系统在智能化道路上拥有更为广阔的发展前景。

参考文献:

[1]周海中.机器翻译五十年[C]//语文研究群言集.广州:中山大学出版社,1997:340—341.

[2]费尔迪南·德·索绪尔.普通语言学教程[M].北京:中国社会科学出版社,2009:79—84.

[3]Julia Kristeva.The Kristeva Reader[M].Oxford: Blackwell Publishers,1986:36.

[4]秦文华.翻译研究的互文性视角[M].上海:上海译文出版社,2006:33.

[5]Vijay K Bhatia. Intertextuality in Legal Discourse[J].The Language Teacher,Vol.22.11,1998:1.

[6]刘迎春.古法英译话互文——以《唐律》为个案分析的中国古代法律英译研究[D].苏州大学博士学位论文,2008:61—63.

[7]李红梅.互文性视角下的译者主体性[J].齐齐哈尔大学学报:哲学社会科学版,2012年05期:136.

[8]热奈特.隐迹稿本[M]//热奈特论文集.天津:百花文艺出版社,2000:68—77.

[9]夏家驷,杨绍北.互文性给机器翻译带来的启示[J].中国翻译,2004,25(3):83—87.

[10]Basil Hatin,Ian Mason.话语与译者[M].北京:外语教学与研究出版社,2005:183—203.

[11]Graham Allen.Intertextuality[M].NY:Routledge,2000:102.

[12]张美芳.翻译中的超文本成分:以新闻翻译为例[J].中国翻译,2011(2):51.

猜你喜欢
互文互文性文本
互文变奏的和弦:论雅各布森的《我叫夏洛克》
在808DA上文本显示的改善
《红楼梦》与《金瓶梅》回目互文性解读
基于doc2vec和TF-IDF的相似文本识别
“浪子回头”中的伦理叙事——《基列家书》与《家园》的互文性解读
文本之中·文本之外·文本之上——童话故事《坐井观天》的教学隐喻
“谷歌退出中国”美方新闻报道的互文性分析
如何快速走进文本
图像志的延伸:互文语境中的叙事性
略论饶宗颐古代“语— 图” 互文关系研究