运用RSTTool分析科技英语长句

2013-04-29 21:06董敏高文睿

董敏 高文睿

〔摘要〕 科技英语长句逻辑严密,结构关系复杂,往往对科技英语阅读和翻译造成很大困难。修辞结构理论(Rhetorical Structure Theory, RST)着力分析书面独白语篇中语义衔接与连贯的修辞关系,并广泛应用于语篇的生成和结构分析。通过描述修辞结构理论框架,运用RST Tool对科技英语长句进行实例分析,以期为明晰科技语句的逻辑语义关系提供一种易操作的分析平台,为科技阅读和科技翻译提供有益启示。

〔关键词〕 科技英语长句;修辞结构理论;RST Tool

〔中图分类号〕 H0 〔文献标识码〕A 〔文章编号〕1008-2689(2013)01-0032-08

一、引言

修辞结构理论(Rhetorical Structure Theory, RST)是一套关于自然语篇结构描写的理论,主要研究基于语篇修辞关系结构的篇章的整体性(unity)和连贯性(coherence)。Mann et al.[1] (43) 指出修辞结构理论旨在描写一些功能和结构,它们使得语篇成为人类交际有效的和可理解的工具。科技英语篇章记录自然界的现象和科技界的动态,普及某种技术或科学知识,方便人们从事科技活动时的交流与探讨。其表达讲究逻辑上的条理清楚和思维上的准确和严密,以一种冷静而客观的风格陈述事实或揭示事理。因此,科技英语句子常有一系列的从句和短语来加以周密地限定和说明,句子往往偏长,结构复杂,给科技英语阅读和翻译带来很大困难。本文以修辞结构理论为框架,使用以该理论为基础研制开发的文本分析软件RST Tool 对科技英语长句进行实例分析,描述和阐释其修辞结构,为科技英语篇章的理解和分析提供一种可以操作的平台,明确作者的交际意图,降低科技阅读理解的难度。

二、 修辞结构理论

修辞结构理论由美国学者William C. Mann 和 Sandra A. Thompson首创于1983年[2] (8),最早应用于计算机语篇生成,是一套关于自然语篇结构描写的理论,通过描述语篇各部分的功能及其之间的结构关系来分析语篇。RST从研究小句的连接关系开始,逐步过渡到各种长度的自然段落和完整的语篇。RST的研究表明各个小句并不是杂乱无章地堆在一起的,而是由一些为数不多、反复出现的关系相连接,这些各式各样的语义关系称之为修辞结构关系(Rhetorical Structure Relations)。不对称性在这些修辞关系结构中占主导地位,英语中最常用的一类结构关系是核心-辅助(nucleus-satellite)的不对称关系。

RST理论命名和定义了20多种关系,原则上来讲,语篇关系的种类和数量是无限的,以前从未出现过的关系类型也可能在新的语篇关系中出现,但在实际应用中,用为数有限的关系就可以分析一种语言的大部分语篇,如大多数英语语篇都可以用20多种关系[3]来描写。2001年,由Daniel Marcu博士主持的研究小组以RST理论为支撑创立了语篇标注语料库。其研究成果将定义关系扩展到了78种,包括53种单层核心关系和25种多层核心关系,并将这78中定义关系分成16个组别,每组都具有相同的修辞功能[4]。

修辞关系有两个主要的特点:(1)关系结构内部具有同质性。RST认为从小句连接到语篇,各个结构段之间是有层次的,两个小句之间,几个小句和几个小句之间,再到段落与段落之间,直至整个语篇,都是有层次的。而且,层次的多少也是不固定的。关系结构同质性的特点,使得从小句连接到语篇本身的所有层级结构共用一套相同的关系模式,不会因为结构段的等级变化而不同,因此不同的分析者也会取得较高的一致性。(2)修辞关系的结构关系是功能关系,可用不同的效果类型来描写,比如可从作者的交际意图或作者对读者情况的假定等角度来描述。

结构段(span)是指语篇结构中任何具有RST结构的、功能完整的片段。两个独立的结构段根据其在相互关系中的核心或辅助地位,具体可分为“核心结构段”和“辅助结构段”,核心结构段可分为单核心结构和多核心结构。但多核心结构关系实际没有核心与辅助之分,各部分是并列关系。结构段的划分可以结合语篇中的逻辑关系采取自上而下,也可以自下而上或两者兼用的方法。任何一个完整连贯而又符合逻辑的语篇都是由体现为小句、句子、语段、段落的结构段按一定的语义关系排列组成的,是动态的语义单位。结构段具有等级性的特点,因而结构段是相对于所在的功能整体来划分的。

RST关系可用认知图示来说明各结构段之间的逻辑关系。Mann和Thompson[5] 认为,认知图式可决定一个语篇中所有成分的结构性排列。它由3个要素组成:一定数量的成分性结构段;结构段的关系说明;某个结构段(核心结构段)与语篇整体的关系说明。如图1所示:

在RST图示中,最上方的数字如(1-2),(1-5)(1-n)代表结构段范围;横线及下面的数字,如1、2或者1、2、3、4、5代表具体的结构段;弧线代表结构段之间的关系,如“证据关系”、“序列关系”;在核心-辅助关系中,箭头指向核心结构段,如“证据关系”指向结构段1;在非核心-辅助关系中,弧线不带箭头,如1、2、3、4、5之间的序列关系。

三、 RST Tool

RST Tool是以修辞结构理论为理论框架,为语篇的修辞结构关系提供计算机分析的工具。该文本分析工具是澳大利亚人Mick ODonnell博士研制开发的,可以在Windows、Macintosh、Unix和LINUX多种操作系统下运行。其界面友好,可以对篇章结构进行切分和标示。其结构关系开放性的特点允许用户修改、添加、删除和重新命名等操作。其统计分析功能可以直接显示各项百分比,从宏观上把握各种篇章类型的特点,核心与辅助关系的次序也用数据显示,这样更方便读者和译者发现体现语篇要旨的核心篇位。其应用范围广,适用于多种语言分析。现在网络上最常见的是RST Tool Version3.45[6]。RST工具有四个操作页面[7]:

(1) 文本界面(Text Segmentation Interface):用于结构成分切分。

(2) 文本结构关系界面(Text Structuring Interface):用于标示结构关系。

(3) 结构关系编辑界面(Relation Editor):用于编辑和维护结构关系。

(4) 数据统计界面(Statistics):用于统计分析数据。

RST Tool的具体操作在下文中的实例分析中进行详细阐述。

四、 科技英语长句的RST Tool操作

科技英语(English for Science and Technology,简称EST)叙述客观、表达确切、流畅自然、逻辑严密,但其中长而复杂的句子,往往给阅读和翻译带来很大的困扰。本节将概述科技英语长句的句法特点,运用RST工具进行实例分析,呈现该工具的操作方法。

(一)科技英语长句的句法特点

针对自然现象的实验观察、数据分析以及定理式的逻辑推理证明,科技英语具有技术性、抽象性、客观性和信息高密度性的语域特征。从句法上看,科技英语组句较长,成分复杂,结构严谨。主要表现为:大量使用名词、名词短语、悬垂结构及分词、不定式等非限定分句说明事理;频繁使用介词词组和短语准确而简练地实现时间、空间、目的、理由、因果等逻辑关系;表征目的、条件、因果等不同逻辑关系的从句交错重叠;遵守英语句子末端重心原则,较长的分句移到句末,句子前后长度保持平衡。由此可见,科技英语的长句“长”在句子内部语义关系产生的多层次复杂性。

目前,国内对于科技英语长句的研究与分析始终停留在词汇、语法层面,描述科技英语长句的翻译技巧,包括结构分析法、顺译法、倒译法、中译法、分译法和综合法,但没有论述技巧背后的语义机制[8][9][10][11]。

需要指出的是,杨坚定[12] 运用修辞结构理论提出以修辞结构段作为动态翻译单位,并对一段科技英语篇章原文和译文的修辞关系对等进行了分析和解释,这可看作是修辞结构理论应用于科技英语翻译的成功尝试。

2. RST Tool的操作展示

下面以一个航空航天英语[13] 句子为例,展示RST Tool的具体操作。

Because Shuttle system performance required a highly efficient ascent propulsion system, a new rocket engine was developed—one that would deliver substantially higher performance than its predecessors, could be throttled over a wide thrust range, and could be used many times without major malfunction or overhaul.

1)文本导入

RST Tool只识别和处理文本文件(txt.),在导入一个新文件之前,应转换为该格式。需要特别注意的是中文文本必须在保存和导入时选择相同的编码格式(英文文本默认的即可),例如文本格式保存时使用的是utf-8,那么在导入RST工具时,应在encoding处选择utf-8。如图2:

2)文本切分

文本导入之后,进入文本界面(如图),该界面有两组操作命令,一组是Modes(方式),移动鼠标可以在文本切分和文本编辑之间转换。另一组是Segment(切分),可以在句子和段落的处理之间转换。其中Segment 可以输入标点,定义所要切分的位置。段落的切分是自动完成的,只要在“切分”(segment)状态下,点击段落切分,就出现段落标记符。RST工具只识别空行的段落,所以在输入文本时,用户要在段落之间做空行标记。句子的切分可以是自动完成,也可以是用户手工完成的,因为有时候RST工具不能识别非常规的标点符号。一般情况下,在RST分析中,根据Mann &Thompson的应用实践,分析单位的大小是任意决定的,但无论是大是小,这种单位必须具有独立的功能完备性,据此独立的短语、子句、句子都可以成为修辞结构的分析单位。在本文中,为了简化操作和便于识别,笔者在导入之前就先把文本进行了编码和切分。

1 Because Shuttle system performance required a highly efficient ascent propulsion system.

2 a new rocket engine was developed—.

3 A one that would deliver substantially higher performance than its predecessors.

3B could be throttled over a wide thrust range.

3C and could be used many times without major malfunction or overhaul.

导入RST Tool之后,如下图3所示。

3)结构关系集的选择和编辑

在标示结构关系之前,要先进入关系(Relation)界面,导入(load)一个关系集,最常用的是第一个和第二个。第一个ClassicMT.rel是Mann&Thompson 1998版,第二个ExtMT.rel是Mann&Thompson 修订的2000版[6]。在图4这个界面,用户可以增加、删除或重命名关系。

4)结构关系的标示

结构关系的标示过程,是RST分析的重点和难点。在判定两个结构段之间的关系时,分析者在每一步都要考虑关系定义运用的是否得当,要尽可能的做到客观。点击Structurer键,就会进入如图5的界面。

在标示单核心结构时,按下Link(连接)按钮,从辅助结构段按住鼠标左键拖动到核心结构段,松开鼠标,出现结构关系菜单中的关系选项,选择所要定义的关系,两个结构段就被连接起来,在连接线上方标记为选中的结构关系。如图6所示。

在标记多核心结构的时候,点击Add MultiNuc按钮,按照上述同样的方法拖动鼠标,就会出现多核心结构关系的菜单,选择所要定义的关系。然而,这只是第一步。多核心关系需要两步操作,这时需要再次点击Link按钮的条件下进行选择,在想要添加的结构段上按住鼠标左键拖到上一步出现的结构段上方的数字处松开,又会出现另外一个对话框(如图7所示),然后选择multinuc,多核心结构的关系定义即完成。

Add span的按钮可以将核心结构段和所有的辅助结构段连接起来,操作也很简单,点击 “add span”,在核心结构段处点一下即可。那么,上述例句的最后的关系树形图应为图8所示。

标示完毕后,图式可以储存、打印或转换显示格式,也可以在结构菜单下,选择将图式粘贴到剪切板,使分析和阐释更为方便和直观。

根据图9所示图式 ,可以看出该句的核心是第二个结构段——新型火箭发动机的研制。本句包括三个结构段1、2和3,3又包括3A、3B、3C三个结构段。1和2是意愿性的原因关系,3B和3C是联合关系,为3A的说法提供证据,因而3B、3C和3A是证据关系。3A、3B、3C都是对2的进一步阐述,是详述关系。从句法的角度来看,3A和3B、3C之间是并列的,但从语义上来看,后者为前者提供了证据支持。

五、 科技英语长句的RST Tool分析

在科技英语篇章中,长句的出现频率很高,如上所述,科技英语的长句“长”在句子内部语义关系产生的多层次复杂性。下面运用RST Tool 3.45试析几个长句内部的功能语义关系,尤其是隐性逻辑语义关系,从而展示理解和分析科技英语篇章的一种有效途径。本节的航空航天英语例句也均选自严俊仁[13]。

例1:

Stimulated and strengthened by two World Wars the baby is growing up and the community understands very fully the foolish uses for which aircraft can be exploited—but there are wise uses too, even though they may not be so readily apparent.

1A Stimulated and strengthened by two World Wars

1B the baby is growing up

2 and the community understands very fully the foolish uses for which aircraft can be exploited

3A but there are wise uses too,

3B even though they may not be so readily apparent.

从图10所示关系图解可以看出,该长句分为3个结构段。第一个结构段分为1A和1B两个次结构段,它们之间的关系是隐性的非意愿原因关系;第三个结构段由3A和3B两个次结构段构成,由于“even though”的存在,它们之间是显性的让步关系;结构段2和3之间是显性的对比关系;1与2、3之间则构成了隐性的背景关系。结构段1和2由连词“and”连接,似乎是并列的关系,但在语义上,结构段1为2提供了良好的背景知识,帮助读者更好地理解结构段2的内容。

例2:

This is made possible by the fact that all the pilots inputs are first processed by a high speed computer system; it then passes them to the aircrafts flight controls as commands, allowing ATTAS to assume the flight characteristics of another actually existent aircraft or of a hypothetical aircraft.

1A This is made possible by the fact that all the pilots inputs are first processed

1B by a high speed computer system;

2 it then passes them to the aircrafts flight controls as commands

3 allowing ATTAS to assume the flight characteristics of another actually existent aircraft or of a hypothetical aircraft.

如图11所示,此结构关系图式分为3个结构段1A和1B之间是显性的方式关系,由by表示;结构段1和2存在着明显的序列关系,而作为核心结构段,结构段3是前2个结构段所要达到的目的。

例3:

There can be no doubt that the second 50 years of powered flight holds a challenge more forbidding, though no less interesting, than the first but the success achieved will not be measured by man landing on the moon but by whether in the process we have learned wisdom and in doing so have stored the free exchange of knowledge within and between all communities on the surface of the earth.

1A There can be no doubt that the second 50 years of powered flight holds a challenge more forbidding … than the first

1B though no less interesting,

2A but the success achieved will not be measured by man landing on the moon

2B but by whether in the process we have learned wisdom

2C and in doing so have stored the free exchange of knowledge within and between all communities on the surface of the earth.

由该关系结构式(见图12)可知,该句分两个结构段。结构段1包括1A和1B两个次结构段,其中1B在句子结构上属于插入成分,二者之间是显性的让步关系;2B和2C是联合关系,2A和2B、2C之间是对照关系,作者观点是对后者的肯定;结构段1和结构段2之间是非意愿性原因关系,由于but的存在,看上去似乎是一种显性的让步关系,但是从深层语义来看,结构段1的出现使得结构段2中阐述的衡量成功的标准发生了变化,所以它们之间是隐性的非意愿性原因关系。

六、 结 语

修辞结构理论从动态交际功能的角度出发,摆脱了关联词语、语法结构、类型结构等表层语言形式的束缚,研究“目的”、“意义”等抽象体的结构关系模式,从而更清楚地呈现科技英语长句内部隐含的逻辑语义关系,更好地表达作者的交际意图,有利于读者更好地理解和把握文章主旨。上述实例分析表明,运用RST Tool标示科技英语长句各部分之间的关系,清晰、明了、易于理解,在很大程度上降低了理解的难度,为进行基于语料库的RST科技语篇修辞结构标注和定量统计分析提供了有益启示。

〔参考文献〕

[1] Mann, W. C., Matthiessen, C. M. I. M. & Thompson S. A. Rhetorical structure theory and text analysis[A]. In Mann, W. C. & Thompson, S. A. (eds.). Discourse Description: Diverse Linguistic Analysis of a Fund-raising Text[C]. Amsterdam:Benjamin, 1992:39-78.

[2] 王伟. 修辞结构理论评介(上)[J]. 国外语言学, 1994,(4):8-13.

[3] Mann, B. An introduction to Rhetorical Structure Theory (RST)[A]. Available at: http://www.sil.org/%7Emannb/rst/rintro99.htm.

[4] 陈莉萍. 修辞结构理论与句群研究 [J]. 苏州大学学报(哲学社会科学版), 2008,(4):118-121.

[5] Mann,W. C. & Thompson,S. A. Rhetorical structure theory: toward a functional theory of text organization [J]. Text ,1988,8 (3): 243-281.

[6] ODonnell,M. RST Tool Version 3.45[Z]. Available at: http://www.wagsoft.com/RSTTool/.

[7] 刘世铸. 修辞结构理论与RST工具[J]. 外语电化教学,2003,(4):20-23.

[8] 张雪云. 科技英语中的长句翻译问题[J]. 同济大学学报(社会科学版),1997,(1):104-108.

[9] 于建平. 科技英语长句的分析及翻译[J]. 中国科技翻译,2000,(3): 14-16.

[10] 陈桂琴. 科技英语长句翻译方法例析[J]. 中国科技翻译,2005,(3): 5-8.

[11] 陈伟. 科技英语长句的句法特点和汉语译文结构重构[J]. 沈阳农业大学学报 (社会科学版) , 2007,(3): 442-444.

[12] 杨坚定. 动态翻译单位探讨[J]. 中国翻译, 2004, (5): 20-24.

[13] 严俊仁. 科技英语翻译技巧[M]. 北京:国防工业出版社,2000.

(责任编辑:高生文)