ESP书面语文本的句法复杂度
——运用L2SCA句法分析工具所做的量化研究

2019-01-09 06:06:00卫志强
武夷学院学报 2018年10期
关键词:句法语料复杂度

卫志强,蔡 彦

(马鞍山职业技术学院 应用外语系,安徽 马鞍山 243031)

Hutchinson&Waters认为ESP是一种基于学习者需要的课程设计途径,影响这种设计的因素有三:语言描写、学习理论和需求分析[1]。需求分析多半关注为什么要学,学习理论聚焦如何去学,而语言描写则主要探讨学习的内容,因此对语言特征进行多维度的描写分析仍是ESP课程设计中不可或缺的重要部分。

在我国,ESP存在的理据已经得到充分的论证[2]。ESP课程也将成为今后一段时期高校外语教学改革的主要方向之一,胡壮麟等指出ESP与系统功能语言学中的语域理论相一致,他们建议对ESP这种特殊的语言变体需要做出认真的研究与分析[3]。有鉴于此,本篇尝试通过文本间的比较,描写ESP书面文本在语法复杂度方面具有的特点,在此基础上从语境和功能角度对上述特点做出解释。

一、文献回顾

根据韩礼德系统功能语言学的基本观点,情景语境中的话语范围、基调与方式决定了语义层面的概念、人际和语篇意义,这三种意义又以“盖然性”的方式体现于语言的符号系统中(词汇语法层次)。情景语境类型的不同会在词汇语法层中以某种方式体现出来,从而形成有差异的功能语言变体——语域[3]。显而易见,ESP与与它类文本相比具有不同的语域,在词汇和语法方面也必然显示出鲜明的特征。

而在过往ESP研究中,对于词汇的分析更加引人关注,不仅涉及单个词汇,也关注到了词汇序列(亦称词块),不仅有通用学术词汇的研究,也有关于学科专业词汇的讨论。如Coxhead以GSL词表中的前2000个词族为基础,研制出通用学术词表(AWL:Academic Word List)[4]。张敏研究了信息工程专业语料库中的词汇,并提取出了248个核心学术词族以及166个核心专业词族[5]。Biber等所做的研究发现:与书面学术文本相比,词块在课堂学术话语中出现的频率更高[6]。Cortes研究表明:在学术写作中,历史与生物学学生无论在词块使用的数量或是方式上都与专业学者有着明显的不同[7]。Byrd等对4个学科书面学术写作语料中的语块做了调查,结果得出法律文本中词块占比最高,其次为贸易类型文本[8]。

不过,同为语言符号资源的语法在ESP范围内受到的关注却极少。句法复杂度的研究多半集中于以学习者写作文本为对象。通过控制写作任务的计划方式,Ellis等发现与写作中计划相比,写作前计划对句法复杂度产生的效应量更高,写作中计划对语言准确性的影响更大[9]。Yang等分析了学习者议论文写作文本,得出话题熟悉度对小句复杂度具有显著正效应,话题的类型差异也可能会诱使某些句法复杂度特征更加频繁的使用[10]。Yong等发现学习者议论文在句法单位长度、短语复杂度方面优于记叙文。两类文体中从属类型的句法复杂度无明显差异。体裁因素能显著影响文本的句法复杂度,研究者认为这是由于不同体裁文本在交际功能方面的差异使然[11]。

关于词汇和语法的关系问题,张德禄指出两者间存在协同效应,可以相互补充,词汇出现空档,可由语法来补位,反之亦然[12]。沿着这一思路似乎可以做出如下判断,即在表达相同意义的前提下,词汇复杂度的升高会相应的造成句法复杂度的降低。从笔者之前一项关于ESP/EGP词汇特征的对比研究来看,ESP表现出的整体词汇复杂度确实更高,但是否说明ESP的句法复杂度就一定较低呢?本文将自建ESP语料库,运用L2SCA句法分析工具,着重从句法单位长度、从属及并列复杂度、短语复杂度三个方面对两类文本做出深入分析。

二、研究设计

(一)研究问题

1.ESP与EGP书面语料在句法单位长度方面是否差异显著?造成差异的原因是什么?

2.两类语料在从属及并列类型的句法复杂度方面是否有显著差异?差异原因何在?

3.两类语料在短语复杂度方面(尤其是名词和动词短语)有无显著差异?是什么造成了这种差异?

(二)语料简述

本次研究所有ESP语料均来自近10年以来中国国内公开出版发行的大学阶段专门用途英语教材。涉及到的学科包括机电、农林、财会、商贸、旅游、医药卫生、电子信息、轨道交通等。语料内容只包括阅读文章中的正文部分,但不包括图、表、注释、篇章及段落的标题等附属性文字。通过随机抽样获得并用于研究的ESP文本为300份,语料容量为130080词,平均每篇ESP文本的长度为433.60词。用于对比的EGP语料源自于大学公共英语教材,文本数量也为300份,语料容量为143679词,平均每篇EGP语料的篇幅为478.93词。

(三)研究阶段与方法

研究大体可分为语料制备、语料处理和数据分析三个主要阶段。

在语料制备过程中,我们使用办公扫描设备对纸质文本进行扫描处理,获取文本图像,使用广受欢迎的ABBYY12.0文字识别软件将图像文件转换为文本文件,对文本识别中出现的错误进行人工校对,确保所获语料的真实有效。

随后,我们使用L2SCA3.3.3二语句法复杂度分析工具对前期准备的语料做进一步处理,从而获得关于语料的句法分析数据。根据工具研发者陆小飞教授的报告,该工具与人工句法标注间的相关信度系数高达0.834以上[13]。语料处理完毕后输出的结果会给出文本的单词、句子、动词短语、小句、T单位、从属小句、复杂T单位、并列短语及名词短语的数量,根据这9个文本参数可计算出14种句法复杂度指标,这些指标的名称及简要定义详见下表1。

表1 句法复杂度指标名称及定义Tab.1 Indices of syntactic complexity and their definitions

最后,我们对上一步骤中的句法复杂度数据进行整理,并将其输入SPSS22.0社会科学统计软件包中。选择独立样本T检验来比较两类语料在句法复杂度方面的差异。为了抵消样本数量对显著性P值可能造成的影响,我们也使用香港理工大学网站上提供的效应量计算器,通过样本数量、均值和标准差为每一句法复杂度指标计算出相应的效应量(Cohen’sd或Glass'sΔ)。

三、研究结果

表2 ESP/EGP的句法单位长度比较Tab.2 Comparisonsofsyntacticunitlengthsbetween ESPand EGP

由表2提供的数据可知,ESP书面文本在平均句子长度、平均小句长度和平均T单位长度3个指标上的值都要显著的高于对应的EGP文本(P<0.01)。3个指标的T检验效应量也达到了中高水平,说明文本类型是影响句法单位长度的较为重要的因素。

表3 ESP/EGP的从属类别句法复杂度比较Tab.3 Comparisons of syntactic complexity of subordination between ESPand EGP

再看数据表3,ESP书面文本在所有4个从属类别指标上的值都要显著小于对应的EGP文本 (P<0.01)。效应量处于中等偏低水平(0.20<Cohen’d或Glass’sΔ<0.50)。这表明文本类型变量对从属类复杂度施加了一定的影响,尽管这种影响的程度并不十分明显。

表4 ESP/EGP的并列类别句法复杂度比较Tab.4 Comparisons of syntactic complexity of coordination between ESPand EGP

表4中列出的CP/C和CP/T两指标数据能够反映出ESP文本并列短语的密度要显著高于对应的EGP文本,文本类型效应十分明显(Cohen’d或 Glass’sΔ>0.80)。相反,ESP文本的句子之间的并列复杂度(由T/S反映)要显著小于EGP文本,文本类型对句间并列复杂度有中等偏弱的影响。

表5 ESP/EGP动词短语及名词短语复杂度比较Tab.5 Comparisons of complexity of noun and verb phrases between ESPand EGP

由表5数据可知,ESP文本中名词短语的复杂度(CN/C;CN/T)显著高于EGP文本,文本类型产生的效应十分理想。此外,虽然在ESP文本中动词短语要显著少于EGP文本,可文本类型这一变量产生的效应量较低,可能是由于样本数量较大所致,因此可以判断文本类型并不是影响动词短语复杂度的重要因素。

四、分析与讨论

综合表2到表5提供的数据,可以看出:本研究ESP类型语料无论在句子、T单位,或小句层次,它们的平均长度都要显著高于对应的EGP语料。ESP语料中,T单位内部的小句和从属小句的数量偏低,ESP的所有T单位中,复杂T单位占比相对较小;ESP的所有小句中,从属小句较少。与此同时虽然并列短语在ESP中比率较高,但用于句间并列的并列连词却明显较少。此外ESP语料中名词短语比率要十分显著地高于EGP语料,相反,动词短语却少于相应的EGP语料,尽管这种差异的真实显著性并不十分明显。

ESP文本的整体句法复杂度高于对应的EGP语料。这与我们预期并不相符。出现这种现象可能有如下原因:ESP文本意欲表达的意义可能更为复杂而抽象,因而不仅需要更为复杂的词汇,也需要句法手段的配合使用;从教材适用对象的角度来看,ESP教材适合具有一定语言基础的高年级学生,但学习者毕竟不同于专业人士,他们对专业领域内的相关术语和抽象概念的把握可能有所欠缺,为了便于学习,使用句法资源来“填补”专业词汇留下的空档也是十分必要的;而EGP教材的适用对象多为低年级学生,为了帮助学生打好语言基础,对EGP语料做适度的文本改写从而降低其句法复杂度也是完全有可能的。

ESP在从属方面的复杂度不及EGP语料,但前者的名词短语复杂度却显著高于后者。这与Norris等提出的句法复杂度发展顺序相吻合。他们认为个体语言产出的句法复杂度的发展需要经历从句子间并列到句内从属,再到短语复杂度提高这三个前后相继的阶段[14]。换言之,短语的句法复杂度的升高势必会造成句子内部从属类型复杂度的降低。Biber等对学术文章中的28种句法特征做出仔细研究后得出,小句从属在日常口语会话中更为普遍,而复杂短语尤其是名词短语在学术写作中更为显现[15]。这一点也得到了本研究结果的部分支持,ESP作为一种以学术或职业活动为导向的书面语文本,其句法复杂度特征理应与日常口语拉开距离。

在典型的口语会话中,交际是双方以面对面的方式进行的,迫于这种形式的实时性、交互性和较强的情景语境依赖性,说话者很难保证在短时间内能够使用极其精确的词汇,而且由于情境语境的存在,有时也没有必要使用这样的词汇来完成交际,这种情况下,句子内部复杂度升高能够弥补词汇的暂时 “缺位”。而在ESP书面语表达中,话语所涉及的语场通常是抽象度、精确度要求极高的专业领域,交际一方具有较高权威,需要用明白无误的方式准确传达信息,表达观点和态度。同时书面语这一交际渠道一方面与情景语境相脱离,另一方面又能给予说话者足够的时间“打磨”语言,所有这些都促成了ESP文本句法复杂度从小句层级向短语或词汇层级的“跃迁”。例如原本需要动词来表达一个“过程”的小句可以通过语法隐喻途径转化为一个名词,使其成为另一过程中的“参与者”,这就大大降低了句子内部小句从属方面的复杂度,而这也正是科技语篇中最为典型的语言特点之一——名词化。

此外,ESP与EGP分属两种不同的语类,语类指的是包含语言活动的社会活动,用以完成交际任务,达到交际目的。语类直接决定了语言的意义系统,并通过这一“中介”达到对词汇语法系统的调控[16]。在ESP中,须要完成的交际任务主要是传递信息、论述观点和表达态度。而EGP则更多聚焦于描募事物、记叙事件和表达情感。 这就造成EGP文本的互动性、叙事性和形象性更强,以语言变异的距离来衡量,它与日常口语更为接近,因而其从属及并列类型句法复杂程度更高。而ESP也因其特定的交际任务,在文本中表现出更强的逻辑性、抽象性和专业性,更为接近科技学术类型文体,致使其句法复杂度更多体现在名词短语之上。

五、结论

通过对两类文本句法复杂度的对比分析,我们发现ESP文本的整体复杂度高于EGP文本。ESP文本在句子内部从属,句间并列两个方面的复杂度低于EGP文本,但前者名词短语方面的复杂程度却高于后者。由于在交际目的、内容、方式及对象等方面具有差异,不同语类文本在句法复杂度方面亦有差异。

本研究存在如下不足:选取的ESP样本数量不足,语料代表性有待商榷。其次,本研究只涉及了句法方面的复杂度,对句法多样性未做研究。并且只对句法这一单一维度做了分析,没有涉及词汇的复杂度、多样性或语体等变量,希望以后的研究能够上述角度入手,获取对ESP文本更为科学而全面的认识。

猜你喜欢
句法语料复杂度
句法与句意(外一篇)
中华诗词(2021年3期)2021-12-31 08:07:22
述谓结构与英语句法配置
一种低复杂度的惯性/GNSS矢量深组合方法
句法二题
中华诗词(2018年3期)2018-08-01 06:40:40
诗词联句句法梳理
中华诗词(2018年11期)2018-03-26 06:41:32
求图上广探树的时间复杂度
基于语料调查的“连……都(也)……”出现的语义背景分析
某雷达导51 头中心控制软件圈复杂度分析与改进
华语电影作为真实语料在翻译教学中的应用
出口技术复杂度研究回顾与评述