高 军 杨 璐
(上海理工大学 外语学院,上海 200093)
词块(lexical bundle)表现为三词或多词的共现关系,即扩展搭配,如as a result、on the other hand和in the case of the等。词块在学术语篇中具有频率高和分布广的特征,是语篇构建的主要话语手段,承载着重要的语篇功能(Biber et al. 1999; Biber & Conrad, 1999)。Haswell(1991)的研究发现,在特定学科社团中,能否恰当使用该学科的标志性词块是区分专家与新手的主要标志。因此,学术新手,尤其是二语写作者要在国际学术期刊发出自己的学术声音,提升学术影响力,必须熟练掌握和恰当使用所在学科领域的词块。
近年来,国内外学者运用语料库手段对词块的使用特征进行了大规模的实证性研究,对比分析了英语本族语学者与非本族语学者、学术新手与专家学者、期刊论文作者和英语学习者以及不同学科作者之间在词块使用上的异同(Chen & Baker, 2010; Hyland, 2008a, 2008b; 胡元江等,2017;鲁莉、王敏,2015),但是针对国内理工科研究生英文学术论文中词块使用的实证研究尚不多见。Scott和Tribble(2006)指出,对比分析英语学习者论文和本族语学者论文可以找出学习者与本族语学者在词块使用上存在的差异,帮助英语学习者有效习得和正确使用词块,提高语言表达的地道性,从而成为熟练的论文写作者。鉴于此,本文采用语料库分析的方法,以国际期刊论文为参照语料,对比中国理工科研究生和英语本族语学者学术语篇中四词词块的结构和语篇功能的异同,以期对理工科研究生学术英语写作教学和词块教学提供一定有益的启示。
二语习得理论注重词块,认为词块在语言习得过程中发挥着关键作用 (Larsen-Freeman, 2011)。Granger(1998)和Meunier & Granger (2008)的研究显示,二语学习者撰写的英文论文语言不流畅、不地道与词块少用或误用有关。Biber等(2014)对比了期刊论文作者和非本族语学习者的论文,发现期刊论文作者使用的短语类词块多于学习者,高水平非本族语学习者使用的短语类词块远多于低水平非本族语学习者。Hyland(2008a, 2008b)对比了电气工程、商业、生物学及应用语言学四大学科领域的期刊论文和香港的中国学生硕博论文,发现硕博论文的四词词块数量多于期刊论文,而且在50个最高频四词词块中,期刊论文和硕博论文的共用词块数量不足二分之一。Cortes(2004)通过分析历史和生物两个学科的学生论文和专家论文发现,学生不仅较少使用词块,而且使用的词块与专家论文相比存在较大差距。Cortes(2006)进一步提出了在写作教学中实施词块教学的必要性以及具体措施,认为词块教学可以提高学生在特定学科领域论文写作的语言产出质量。
国内学者以中国英语学习者为研究对象进行了相关研究。例如,徐昉(2012)探究了英语专业语言学方向学士、硕士和博士等不同教育层次中国学生的学术词块使用及发展特征;王丽和李清婷(2014)考察了外国语言学及应用语言学专业的硕博论文引言中词块的结构、功能及语步特征;Huang(2015)分析了英语专业本科生的词块使用频率和准确性;李梦骁和刘永兵(2017)对比了不同语言水平的中国英语学习者与本族语学者结论语步中的词块结构和语篇功能的系统性差异。
总体而言,虽然已有研究运用语料库手段考察了英语学习者和本族语学者学术语篇中的词块特征,但是依然缺乏针对国内理工科研究生英文学术论文中词块使用的实证研究。词块的恰当使用体现了学术的表达规范性,但在写作中恰当地运用词块对于二语学习者而言存在一定的难度(Hyland,2008a)。鉴于词块在学术语篇中的重要性以及二语学习者习得词块的困难,研究中国理工科研究生与英语本族语学者学术英语词块使用的异同具有一定价值和意义。
本研究尝试回答以下问题:
(1)国内理工科研究生和本族语学者英语学术论文中词块使用的频率分布和结构特征如何?有何异同?
(2)国内理工科研究生和本族语学者英语学术论文中词块使用的语篇功能如何?有何异同?
本研究的语料来自两个自建的语料库:中国理工科研究生英语学术论文语料库(以下称为“corpus 1”)和英语本族语学者期刊论文语料库(以下简称“corpus 2”)。
Corpus1的语料选自江、浙、沪三所理工类高校的硕士研究生的英语学术论文。论文作者在本科期间都通过了大学英语六级考试,在研究生阶段选修了“学术英语写作”课程,接受了系统的学术英语写作训练。Corpus1所收录的论文是在作者修读了“学术英语写作”课程后根据自己的研究课题撰写的实证性研究论文,未经专家或英语本族语者审校修改,可以真实反映作者的学术英语水平。论文涵盖能源、动力、光电、计算机、环境、建筑、机械、材料和物理等理工类学科领域,库容为112个文本、324712个形符、15906个类符,平均每篇篇幅2899词。Corpus2的语料来自“科学引文索引”(SCI)影响因子较高的国际学术期刊,发表于2013年至2017年,涵盖的学科领域与Corpus1基本相同,论文作者全部满足Wood(2001)对母语使用者的定义,即第一作者的名字是英美国家本族语者常用名,且署名科研机构或学校隶属于以英语作为母语的国家。Corpus2的库容为55个文本、323914个形符、15802个类符,平均每篇篇幅5889词。所有语料仅保留正文,删除了图表、参考文献、致谢、脚注及附录等部分,以方便对目标词块的检索。
绝大多数四词词块本身包含了三词词块,而且使用频率比五词词块高出10倍,在结构和功能上也更具代表性(Cortes,2004)。因此,本研究以四词词块作为研究对象。根据Biber(1999)等人的研究,每百万词复现至少10次且至少出现在五个及以上不同的文本中的词块语义相对固定,体现了学科特色而非论文作者的个人风格。结合本研究语料库容量,我们将四词词块的提取标准定为每百万词出现40次且至少在5个不同文本中复现。因此,两个语料库四词词块提取的最低频数均为13。
根据上述界定的词块提取标准,我们首先使用检索工具AntConc 3.2.4的词丛功能检索出两个语料库中的四词词块,利用Concordance功能查看并删除复现少于5个文本的词块;其次,通过人工筛选,排除结构零碎、不合语法或语义明显不连贯的词语组合,分别计算出两个语料库的四词词块以及每百万词复现的频数;第三,使用Excel表格中的Vlookup功能找出两个语料库中的共用词块,并利用对数似然率和P值进行显著性检测;第四,根据Biber et al.(1999)的结构分类标准和Hyland(2008a)的语篇功能分类标准,分别对两个语料库的四词词块进行结构类型和语篇功能的频数统计,并进行对比分析,从而找出理工科研究生与英语本族语学者在学术英语词块结构和功能方面的异同。
表1为两库中四词词块的数量、原始频数、标准化频数以及对数似然率的检验结果。
表1 两库四词词块的频数及对数似然率
表1显示,理工科研究生英语学术论文中四词词块的数量和使用频率显著高于英语本族语学者,说明国内理工科研究生囿于学术英语写作经验的不足更依赖程式化的词块构建英语学术语篇。这与De Cock(1998)、Hyland(2008a)和Paquot(2013)等学者的研究结论相呼应。他们一致认为,与本族语者相比,二语学习者由于语言水平的限制对词块的依赖程度较高,使用的词块往往更多。
进一步检索显示,两库中的共用词块为11个。我们利用对数似然率对11个共用词块进行了显著性检测。
表2 两库共用词块的频数及对数似然率
(注:*** p <.001,** p <. 01,*p <. 05,下同)
如表2所示,在这11个共用词块中,理工科研究生比本族语学者使用频繁的词块为“the center of the, the performance of the”。此外,理工科研究生和本族语学者都倾向于频繁使用“as shown in Fig”,但是本族语学者还高频使用了与其语义相近的替换词块“are shown in Fig”和“is shown in Fig”,而这两个替换词块是理工科研究生显著少用的词块。导致这一差异的主要原因可能在于理工科研究生往往习惯于机械性地记忆和使用固定短语类的词块,对词汇共现的内部要求了解不够,忽视了词汇知识向深度发展。这也从侧面反映了本族语学者在词块的选择和使用上丰富性更强,理工科研究生词块使用的多样性则稍显欠缺。
我们进一步统计了两库的高频四词词块,如表3所示:
表3:两库高频四词词块
注:加粗词块为两库中的共用词块
将表2的11个共用词块和表3的两库高频四词词块进行检索对比发现,在本族语学者使用的11个高频四词词块中,有六个词块属于两库共用词块,其余五个词块在理工科研究生论文库中从未出现。相比之下,在理工科研究生使用的11个高频词块中,只有二个词块属于两库共用词块,其余九个词块在本族语学者论文中从未出现,是理工科研究生特有的高频词块。例如,理工科研究生使用词块“can be divided into”(44频次)表示将实验对象分成几个组别,而该词块在本族语学者论文库中未检索到一例。相反,本族语学者使用“assign”等核心动词表示将实验对象随机分配到几个组别。同样,理工科研究生高频使用的词块“at the same time”(77频次)也未在本族语学者论文库中出现。再比如,理工科研究生使用的高频词块“with the increase of、the development of、the rapid development of、can be seen from”等是按照字面对应的直译方法表达相应的概念。上述例子分析表明理工科研究生在写作时仍然受到汉语思维和表达的影响,而且使用的词块缺乏多样性,与本族语学者存在一定差异。
Biber et al.(1999)通过对朗文英语口笔语语料库的分析把词块结构划分为12种类型。为方便讨论,我们进一步将其归纳为名词词块、介词词块、动词词块、句干词块和其他词块五大类范畴。图1呈现了两库中四词词块结构范畴的频率比重分布。
图1 两库四词词块结构范畴的频率比重分布
由图1可知,理工科研究生和本族语学者使用的四词词块结构呈现出相同的分布特征,按照使用频率由高到低依次为:名词词块、介词词块、动词词块、句干词块和其他词块。其中,名词词块、介词词块和动词词块是两库中均高频使用的四词词块结构。为进一步对比两库的词块结构特点,我们统计了12种结构类型的频数和对数似然率及P值,见表4。
表4 两库四词词块的结构类型分布
表4显示,理工科研究生使用名词词块和介词词块的频率均显著高于本族语学者。这与已有研究结果基本一致,徐昉(2012)的研究发现中国学习者以名词词块和介词词块使用为主。在动词词块的使用方面,理工科研究生比本族语学者更倾向于高频使用“被动动词+介词短语”和“系动词be+名词/介词/形容词短语”两种类型。我们认为,这可能是由于理工科研究生在学术英语写作课程中学习和掌握了科技英语语篇的主要特点,在论文撰写中有意识地使用名词和介词短语压缩和整合信息,同时尽可能地使用被动结构描述实验研究的客观性,以符合科技英语语篇名词化和被动化的要求,因而导致相应的词块结构类型使用过多。两库的另外一个显著差异是理工科研究生未使用过“动词短语+that从句”结构,而本族语学者使用此结构的频数为55;与之形成鲜明对比的是,在“代词/名词短语+动词短语”结构的使用方面,理工科研究生的使用频数有63次之多,而本族语学者的使用频数为零。这是一个很值得关注的现象。进一步语料检索对比发现,理工科研究生和本族语学者分别使用的这两类结构类型之间存在一定的关联性。
例(1)
a) Itcanbeseenthatthe depth of cut increases with time as more and more particles impact the surface, and stabilizes only in the red highlighted region which has received one complete pass of the jet diameter. (corpus2)
b) By comparison of complete stress-strain curves of granite and sandstone samples after temperature-treatment,wecanseethatthe brittleness of the two rock types gradually decreases and the ductility gradually increases as temperature rises. (corpus1)
例1显示,本族语学者使用的“动词短语+that从句”词块“can be seen that”表达的语义概念在理工科研究生的学术论文中是由“代词/名词短语+动词短语”词块“we can see that”来体现的。本族语学者倾向于使用更客观的“can be seen that”陈述事实和发现,而理工科研究生可能由于对此类词块结构掌握和使用的熟练程度不够,或者受汉语思维习惯的影响更倾向于使用比较主观的词块结构“we can see that”,表现出典型的“学习者词块”特征。
另外值得一提的是,理工科研究生使用的句干词块范畴下的“副词从句”词块的种类和频数也显著高于本族语学者,使用的三种形式分别是“as shown in Fig、as can be seen、as shown in Table”,而本族语学者仅使用了“as shown in Fig”这一种形式。我们认为,导致该差异的原因正如前3.1所述,理工科研究生可能认为他们对这类固定短语类词块的用法感觉更有把握,因为学习者总是倾向于使用自己感觉有自信的特定表达式(Granger 1998)。
Hyland(2008a)根据学术语篇的语域特征,把词块的语篇功能划分为研究型、文本型和参与型三大类。研究型词块旨在对研究活动进行定性和定量的描述,是体验真实世界和描述客观环境的体现;文本型词块用来表明篇际、句际及句内的关系,体现行文的连贯性与逻辑性;参与型词块用于建立作者和读者之间的互动,表达作者的观点和态度,包括立场词块和介入词块。我们依据上述分类框架统计了两库中四词词块的语篇功能的频率比重分布,如图2所示。
图2 两库四词词块语篇功能的频率比重分布
图2显示,两库中词块语篇功能的比重分布呈现出大致相同的特征,都是研究型词块最高,参与型词块最低,文本型词块介于两者之间,这表明理工科研究生在词块语篇功能的使用上和本族语学者相近,已经基本具备和掌握使用词块表达不同语篇功能的意识和能力。相比较而言,理工科研究生使用的研究型词块显著多于英语本族语学者,但是文本型词块少于后者,参与型词块则与后者接近。表5进一步汇总了四词词块语篇功能的分类统计数据。
由表5可见,理工科研究生和本族语学者在研究型词块的使用方面对比最鲜明。理工科研究生使用的位置、过程、数量以及描述性词块无论在种类上还是频数上都显著多于本族语学者。观察发现,理工科研究生倾向于高频使用“the performance of the、in the process of、the development of the和the size of the”等描述实验数据、研究过程和步骤的词块,突显研究的客观性和严谨性。这与Hyland(2008b)对中国香港硕博论文的研究发现一致,“新手作者在论文中更强调真实世界研究的具体步骤和方法,多用研究型词块展示他们对于话题的熟悉及研究方法的熟练”(Hyland 2008b)。 相比之下,在主题类词块方面,理工科研究生使用的种类和频数均显著少于本族语学者,说明理工科研究生在这类词块的输入和输出上仍不充分。
表5 两库四词词块的语篇功能分类统计
在文本型词块方面,理工科研究生和本族语学者使用的类型分别为14个和12个。值得指出的是,尽管在使用的类型上理工科研究生高多于本族语学者,使用频数却低于后者,尤其是衔接性词块明显偏低,说明作为二语学习者的理工科研究生明显缺乏灵活使用这类词块的能力。我们认为,造成这种现象的原因是,“汉语是一个高语境语言,读者可以通过上下文、自己的知识和表意性的汉字,即使不用‘但是’‘如果’这些连接词表明逻辑关系,也能读懂一组句子的关系。这种习惯也影响了学生英语写作中缺少衔接手段的使用”(蔡基刚,2017)。其结果是学生在语篇组织,特别是语篇衔接和行文逻辑等方面稍显欠缺,文本的可读性不强。
参与型词块又分为立场词块和介入词块两类,是作者和读者进行沟通和交流的桥梁。与本族语学者相比,理工科研究生使用的立场词块和介入词块虽然类型数量上一致,但是使用频数略高于后者。进一步对比发现,理工科研究生使用的介入词块的四种形式都与核心动词see有关,分别涉及see的主动态和被动态及相关搭配,如“can be seen from、as can be seen、it can be seen和we can see that”;而本族语学者使用的介入词块中的核心动词相对要丰富一些,使用了包括can be seen that、should be noted that、it should be noted等多种形式在内的词块构建作者和读者的互动功能。这在一定程度上说明了理工科研究生掌握了如何利用词块表达自己的立场和观点并与读者之间建立互动,但是在使用上仍然缺乏多样性,可能是由于理工科研究生对相关词块的熟悉度还不够,同时缺乏灵活运用该类词块的能力。
基于理工科研究生学术论文和英语本族语学者期刊论文语料库的定量统计和定性分析表明,理工科研究生在学术语篇构建中基本具备运用四词词块的意识和能力,但是较之本族语学者,理工科研究生倾向于高频使用四词词块;结构上,显著多用名词词块、介词词块、“被动动词+介词短语”“系动词be+名词/介词/形容词短语”和“代词/名词短语+动词短语”词块,未使用“动词短语+that从句”结构;部分词块的使用受到汉语迁移的影响;功能上,使用的研究型词块显著偏多,但是衔接性词块的输入和输出不充分,明显偏少。
是否掌握本族语者常用的词块直接关系到学习者语言的准确性和地道性(濮建忠,2003)。丁言仁和戚焱(2005)也指出,词块可以缓解临时组装语句的压力,使作者将更多的注意力转移到内容的深化和意义的表达上,写出更好的文章。但是,本研究发现,理工科研究生的词块知识和运用能力相对薄弱,表现为某些类型的词块使用过多或使用不足。对于这种现象教师在学术英语写作教学中要予以重视,应有意识地强化词块知识,引导学生大胆运用多种形式的词块,避免简单重复。除了课堂教学外,还要培养学生的自主学习能力,将词块学习融入课外的文献阅读中,鼓励学生在语境中学习和掌握词块的用法,学会运用多种衔接词块丰富语篇,提高词块运用的准确性和语言表达的地道性。
本研究也存在一定的局限性。首先,因样本数量有限,本研究结果可能存在一定偏差,不能概括中国理工科研究生词块使用特征的全貌。其次,限于篇幅,本研究未能对理工科研究生词块运用情况与学术论文写作质量开展相关研究。这些将是后续研究中要重点关注和突破的方向。