基于语料库的学术英语教学研究:从词语到语体①

2015-03-27 11:01詹宏伟张霞吴龙凤译
英语研究 2015年2期
关键词:词块语料库短语

詹宏伟 张霞 吴龙凤译

(杭州师范大学外国语学院,浙江杭州311121)

基于语料库的学术英语教学研究:从词语到语体①

詹宏伟 张霞 吴龙凤译

(杭州师范大学外国语学院,浙江杭州311121)

论述了语料库与学术英语教学的紧密联系。首先解释了Sinclair词本论的概念,接着对有关词汇、短语(包括词块)和语篇修辞功能的研究进行了说明,最后结合语料库和Swales的语步结构分析方法做了进一步的探讨。论文强调,在语料库研究以及学术英语(普通学术英语和专门学术英语)教学中,要重视词汇的作用。

语料库;学术英语;教学;词汇

1.引言

近40年来,语料库在语言学和教学领域扮演着越来越重要的角色。其中,有一部分涉及到语言语法的研究,如Biber(2006)探讨学术语体的语法变异,Biber et al.(1999)的著作《朗文口笔语语法》(Longman Grammar of Spoken and Written English),对包含口语、报纸、小说和学术四个不同语域的4000万词的语料库进行了分析,探讨了语法变化在不同语域的呈现情况。一方面,利用语料库对语法范畴的分析产出了许多优秀的研究成果,像上文提到的,对语言教学的应用有一定的启示;另一方面,语料库和词汇分析相结合的创新研究也不胜枚举。这里,研究对象发生转变的第一个原因是21世纪以来,越来越多的研究者开始关注词汇在语料库和语言教学研究中的作用。比如在Nation(2001)的著作中,他重新审视了20世纪60年代结构主义和当下词汇—语法分析方法的关系,Sinclair(1999)指出词汇高于语法的地位。另外,Halliday(2004)指出,语料库主要通过一系列专用的索引软件生成“类符”(词形)统计列表,进而分析语言的使用特点,而以“功能词”为主题词的检索方式比以“语法结构”为主题词的检索方式简便易行。当然,这并不意味着在语料库中就不能索引出要研究的语法范畴结构。但是在这种情况下,为了便于系统地分析,需要对索引出的语料做进一步的语法范畴标注。类似的情况是,在未经过标注的语料中,索引出过去式的动词将是一件非常费心的任务。

就语言教学而言,语料库在词典和语法用书编纂过程中能直接发挥较大的作用,而在实际的教学实践中则不然。(Stubbs 2004)虽然在课堂中教师能够将索引出的词汇生成表展示给学生或者学生自己动手完成检索任务,但是这种教学方法并不能有效渗入到所有课堂中,或者至少到大学课堂,这其中的原因可能是,建立一个专门适合于英语学习者学习的语料库有困难,并且,像学生和老师这样的群体缺乏语料库学习策略的培训。

鉴于此,本篇论文将主要关注两点,第一点:将语料库和词汇分析方法应用在通用学术英语和专业学术英语写作教学中的研究,需要指出的是,这些研究中所利用到的语料库大部分是由个人团体在研究机构编译(Flowerdrew 2004,2010)。第二点:多种语料库分析方法的展现,帮助课堂教学的直接、有效进行。

围绕着上述的关注点,文章首先简要介绍了Sinclair(1999)提出的“词本论”(lexical approach)概念,着眼于以单个词为出发点的相关应用和研究。然后讨论了这些词的语法行为,包括经常提及到的“词块”方面,接着从功能的角度分析词汇,诸如,和evidence和research两个词分别搭配使用的短语,在论文中通常表示前人的研究结果。此外,由于分析语篇的语步结构模式能够体现一定的修辞效果,文章借鉴Swales(1990,2004)的体裁分析方法,如在写文章引言部分经常被用到的CREATEA-RESEARCH-SPACE(CARS)模式——语步1:确定领域;语步2:确立地位;语步3:占据位置。其中,语步2主要体现论文“参考文献”部分的修辞功能,往往采用little research has been carried out on...等短语表达,展现当前文章在该研究领域的进展情况。在此基础上,笔者结合语料库分析方法,对学术英语写作的教学方面做了进一步的应用研究和分析。纵观全文,文章从自下而上的词汇视角逐步转向自上而下的语篇视角的研究。

2.词本论的概念

Sinclair(1999)提出的“词本论”(lexical approach)认为:词汇的地位要高于语法,并且指出事实上语言是由语法化的词汇,而非词汇化的语法构成。这一理念使一些学者关注英语词汇频率表和这些单词的惯用语法形式,并促进了英语词汇教学大纲的生成(Willis,1990,2003)。Willis(1990:vi)曾指出柯林斯(COBUILD)教材中,英语学习者的初级水平为要求掌握出现频率最高的前700词汇,这些词从语料库中收集,在英语文章中所占比例为70%。需要注意的是,单个词汇的不同语义出现的频数不同,如Sinclair&Renouf(1988)提到make这一单词通常会出现在make decisions、make discoveries、make arrangements等短语中,而make这样的虚义用法要比它在make a cake类似的实义用法中被使用的频数要多,所以在教学中应该被引起重视(J.Flowerdew,2009),但是文中同样指出,尽管有些频率较高的词汇有许多不同的意义,有些很多意义在英语初学者课程中并未涉及到。

虽然词汇教学大纲是基于词频设计出的,它仍然兼顾这些词经常出现的语法环境,所以这并不意味着对语法教学的忽视,Sinclair(1991)就利用语料库证明了词汇在不同的词汇—语法环境中呈现出不同的词义。Willis(1990:38)同样给出了示例说明:Way是英语词汇中第三个出现频数最多的一个单词,在英语教学中起着关键的作用。当way表示“方向”的含义时,经常会出现在类似于A man asked me the way to St Paul’s’.的句子中,但是“方法”“途径”是way意义中被使用较多的,并多用在以下语法环境中:

The best way to...is to...

One way of_______ing...is to...

利用语料库可以发现词汇在不同语境下的多种词义,那么在EAP教学中,语料库同样能够帮助辨别不同学术体裁中词语运用的显著特点,那么在不同的学术领域,是否存在一系列普遍使用的核心词汇呢?下一章节将讨论这个问题。

3.词汇

在不同的学术文章、领域中是否存在一系列核心词汇的问题是学界争论的焦点之一。Coxhead(2000,2001)在包含有3 500万词汇,覆盖艺术、贸易、法律和科学四个不同学术领域的语料库中,对词族和词汇条目做了统计分析,提取了四个学术领域共有的词汇项目,制作出了学术词汇表(Academic Word List,AWL),从而支持了核心词汇假说,Paquot(2010)的研究也是对Coxhead研究成果的肯定。但是Hyland&Tse (2007)的研究则指出,不同学术领域有自己专有的词汇库,此外,还有一些如Chen&Ge(2007)的研究,他们基于语料库分析了专业学术英语语篇,将生成的专业学术英语词汇表与Coxhead的学术词汇表进行对照,发现专业学术英语词汇有特定的学科性质(Flowerdew,2012a)。因为不同的研究者选取的语料库不同,利用的分析软件工具也不一样,出现不一致的研究结果也在情理之中,因此,这一问题仍旧是该领域的争端之一(Flowerdew,2012c)。目前,针对譬如in order to、on the basis of这样的短语研究情况就很复杂,再如Simpson-Vlatch&Ellis(2010)制作出的学术词汇惯用表(AFL)和Martinez&Schmitt(2012)起草的学术常用短语使用表都在一定程度上支持了Coxhead的学术词汇表研究,他们也指出一些出现频率较高的学术短语表达并不限制于某个领域的使用,尽管这一发现与5.1章节的研究结果不一致。

关于学术英语教学方面,Ward(2009)和Mudraya(2006)以工程教科书为研究对象,强调词汇的非专业的本质属性。原因主要在于:Mudraya发现有一系列词汇在文本中会高频率、大范围地出现。例如solution,更令其感到吃惊的是:在200万字的工程教科书语料中,solution的通用意义比它的专有意义使用得更加频繁。鉴于此,Mudraya引导学生注意solution的两种不同的意义。教学任务的示范见表1。

表1 关键词为solution的索引目录(Mudraya,2006:246)

学生任务:研究索引信息,查询solution两种意义的示例:①通用意义;②化学专有意义。

这样的教学设计理念植根于Sinclair(2004)的语言模型,即:语义是由与其搭配出现的语境决定的,而不存在于词本身。Mudraya的教学指导看起来似乎只关注于单个词汇,但学生被要求找出关键词的不同意义时,就需要在学习过程中横向和纵向地观察索引条目,因此,Mudraya的课堂有效展示了怎样对Coxhead学术词汇表词的研究延伸至对与其共现短语结构的研究。事实上,Coxhead(2008)也建议扩充学术词汇表,找出与它们经常共现、搭配的短语。下一节将介绍语言的构块性。

4.从词汇到短语,再从短语到词汇

书面语的学术英语,很显然不仅仅涉及单个词汇项目,也有短语。词汇项目的意义主要通过其搭配行为体现,而它们出现的频数(类符)则是了解词义表达的窗口(Wible&Tsao,2011:238)。这里词汇的搭配行为,即Hunston&Francis(2000)提出的“型式语法”,在上节Sinclair的词汇法中也有体现。学界对“短语”有不同的定义手段,但最重要的是,它包括“搭配”和“类联接”两种形式,其中“搭配”是一种常见的语言现象,而“类联接”却没有引起人们足够的关注,它是词汇语法范畴间的相互关系,与其搭配共现的主要是语法词而非一些实词。目前,语料库的研究中强调了对短语“类联接”方面的探讨。例如,Byrd(2007)研究了学术词汇表(AWL)中的require一词,发现required是词目require最常见的使用形式,其后主要衔接以下三种补语型式。需要注意的是,相比另外两种补语型式,required+不定式infinitive有明显较高的使用频数,这对学术英语教学大纲的编写有一定的启示作用。

required+不定式infinitive(most characteristic pattern)

required+that从句‘that’clause

required+名词短语noun phrase complement

Oakey(2005:178)也做了相似的研究,他从一系列经济学杂志中选取了1360篇学术文章,以AWL中的evaluate为分析对象,研究发现evaluate在主动和被动语态句子中呈现不用的短语型式(phraseological patterning)。一方面,三分之二比例的evaluate和不定式to型式出现在主动语态句子中,而且这个型式普遍和动词use的宾语不同的分析工具一起搭配使用,如This paper uses laboratory methods to evaluate whether price-fixing conspiracies break down....另一方面,当evaluate和use共同使用在被动语态句子中时,则出现较多可以搭配使用的名词型式,如model、objective、functions、ration、assumption、measures、test、approach等等。下面是一个完整的例句:

Marshallian producer and consumer surplus measuresare used to evaluate the welfare consequences of the given supply shift.

可以看出,以上两个对短语的研究都以单个词汇为出发点,我们同样可以从另外的语法型式出发,回到对词汇的研究中。正如Hunston&Francis(2000:31)所说的那样,Sinclair的理论本身就包含两种对立的研究方法,研究者可以通过单个词汇,一个接着一个地去探寻它所出现的不同短语型式,也可以通过计算机,直接产出一系列经常共现的词汇序列表。但是,语料库研究中要选取哪一种方法则具体取决于研究的目的和范围,就像笔者(2012a)曾说到的,在一个专用语料库中,较适合采用词汇关键词的研究方法,原因之一在于Sinclair(2005)指出,专业领域的词汇在词频表上的分布有着显著的不同,当然,有些研究不排除使用以短语型式为关键词的方法合适,尤其对于那些学术水平比较高,有自己特定研究领域的研究生,后者也许比较适合。

Lee&Swales(2006)在所带的博士研究生要求下,制作出了一个工作任务表,有以下几种经典的分析模式,集中体现了基于语料库进行教学时经常运用到的归纳﹑提出—验证假设方法的精神:

(1)猜想﹑排列词频表,尝试列举可能出现的词汇形式,然后在语料库中加以验证。

(2)检查一些给定的句子,改正有错误的地方。

(3)每一组句子中,哪一个表达方法更准确,为什么?

其中有一项工作任务是在学生要求下设计,加强ADJ/N/V for V-ing(如: appropriate for modeling...;devices for storing...;suited for studying...)这一语法型式的使用。研究参与者被要求找出在学术英语写作中,哪一种语法型式最易和for V-ing搭配使用,并排列以上三种可能使用的顺序(答案是名词、形容词、动词),因此,通过让学生仔细观察语法型式以及频率统计表,较好展示了在学习中怎样通过语料库发现学术英语写作中常用的短语表达式。这样的研究任务是以语法型式为出发点,词汇为最终落脚点的有效例证。

在这里,笔者要暂时离题,谈一下在课程设计中经常遇到的频率统计表的使用问题,尽管它对教学实践有重要的作用,但要清楚这并不是教学的最终目的。早在20世纪90年代,Widdowson(1991)对一项完全基于词汇频率表设计出的教学大纲提出了质疑,并在几年以后,重申了自己的观点:“不管语言词汇和短语在实际语境中的应用情况如何,它们本身覆盖范围广、生成能力强的特点,能够有效促进学习者学习进程。在学习者某一个特殊的学习阶段,这些词汇和短语是教学过程中重要﹑核心﹑优选的原型结构。”

Granger(2011:135)目前对该问题也作了一番讨论,他指出,语言使用频率在教学中的参考价值应当和其他三种因素结合起来加以权衡:个体差异、可学性、可教性。其中,个体差异包括学习者的年龄﹑语言天赋﹑学习动机和学习类型等因素;可学性多涉及学习者的心理方面,如对信息的可记忆﹑处理﹑存储和提取程度;可教性是指教师对语言有选择性的教授情况,比如虽然某些词汇的隐喻意义使用较多,但选择它的基本意义作为教学内容则较合适。

在对学术英语写作教学方面的研究中,有些不仅仅考虑了语言实际使用频率结果,而且结合了可学性和可教性因素。Jones&Schmitt(2010)就进行了这样的创新研究,他们将基于语料库得出的、关于专用学术英语词汇和短语研究成果运用到国际法和创业学的教学中。值得注意的是,他们将重要的词划分为专业性,如regional body;口语性,如gut feeling和通用性的,如take the initiative,这一成果既是语料库的统计结果,也考虑到了研究报告者和学生的输入情况。另外的一些研究,像Ellis、Simpson-Vlach&Maynard(2008)和Simpson-Vlach&Ellis(2010),他们在研究当中,考虑了高频率的词汇﹑短语型式,心理语言凸显性及从教师的角度看,与教学相关的多方面因素,得出了一系列在教学中使用的惯用语,例如in terms of、in order to。这里提到的惯用语,也指“词块”,是语料库重要的一个研究领域。接下来一个章节将从功能的角度,介绍怎样界定和教授语言的词块﹑短语方面。

5.从词块、短语到功能

5.1 词块

词块是从功能的角度被划分出的,是“短语”的一种常见类型。词块是由频率驱动方法自动产生的三到四个单词组成的连续序列。(Biber,Conrad,Cortes,2004; Cortes,2004;Hyland,2008)。Biber(2006:134)指出,能作为词块的单词序列通常在学术文本中,每百万字至少会出现40次。例如,Hyland将词块划分为以下三种功能范畴:研究型、语篇型和参与者型(Hyland,2008:13-14):

研究型:帮助写作者建构现实世界的各项活动、经验,如:

步骤(the use of the、the operation of the)

定量(the magnitude of the、the surface of the)

语篇型:有助于语篇及意义组织的信息说明,如:

构建标记:组织话语延伸的文本标记(in the present study、in the next section)

框架标记:通过限制条件陈述说明(in the case of、with respect to the)

参与者型:关注文本的作者或读者,如:介入特征:直接指向读者(it should be noted that、it can be seen)

早期Jones&Heywood(2004)和Cortes(2006)在研究中曾提及词块教学,Eriksson (2012)作了进一步总结说明。Eriksson在自己的生物化学博士研究生的语料库教学中,用了两个规模相近的小型语料库(约10万字)。一个语料库是由25篇生物化学和生物技术领域的文章组成;另一个语料库则是由六个博士生的书面文本组成。他对用于教学中的“词块”选择首先是基于对这两个语料库中的词块比较而得。而那些在出版书中出现但未在博士生文本中出现的词块在教学中应用观察。值得注意的是,Eriksson也参阅了Hyland(2008)的词块表(从生物学和工程学文本中得出)以及Simpson-Vlach和Ellis的(2010)的学术惯用语列表(AFL)。Eriksson指出,通过对比发现,如果仅用Hyland的词块表和AFL,有一半以上的专用词块不能被发现,因此他强调词汇的专业性特点。与Lee&Swales(2006)的研究有相同之处的是,Eriksson利用可免费获得的软件AntConc(Anthony 2010),同样采用了验证假设和归纳法。

修饰断言

1)你如何表达或者暗示不确定性,并且/或者你如何避免在文本中使用过于强硬的主张(例如,如果你知道你的结果没有定论)?

2)从你的学科角度看,你认为下面哪些词块常用于文本中?

•it looks like

•may be due to

•appear(s)to be

•might be able to

•results suggest that

•at least in

3)在软件AntConc中打开文本,搜索上述词块

奇怪的是,虽然有不少有关词块的研究,但除了上述提到的一些,文献中关于词块的教学研究数量很少。正如Byrd&Coxhead(2010)所指出,这种教学应用少的一个原因可能是因为缺乏词块使用的语境信息。他们研究了在相关文献提到的词汇列表中大多会出现的一个词块:on the basis of。通过他们的深入分析,研究发现在AWL列表中出现的该词块有三种可能的使用方式:

(1)置于句子开头,用来表明过渡和实施一个进程的方法,如:

On the basis of his analyses、Clyne also identifies a number of...

(2)在被动句或从句中作原因状语,用来解释作出决定或处理数据的方式,如: Meanwhile、unskilled and unassisted migrants、most notably from Southern Europe were accepted on the basis of nomination by relatives in Australia...

(3)与状语从句一起加强或减弱话语力,如:

Only for L.notosaurus was the decision on its specific distinction made solely on the basis of allotropic data.(Byrd、Coxhead,2010:53-54)

5.2 短语

基于语料库驱动的方法研究学术文章的主要修辞功能通常以单个词汇为出发点,理应延伸到短语方面。早期遵循此原则是Thurstun和Candlin(1998a,b)的关于一般学术英语(EGAP)写作的研究。他们基于一定的语料,在每一个修辞功能(话题陈述、参考文献、研究综述)范围之内,按以下四步的活动索引产出一系列的突显词汇(如issue,claim,identify)。这样就激励学生首先关注于词汇意义和型式。

步骤1:查看含有关键词及其周围词的索引行,思考它们的意义。

步骤2:根据索引,完成任务,熟悉关键词的语法型式。

步骤3:不对照索引,自行练习该语法型式。

步骤4:用该语法型式写一篇完整的文章,实现一定的论文修辞功能。(Thurstun、Candlin,1998b:272)

步骤1要求学生检测索引出的关键词并反思它在上下文中如何使用。例如,词目issue常用来陈述写作主题,如:The issue for consideration is the selective treatmentof disabled new-born babies。步骤2要求详细地检测关于issue的索引信息,从词汇到语法型式。学生要对issue前的形容词进行分类,这个任务不仅需要关注搭配,而且需要注意语义关联(语义偏好),即issue常被限制性的语义集所修饰,如重要性或量化性词。

步骤2:熟悉(关键词issue)

(1)哪类形容词常用在issue之前?

组一(学科领域)economic issue

组二(类型/重要性)key issue

组三(数量)single issue

(2)哪些介词常跟在issue后面?(Thurstun&Candlin,1998a:1-3)

关于学术英语写作中以功能为导向的探究在Charles(2007,2011)和Bloch (2008,2009,2010)的研究中有所体现。Bloch的任务是基于学术写作中动词使用研究的语料库,目标是在校本科生。然而,不同于上文提到的Thurstun和Candlin建议的纸笔任务,Bloch基于语料库的任务则是通过自己专门设计的人性化程序访问。该界面允许学生们选择对一个特定的单词或依概念进行搜索,单个单词搜索每个界面显示的索引条目限制为20个,而依概念搜索则是通过五个提示类别来引导学生们,如下关于“做出断言”的修辞目的:

思考你想做的断言,然后回答下列问题:

Do you want an Integral or Non-integral example?

Do you want an Informative or a Descriptive example?

Do you want an example from the point of view of the author you are citing or yourself as the writer?

You can express an attitude towards the truth of a claim:

(1)Positive(2)Negative(3)Unclear

You can modify or hedge how strong that attitude is:

(1)Strong(2)Moderate(3)Weak

(Bloch,2008:199)

如果我们将Bloch关于“做出断言”的习题类型与Eriksson(2012)从“词块”角度做“修饰断言”的类型进行比较的话,可以看出语料库能为各种活动提供借鉴。然而,如何使用语料库主要取决于学生的水平和语言能力。Eriksson的博士生是高级学习者,他们参阅自己学科领域——生物化学的语料库,亲自动手的检索活动适合这类学生。与此同时,Bloch为配合水平低一点的在校本科生采用多种方法,控制学术英语写作的原始数据语料库,如:限制索引输出至20条,最重要的是,让学生通过修辞功能进行检索,这为学生们提供检索关键词是非常有用的。有些反对水平较低的学生使用语料库的研究者认为这类学生往往不知道要搜索哪些关键词,因此,控制此类教学的条件,有效克服了这个障碍。

另一位与Eriksson相似的语料库研究者是Charles(2007,2011),他关注的目标是自己开展语料活动的博士生。与Bloch和Eriksson一致的是,在搜集了有50万字的论文语料的条件下,Charles的活动也是基于她的语料分析,从而强调语料库研究与教学之间的密切联系。

Charles(2007:296)设计给出亲自动手的任务以让学生们熟练维护自己文章被批判的基本功能。首先,学生用上下文术语appear*/seem*may来搜索位于句首的while,在同一句子中,这个术语的单词跨度为八个单词。这项搜索表明,位于句首的while用来构建一个让步命题,它默认命题的重要性等级,强调作者的辩护。这两步模式,即臆想批判→辩护,通过显性让步、对比和论证来实现,如表2所示。

Charles研究的另一个特点是,她首先通过使用自上而下的方法接近这两部分功能(Durrant、Matthews-Aydinli,2011),他们辩护用“功能为先”的方法分析惯用的语言(即措辞学)。给学生们一套笔纸的工作活动,以让他们感知这两个部分功能的扩展性话语。接着,她通过自下而上的方法来补充这些活动,让学生们搜索语料库来识别典型词汇—语法型式实现这些功能。其他的语料库语言学家往往以词汇项目为出发点,审视语篇中整体语步结构模式的功能(详解见引言部分),这将是下一节谈论的重点。

表2 臆想批判与作者辩护(Charles,2007:294)

6.从功能到语步结构

针对语步结构型式的研究与教学应用大多以论文和法律文本为研究对象,如正式论文。其主要原因之一是它们能够显现相对典型的语步结构模式,正如CARS模式(见第一章节)。其次,文本的可及性(Flowerdew,2004)。例如,编译一个研究论文语料库比编译一个博士论文语料库要容易得多,因为后者有一定的版权限制,是属于“半封闭”体裁(Swales,2004)。J.Flowerdew&Forest(2009)研究了博士生的论文,他们将Swales(1990:141)的CARS(create-a-research-space)模式开始运用到应用语言学领域的博士论文的引言部分,之后运用到文献综述部分。需要注意的是,他们以research为关键词,从自下而上的视角研究,然后探究research的不同用法所对应的某一语步结构。例如,在“表明研究空白”这一语步模式时,research有两种常见的语法型式:There has been little research/little research has been done;Further research is needed/called for。

Kanoksilapathan(2005,2007)调查研究了60篇生物化学研究论文语料库中语步对应的词汇语法特征。Kanoksilapathan首先区分了研究论文重要部分的主要语步。例如,以下是关于results在结论部分运用的四种主要语步类型:

语步8:再次陈述研究方法问题

语步9:论证研究方法问题

语步10:呈现研究结果

语步11:评论研究结果

因为语步又可分为步骤,所以“评论研究结果”语步就可分为以下5个步骤:

语步11:评论研究结果

步骤1:解释结果

步骤2:概括结果

步骤3:评估结果

步骤4:陈述研究缺陷

步骤5:总结

(Kanoksilapathan,2007:76-81)

然而,Kanoksilapathan研究的第二个阶段显然不同于J.Flowerdew和Forest,她采用多种方法,将语步结构与Biber(1988)的多维度分析相结合,识别语篇的功能维度。例如Kanoksilapathan的“评估立场”对应于Biber的维度4,即“明示表达论点”。Biber提出的系统是依据语法项来划分维度的,如补语从句中“that”或外位语“it”结构。而Kanoksilapathan在即时文本语境中审视这些词汇特征,从而揭示了作者通过词汇表达评价或态度,如“It is interesting that the experiments in this paper were all carried out using assays for genetic interference in...”。总之,Kanoksilapathan的研究采用从自上而下再到自下而上的方法,其中词汇确实发挥一定的作用,但这里的词汇更接近于Halliday的“词汇”观点,认为词汇是最精细的语法。

关于基于语料库的教学应用,Bianchi和Pazzaglia(2007)提出了一套活动帮助学生用英文写心理学研究性论文。首先,要求学生把自己选择的书面文章分成“语步”;然后,用作者设计的功能和元交际编码系统对它们进行注释;最后,检测与研究相关的关键词索引,如study/studies、experiment/experiments、literature and research/ researches。同时,学生们还审查了这些关键字的词汇语法环境,并指出其中的动词及其时态用法,如The aim of this research was to analyse;in this research we analysed由此可以看出,该语料库的应用反映了上述J.Flowerdew和Forest自下而上的研究方法,以关注关键词为出发点。

另一项教学应用研究是由Chang和Kuo(2011)开展的,他们基于60篇计算机科学研究论文的语料库,专门设计EAP课程,帮助研究生撰写研究论文。事实上,如Bloch在上节所述,他们提出的课程依赖于一个专门构建的网站,使用Moodle,在网上呈现教学材料。在线EAP平台围绕研究文章的主要部分(即引言、语料和方法,研究发现和讨论、结论和摘要)来组织,这个平台由信息结构单元和语言使用单元组成。该网站的信息结构单元基于作者之前的体裁分析,呈现了修辞语步与常用语步模式。而该网站的语言使用单元支持像字典等在线写作工具,同时提供词语搭配工具与检索工具的链接。

上述Bianchi&Pazzaglia(2007)、Chang&Kuo(2011)的教学应用都采用了研究论文语料库帮助研究生写研究性论文,此类语料库也被用来帮助博士生写论文(Thompson&Tribble,2001;Charles,2011)。然而不得不承认的是,这两类相关论文的修辞结构存在一些差异。正确地使用研究论文对论文写作教学也是有用的。关于论文讨论部分的写作,笔者采用了可免费获取的香港理工大学语料库(CRA)(Lin&Evans,2012),该语料库涵盖39个学科,收录了约500万字。值得注意的是,CRA使用了会考虑位置和选区变化的搜索引擎ConcGram。

表3 法律案例中动词所表达的语步类型(Bhatia et al.,2004:214)

举一个例子,笔者设计了以下验证假设的任务,以让学生们熟悉词汇短语的评价结果。从词条“surprising”开始,笔者要求学生们写出包含此单词的句子,下面就是学生所写的一个例句:“It is surprising(to find)that...”然而,语料库数据显示,这个单词的首选模式带有负极性,如:This phenomenon is not surprising as such、as they also appear in polymer solutions...;This is not surprising as the CANE model...,从而呼应了Halliday(1991)对不同动词极性分布不均语料的论证,尽管本例所涉及的是形容词。另外,“surprising”索引行揭示了此词条的表达式“given that”的共现索引。这些实证数据表明,语言有一定的短语组块倾向,它取决于所研究的文本体裁。

同时,如表3所示,Bhatia、Langton&Lung(2004)研究表明,在具有高度规约性的法律案件文本中,在语步结构的层面上,动词的选择是如何实现的。可以看到,看似同义动词如dismiss和reject对不同的语步结构有着明显的偏好,如Bhatia et al.(2004)所言,向法律专家们咨询这类动词的语用差异是必要的,而语料库(通常)无法提供此类信息。

法学院的Problem-Question写作体裁与法律案件高度相关,它是法律专业学生适应专业实践的一种方式。Problem-Question写作体裁中,法律专业的学生需查明一系列问题及相关法律,建立并展开论证,就可能的结果得出结论,并证明演绎推理,而分析法律案件也需要这些技能。正如Bhatia et al.(2004)所指,演绎推理在这类体裁中扮演重要角色,需要掌握各种避险技巧,这对事实应用部分尤为重要。为让法律专业的学生认识到这点,Bhatia et al.建议让他们依据语步结构使用基于法律案例索引产生的工作表,通过功能、形式与语法来辨别并区分选词。

表4 开场语步中充当标记词(Weber,2001:17)

正式论文是另一种常见的合格体裁(Weber,2001),如前面所述,最初采用Charles、Bianchi&Pazzaglia的修辞活动,首先引导Weber的学生们全文阅读伦敦大学法学学士学位考试本族语学生所写论文,并区分出一些典型的修辞特征,如:区分或界定参与此案的法律原则。接着,要求这些学生识别出所有与这些特征相关联的词汇表达,之后学生们再参照法律论文语料库来验证他们之前所标注的型式。换言之,就是验证他们的假设,并找出词汇语法表达的规律。研究发现,各种结构中的词项诸如assume、consider、regard和issue在开场的语步中充当标记词,用于引入当前案件,之后再界定,如表4所示。

以上所有研究通过将语料库分析与文体语步结构分析相结合,表明语料库不再只是句子层面的词汇语法模式所参照使用(Flowerdew,2005),而且能够充分被用来研究语篇(Handford,2010;Flowerdew,2012b)。

7.结语

本篇论文综述了当前基于语料库的学术英语写作研究,包括词汇、词组、修辞功能和Swales的语步结构体裁分析,并讨论了这些研究是如何影响教学。研究发现,语料库研究与教学之间有紧密联系,两者相互作用,如在文章开篇时,笔者就强调词汇在语料库中发挥着重要作用,词汇常作为语料库研究的切入点,但这也并非总是如此。同时,笔者也讨论了很多研究都会采用自下而上和自上而下的两种方法相结合来对语料进行分析。尽管本篇论文概述的大多数关于EAP的语料库研究都是小型研究项目,但这种情况正在改变中,目前涵盖不同体裁、学科以及不同水平学生写作的项目已经完成。我们可以看到MICUSP(密歇根高年级学生论文语料库)(Römer&Brook O’Donnell,2011)以及BAWE(英国学术英语书面语语料库)(Nesi 2011,Nesi&Gardner,2012)。另一个值得注意的大型项目则是Cotos等(2012)收录了900篇研究论文的语料库,它涵盖了30个学科,主要研究跨学科问题。毫无疑问,这些语料库的研究发现将为EAP领域的研究和教学提供深刻见解,并做出重要贡献。

注释:

①Flowerdew,L.Corpus-Based Research and Pedagogy in EAP:From Lexis to Genre[J].Language Teaching,2015,48(1):99-166.

[1]Anthony,L.Antconc 3.2.1W[EB/OL].WWW.Antlab.Sci.Waseda.Ac.Jp/Software.Html,2010.

[2]Bhatia,V.K.,N.Langton&J.Lung.Legal Discourse:Opportunities and Threats for Corpus Linguistics[C]//Connor,U.&T.Upton.Discourse in the Professions:Perspectives From Corpus Linguistics.Amsterdam:John Benjamins,2004:203–231.

[3]Bianchi,F.&R.Pazzaglia.Student Writing of Research Articles in A Foreign Language:Metacognition and Corpora[M].Amsterdam:Rodopi,2007:259–287.

[4]Biber,D.Variation Across Speech and Writing[M].Cambridge:Cambridge University Press,1988.

[5]Biber,D.University Language:A Corpus-Based Study of Spoken and Written Registers[M].Amsterdam:John Benjamins,2006.

[6]Biber,D.,S.Conrad&V.Cortes.If You Look At…:Lexical Bundles in University Teaching and Textbooks[J].Applied Linguistics,2004,25(3):371–405.

[7]Biber,D.,S.Johansson,G.Leech,S.Conrad&E.Finegan.The Longman Grammar of Spoken and Written English[M].London:Longman,1999.

[8]Bloch,J.Technologies in the Second Language Composition Class[M].MI:University of Michigan Press:Ann Arbor,2008.

[9]Bloch,J.The Design of An Online Concordancing Program for Teaching About Reporting Verbs[J].Language Learning&Technology,2009,13(1):59–78.

[10]Bloch,J.A Concordance-Based Study of the Use of Reporting Verbs As Rhetorical Devices in Academic Papers[J].Journal of Writing Research,2010,2(2):219–244.

[11]Byrd,P.Collocations and Recurrent Phrases in the Academic Word List[R].Paper Presented At 41st Annual TESOL Convention,Seattle,Washington,2007.

[12]Byrd,P.&A.Coxhead.‘On the Other Hand’:Lexical Bundles in Academic Writing and in the Teaching of EAP[R].University of Sydney Papers in TESOL,2010(5):31–64.

[13]Chang,C.-F.&C.-H.Kuo.A Corpus-Based Approach to Online Materials Development for Writing Research Articles[J].English for Specific Purposes,2011(30):222–234.

[14]Charles,M.Reconciling Top-Down and Bottom-Up Approaches to Graduate Writing:Using A Corpus to Teach Rhetorical Functions[J].Journal of English for Academic Purposes,2007,6(4):289–302.

[15]Charles,M.,A.Frankenberg,Garcia,L.Flowerdew&G.Aston.Using Hands-On Concordancing to Teach Rhetorical Functions:Evaluation and Implications for EAP Writing Classes[C]// Frankenberg-Garcia,A.,L.Flowerdew&G.Aston.New Trends in Corpora and Language Learning.London:Continuum,2011:26–43.

[16]Chen,Q.&C.Ge.A Corpus-Based Lexical Study On Frequency and Distribution of Coxhead’s AWL Word Families in Medical Research Articles[J].English for Specific Purposes,2007,26(4): 502–514.

[17]Cheng,W.,C.Greaves&M.Warren.From N-Gram to Skipgram to Concgram[J].International Journal of Corpus Linguistics,2006,11(4):411–433.

[18]Connor,U.&T.Upton.Discourse in the Professions:Perspectives From Corpus Linguistics[M].Amsterdam:John Benjamins,2005.

[19]Cortes,V.Lexical Bundles in Published and Student Disciplinary Writing:Examples From History and Biology[J].English for Specific Purposes,2004(23):397–423.

[20]Cortes,V.Teaching Lexical Bundles in the Disciplines:An Example From A Writing Intensive History Class[J].Linguistics and Education,2006(17):391–406.

[21]Cotos,E.,S.Huffman,S.Link,T.Paben&A.Saricaoglu.Cross-Disciplinary Move Schema for Research Article Methods Sections[R].Paper Presented At AAAL Conference,Boston,MA,2012.

[22]Coxhead,A.A New Academic Wordlist[J].TESOL Quarterly,2000,34(2):213–238.

[23]Coxhead,A.Phraseology and English for Academic Purposes:Challenges and Opportunities[C]// F.Meunier&S.Granger..Phraseology in Foreign Language Learning and Teaching.Amsterdam: John Benjamins,2008:149–161.

[24]Coxhead,A.The Academic Word List 10 Years On:Research and Teaching Implications[J].TESOL Quarterly,2011,45(2):355–362.

[25]Coxhead,A.&P.Nation.The Specialised Vocabulary of English for Academic Purposes[C]//J.Flowerdew&M.Peacock.Research Perspectives On English for Academic Purposes.Cambridge: Cambridge University Press,2001:252–267.

[26]Durrant,P.&J.Matthews-Aydinli.A Function-First Approach to Identifying Formulaic Language in Academic Writing[J].English for Specific Purposes,2011,30(1)58–72.

[27]Ellis,N.,R.Simpson-Vlach&C.Maynard.Formulaic Language in Native and Second Language Speakers:Psycholinguistics,Corpus Linguistics and TESOL[J].TESOL Quarterly,2008,42(3): 375–396.

[28]Eriksson,A.Pedagogical Perspectives On Bundles:Teaching Bundles to Doctoral Students of Biochemistry[C]//J.Flowerdew&M.Peacock.Input,Process and Product:Developments in Teaching and Language Corpora.Brno,Czech Rep.Masaryk University Press,2012:195–211.

[29]Flowerdew,J.Corpora in Language Teaching[C]//M.Long&C.Doughty.The Handbook of Language Teaching.London:Wiley-Blackwell,2009:327–350.

[30]Flowerdew,J.&R.Forest.Schematic Structure and Lexico-Grammatical Realization in Corpusbase Genre Analysis[C]//M.Charles,D.Pecorari&S.Hunston.Academic Writing:At the Interface of Corpus and Discourse.London:Continuum,2009:15-36.

[31]Flowerdew,L.The Argument for Using Specialised Corpora to Understand Academic and Professional Language[C].//U.Connor&T.Upton.Discourse in the Professions:Perspectives From Corpus Linguistics.Amsterdam:John Benjamins,2004:11–33.

[32]Flowerdew,L.An Integration of Corpus-Based and Genre-Based Approaches to Text Analysis in EAP/ESP:Countering Criticisms Against Corpus-Based Methodologies[J].English for Specific Purposes,2005(24):321–332.

[33]Flowerdew,L.Using Corpora for Writing Instruction[C].//A.O’Keeffe&M.Mccarthy.The Routledge Handbook of Corpus Linguistics.London:Routledge,2010:444–457.

[34]Flowerdew,L.Corpora and Language Education[M].London:Palgrave Macmilla,2012a//Flowerdew,L.Corpus-Based Discourse Analysis,2012b//J.P.Gee&M.Handford.The Routledge handbook of Discourse Analysis.London:Routledge,2012:174–187.

[35]Flowerdew,L.English for Academic Purposes[C]//C.Chapelle.The Encyclopedia of Applied Linguistics.Oxford,UK:Wiley-Blackwell,2012c.

[36]Frankenberg-Garcia,A.,L.Flowerdew&G.Aston.New Trends in Corpora and Language Learning.London:Continuum,2011.

[37]Granger,S.From Phraseology to Pedagogy:Challenges and Prospects[C]//T.Herbst,S.Faulhaber&P.Uhrig.The Phraseological View of Language:A Tribute to John Sinclair.Berlin:De Gruyter Mouton,2011:123–146.

[38]Greaves,C.Concgram 1.0:A Phraseological Search Engine[M].Amsterdam:John Benjamins,2009.

[39]Halliday,M.A.K.Corpus Studies and Probabilistic Grammars[C]//K.Aijmer&B.Altenberg.Advances in Corpus Linguistics.Amsterdam:Rodopi,1991:30-43.

[40]Halliday,M.A.K.The Spoken Language Corpus:A Foundation for Grammatical Theory[C]//K.Aijmer&B.Altenberg.Advances in Corpus Linguistics.Amsterdam:Rodopi,2004:11–38.

[41]Handford,M.What Can A Corpus Tell Us About Specialist Genres?[C]//A.O’Keeffe&M.Mccarthy.The Routledge Handbook of Corpus Linguistics.London:Routledge,2010:255–269.

[42]Hunston,S.&G.Francis.Pattern Grammar[M].Amsterdam:John Benjamins,2000.//Hyland,K.As Can Be Seen:Lexical Bundles and Disciplinary Variation[J].English for Specific Purposes,2008,27(1):4–21.

[43]Hyland,K.&P.Tse.Is There An‘Academic Vocabulary’?[J].TESOL Quarterly,2007(41): 235–253.

[44]Jones,M.&S.Haywood.Facilitating the Acquisition of Formulaic Sequences:An Exploratory Study in An EAP Context[C]//N.Schmitt.Formulaic Sequences.Amsterdam:John Benjamins,2004:269–292.

[45]Jones,M.&N.Schmitt.Developing Materials for Discipline-Specific Vocabulary and Phrases in Academic Seminars[C]//N.Harwood.English Language Teaching Materials:Theory and Practice.Cambridge:Cambridge University Press,2010:225–250.

[46]Kanoksilapathan,B.Rhetorical Structure of Biochemistry Research Articles[J].English for Specific Purposes,2005,24(3):269–292.

[47]Kanoksilapathan,B.Rhetorical Moves in Biochemistry Research Articles[C]//D.Biber,U.Connor&T.Upton.Discourse On the Move.Amsterdam:John Benjamins,2007:73–119.

[48]Lee,D.&J.Swales.A Corpus-Based EAP Course for NNS Doctoral Students:Moving From Available Specialised Corpora to Self-Compiled Corpora[J].English for Specific Purposes,2006 (25):56–75.

[49]Lin,L.&S.Evans(2012).Structural Patterns in Empirical Research Articles[J].English for Specific Purposes,2012(31):150–160.

[50]Martinez,R.&N.Schmitt.A Phrasal Expression List[J].Applied Linguistics,2012,33(3):299–320.

[51]Meunier,F.,S.De Cock,G.Gilquin&M.Paquot.A Taste for Corpora[M].Amsterdam:John Benjamins,2011.

[52]Meunier,F.&S.Granger.Phraseology in Foreign Language Learning and Teaching[M].Amsterdam:John Benjamins,2008.

[53]Mudraya,O.Engineering English:A Lexical Frequency Instructional Model[J].English for Specific Purposes,2006,25(2):235–256.

[54]Nation,I.S.P.Learning Vocabulary in Another Language[M].Cambridge:Cambridge University Press,2001.

[55]Nesi,H.,A.Frankenberg-Garcia,L.Flowerdew&G.Aston.BAWE:An Introduction to A New Resource[M].Cambrigge:Cambridge University,Press,2011:213–228.

[56]Nesi,H.&S.Gardner.Genres Across the Disciplines:Student Writing in Higher Education[M].Cambridge:Cambridge University Press,2012.

[57]Oakey,D.Academic Vocabulary in Academic Discourse:The Phraseological Behaviour of EVALUATION in Economics Research Articles[C]//E.Tognini Bonelli&G.Del Lungo Camiciotti.Strategies in Academic Discourse.Amsterdam:John Benjamins,2005:169–183.

[58]Paquot,M.Academic Vocabulary in Learner Writing[M].London:Continuum,2010.

[59]Römer,U.&M.Brook O’Donnell.From Student Hard Drive to Web Corpus(Part 1):The Design,Compilation and Genre Classification of the Michigan Corpus of Upper Student Papers (MICUSP)[J].Corpora,2011,6(2):159–177.

[60]Simpson-Vlach,R.&N.Ellis.An Academic Formulas List:New Methods in Phraseological Research[J].Applied Linguistics,2010,31(4):487–512.

[61]Sinclair,J.Mch.&A.Renouf.A Lexical Syllabus for Language Learning[C]//R.Carter&M.Mccarthy.Vocabulary and Language Teaching.London:Longman,1988:140–160.

[62]Sinclair,J.Mch.Corpus,Concordance,Collocation[M].Oxford:Oxford University Press,1991.

[63]Sinclair,J.Mch.New Evidence,New Priorities,New Attitudes[C]//J.Sinclair.How to Use Corpora in Language Teaching.Amsterdam:John Benjamins,2004:271–299.

[64]Sinclair,J.Mch.The Lexical Item[C]//E.Weigand.Contrastive Lexical Semantics,Amsterdam: John Benjamins,1999:1-24.

[65]Sinclair,J.Mch.Corpus and Text:Basic Principles[C]//M.Wynne.Developing Linguistic Corpora:A Guide to Good Practice.Oxford Text Archive.Http://Ahds.Ac.Uk/Linguistic-Corpora/,2005:1–21.

[66]Stubbs,M.Language Corpora[C]//A.Davies&C.Elder.The Handbook of Applied Linguistics.Malden,MA:Blackwell,2004:106–132.

[67]Swales,J.Genre Analysis[M].Cambridge:Cambridge University Press,1990.

[68]Swales,J.Research Genres[M].Cambridge:Cambridge University Press,2004.

[69]Thompson,P.&C.Tribble.Looking At Citations:Using Corpora in English for Academic Purposes[J].Language Learning&Technology,2001,5(3):91–105.

[70]Thurstun,J.&C.Candlin.Concordancing and the Teaching of Vocabulary of Academic English[J].English for Specific Purposes,1998b,17(3):267–280.

[71]Thurstun,J.&C.Candlin.Exploring Academic English[M].Macquarie University:NCELTR,1998a.

[72]Ward,J.A Basic Engineering Word List for Less Proficient Foundation Engineering Undergraduates[J].English for Specific Purposes,2009(28):170–182.

[73]Weber,J.-J.A Concordance-and Genre-Informed Approach to ESP Essay Writing[J].ELT Journal,2001,55(1):14–20.

[74]Wible,D.,N.L.Tsao,Towards A New Generation of Corpus-Derived Lexical Resources for Language Learning[C].//F.Meunier Et Al.Phraseology in Foreign Language Learning and Teaching.Amsterdam:John Benjamins,2011:237–255.

[75]Widdowson,H.G.Defining Issues in English Language Teaching[M].Oxford:Oxford University Press,2003.

[76]Widdowson,H.G.The Description and Prescription of Language[C].//J.E.Alatis.Linguistics and Language Pedagogy:The State of the Art.Washington,DC:Georgetown University Press,1991:11–24.

[77]Willis,D.Rules,Patterns and Words:Grammar and Lexis in English Language Teaching[M].Cambridge:Cambridge University Press,2003.

责任编辑:朱晓云

Corpus-based Research and Pedagogy in EAP: From Lexis to Genre

Lynne FLOWRDEWtrans.by ZHAN Hongwei,et al.

This plenary paper showcases the tight links between corpus research and pedagogic application to written discourse in English for Academic Purposes(EAP).It first explicates Sinclair’s concept of the‘lexical approach’,then discusses studies which focus on individual lexical items,phraseology(including lexical bundles)and rhetorical functions in discourse.It further goes to exam studies that combine Swalesian move structure analysis with corpus analysis.This whole paper highlights the importance attached to lexis in both corpus research and pedagogic applications of corpus findings in the realm of written discourse in EAP,covering both general and more specific purposes.

corpus;written discourse in English for academic purposes;pedagogy;lexis

詹宏伟,男,江西瑞昌人,杭州师范大学外国语学院副教授,博士,主要从事应用语言学研究。张霞,女,河南南阳人,杭州师范大学外国语学院研究生,主要从事应用语言学研究。吴龙凤,女,安徽安庆人,杭州师范大学外国语学院研究生,主要从事应用语言学研究。

猜你喜欢
词块语料库短语
《语料库翻译文体学》评介
词块在英语写作教学中的应用
英语专业学生与本族语名人演讲中词块使用特点探究
高中英语词块教学现状调查研究及应用策略分析
《健民短语》一则
词块在初中英语写作教学中的应用研究
语篇元功能的语料库支撑范式介入