博士研究生语料库数据驱动式ESP 词汇教学∗

2020-08-24 07:30刘萍曾文华刘座雄
外语学刊 2020年1期
关键词:博士生语料库检索

刘萍 曾文华 刘座雄

(华中农业大学,武汉430070)

提 要:“双一流”大学建设要求博士生具有较高的ESP 写作能力,而ESP 词汇是ESP 教学的瓶颈。 鉴于此,本研究尝试在农科博士生ESP 教学中引入自建的农科英语语料库,建构并运行数据驱动式ESP 词汇教学模式,引导学生利用语料库的多种功能,对ESP 词汇进行形式、意义和用法的深度探讨。 历时性词汇测试证明数据驱动式ESP 词汇学习行之有效。 书面访谈揭示出ESP 语料库为掌握专业术语的缩写、词序、拼写形式、选词与搭配等提供有效的帮助,ESP 语料库成为ESP 词汇学习不可或缺的资源和工具,数据驱动学习被认为是“授人以渔”的学习方式,有利于提高学习者自主学习能力。 本研究对ESP 教学、ESP 语料库的建设、数据驱动学习的适用对象以及实施条件具有一定的启示意义。

1 引言

在世界一流大学和一流学科建设的背景下,国内越来越多的高校规定博士生在学期间必须发表高质量国际期刊论文才能毕业。 在此政策推进下,在国际期刊尤其是在SCI,EI 索引期刊上发表论文是我国理工科博士生求学期间的主要目标之一。 SCI 论文写作属于专业领域的英语写作,其语言属于专门用途英语(English for Special Purpo⁃ses,简称ESP),ESP 指与某种特定学科领域相关的英语,如医学英语、法律英语等。 为了满足高层次学习者对ESP 的学习需求,很多高校开设了ESP 课程,然而,ESP 教学面临的最大困难是ESP词汇。 ESP 词汇是某个学科领域所特有的、具有特定含义的词汇,语言教师对ESP 词汇往往不甚了解。 专业领域学术论文语料库汇集专业领域特定的词汇,展示业内专家在学术文本中对ESP 词汇真实、地道的使用情况,为ESP 词汇学习提供权威且专业的范本和样例,增进ESP 教学工作者和学习者对专业词汇知识的了解。 因此ESP 语料库为ESP 词汇学习带来新的契机。

2 理论基础和研究动态

2.1 语料库与ESP 词汇学习

语料库是基于大量真实文本建立起来的电子文本集合。 语料库在词汇学习中具有多种优势。首先,语料库集中提取目标词汇,允许其大量重复出现。 一语和二语习得研究都证实出现频率(oc⁃currence frequency)是语言习得的关键因素,多数词汇学习需要反复接触目标词汇,以便获得更多的输入并实现词汇量的增加(Ellis 2002:150)。其次,语料库展示目标词汇所在的语境,包括句子和文本。 词汇复杂而丰富的意义须要在该词与其他词共同构筑的短语、句子和文本中得以理解。语境化的词汇学习有利于多维度词汇知识的掌握,包括词汇的宽度、深度和流利度(苗丽霞2019:60),有利于获取词汇多方面的语言信息,诸如词汇的语义、句法、形态、搭配、体裁以及语篇信息等均可以通过语境呈现,特定语境对词汇意义的解读和构建都具有积极作用(邬菊艳 王文斌2019:13)。 专门用途英语语料库(以下简称ESP语料库)专门收集某一专业领域的电子文本,为ESP 学习提供专业领域内真实使用的语言材料,在ESP 词汇学习中优势明显:揭示学科高频词、展示ESP 词汇的搭配(collocation)、ESP 词串的使用(lexical bundles)、专业技术词汇和经常使用的半技术词汇(semi⁃technical vocabulary)、学科领域内作为元语言的连接词等(蔡基刚2018:12)。

2.2 数据驱动式ESP 词汇学习的研究动态

利用语料库资源、工具与方法进行的语言学习称为数据驱动学习(Data Driven Learning,简称DDL)。 这一概念由英国伯明翰大学的Johns(1991)提出,其主要思想为:学习者作为语言的研究者,通过观察语料库数据,概括和归纳语言使用现象,自我发现语法规则、意义表达及语用特征,它是一种探究式、发现式、自主式的学习方式。语料库语言学的发展与ESP 词汇教学研究息息相关。 数据驱动式ESP 词汇教学研究主要涉及:通过建立不同学科的小型语料库,发现真实学术文本中词汇和语法使用的偏好(Johns 1990);利用语料库生成专业英语词汇表,进行词汇意义和用法的辨析(Coxhead 2000);比较传统查词典词汇学习和基于语料库的词汇教学。 Boulton(2009)、Flowerdew(2010)和Huang(2014) 等学者的研究结果表明基于语料库索引行的词汇学习法的学习效果显著优于查词典词汇学习法(查词义,看例句)。 我国数据驱动式ESP 教学起步较晚,真正意义上的数据驱动ESP 词汇教学研究始于21 世纪初(韩金龙2003,张济华等2009),他们侧重于探讨ESP 语料库应用于ESP 词汇教学的可行性,旨在解决专业词汇缺乏的问题以及ESP 词汇教学中教师的角色定位等。

综观国内外研究,国外数据驱动式词汇教学的实证研究多聚焦于语料库索引行单一功能的应用,语料库多种功能在词汇教学中的综合应用及其效果仍有待探索。 国内在语料库数据驱动式词汇教学方面的研究多处于理论探讨层面,实践研究还不多见。 鉴于此,本研究尝试利用自建的ESP 语料库网络检索平台的多种功能,进行数据驱动式ESP 词汇教学的实践研究,旨在解决非英语专业博士生ESP 词汇教学的瓶颈问题。

3 语料库数据驱动式ESP 词汇学习的设计与实施

3.1 博士生的学习背景

本研究针对两个博士班(共61 人)的ESP 课程,设计并实施数据驱动式ESP 词汇教学。 ESP课程是其必修课,61 名博士生主要来自3 个农科专业方向:植物科学、动物科学和生命科学。 大部分博士生年龄在25 ~45 岁之间,他们均有一定的研究经历和较强的自主学习能力。 学校要求博士生发表1 ~2 篇专业领域的SCI 论文作为毕业条件,因此博士生ESP 词汇学习的动机很强。

3.2 农科英语论文语料库网络检索平台

利用农科大学各院系博士生导师提供的各自领域顶尖SCI 期刊论文文献,我们收集来源于生命科学、动物科学、植物科学、食品科学、水产科学、园艺林学等9 个学科英语母语者发表的SCI论文838 篇(共计5,537,109 词),创建了农科英语论文语料库,并上传至网络,建构了语料库网络检索平台(http:/ /aec.hzau.edu.cn),实现在WiFi条件下语料库资源的共享。

3.3 语料库检索技术培训和QQ 互动支持

语料库的检索需要一定的检索技术。 在数据驱动学习开始之前,教师对DDL 学习者进行语料库检索技术的培训。 教师在课内演示网络语料库检索平台(CQPweb)的多种功能,引导学生尝试如频数解析(frequency breakdown)、分布显示(distri⁃bution),搭配和语境信息功能,示范提取目标词汇的正则表达式的编写。 课后学生通过自学CQPweb 检索手册和4 次检索练习,基本掌握检索方法。 同时,还创建QQ 学习群,师生在线实时互动,讨论并解决DDL 学习过程中遇到的检索技术、数据解读,语言规律提炼诸多方面的问题。

3.4 传统词汇教学与数据驱动式词汇教学

语料库数据驱动式ESP 词汇教学是一种全新的教学理念与教学模式,它要求学习者利用语料库提供的数据,探索获取语言使用的规律,逐步形成从教师指导下的学习到学习者自主的学习模式。 它在教学步骤、教学方法和工具、目标词汇、教学材料、师生角色几个方面区别于传统词汇教学模式。 传统词汇教学采用3P (Presentation⁃Practice⁃Production) 教学法,包括“讲授—练习—应用”3 个步骤。 在课内,教师讲授目标词汇的词典释义、辨析、搭配用法,提供例句及词汇练习题的解答。 在课后,学生按照目标词汇大纲,通过查词典自学词汇,完成词汇练习。 传统词汇教学是一种自上而下的教学模式,以教师讲、学生听与练为主,目标词汇根据教师的经验确定或者采用统一的词汇教学大纲,词汇练习的设计多基于词典例句或人为生造的句子,与语境割裂。 数据驱动式ESP 词汇教学是一种自下而上、以学生为中心的教学模式。 课内部分主要包括“观察—讨论—结论—验证”教学步骤。 例如,采用数据驱动教学法辨析cause 与lead to 的含义差异时,教师不直接讲授,而是让学生在语料库中提取目标词汇,观察其语境,自己得出结论。 学习者通过观察cause 后 面 所 接 的 词damage/infection/disaster/death 等等,归纳出cause 带有贬义的结论。 数据驱动教学的目标词汇大纲来自ESP 语料库中生成的词表(经过去粗取精的加工处理),体现出ESP 词汇的专业性和特有性。 词汇练习和测试取材于ESP 语料库中业内专家真实使用的语言材料。

3.5 从引导式过渡到自主式的数据驱动学习

按照教师的干预程度,DDL 分为控制式、引导式和自由式(Johns 1991)。 鉴于博士生具有一定的探索式、发现式的自主学习能力,同时,他们也是初次接触语料库和数据驱动学习的概念,在DDL 实施之初,采用引导式DDL,教师引导分为3个环节:问题鉴别、数据分类、归纳总结(同上)。根据Nation(2001)对词汇知识的定义,词汇知识包括形式、意义和用法3 个方面,在引导式DDL阶段,教师在课堂上组织学生就目标词汇的词义、形式、用法3 个方面提出问题,分析、讨论以目标词为节点词提取的语料库数据,总结ESP 词汇特征和规律,促进ESP 词汇的深度学习。 在学习者掌握语料库工具的使用和数据驱动学习的方法以后,教师干预逐渐减少,学习者开始利用语料库独立探索,完成ESP 词汇练习和测试,解答自己对ESP 词汇的困惑,此阶段为自主式DDL.

3.6 数据驱动式ESP 词汇教学的实施方案

数据驱动式ESP 词汇学习伴随着一个学期(12 周,2 学时/周)的ESP 写作课程,每次课内利用15-20 分钟,采用数据驱动的方法学习5 ~6个目标词汇。 课外,平均每两周1 次网络词汇练习,每月1 次网络词汇测试。 为了确保学生利用语料库工具和方法完成此两项任务,要求学生在词汇练习和测试后附上部分语料库检索记录。 在学期结束时要求学习者对语料库的使用情况和数据驱动的词汇学习进行书面反馈。

3.7 数据收集和分析

为了检测数据驱动式ESP 词汇学习的效果,我们收集两个农科博士班(共61 人)一个学期ESP 课程学习过程中的3 次词汇测试成绩。 3 次词汇测试题型结构一致,包括词义配对题、多项选择题和填空题3 种题型,分别从词义(30%)、形式(30%)和用法(40%)3 个方面考察学习者对目标词汇认知的准确性。 我们利用SPSS19 中配对样本T 检验分析了3 次词汇测试的总分和3 个题型的分项得分的差异。

我们还收集61 名博士生对语料库使用情况和数据驱动学习认识的书面反馈。 前者要求学习者汇报利用语料库解决词汇使用困惑的3 个案例,汇报包括:(1)以问题的形式展现ESP 词汇使用的困惑;(2)语料库检索结果的截屏;(3)基于语料库数据得出的结论。 后者主要围绕3 个问题:(4)你对语料库工具和资源有何认识和感受;(5)你认为DDL 有何优势和不足;(6)对今后的语料库扩建,你有何建议,是否愿意参加? 课程结束后,你是否继续使用语料库? 我们对所收集的书面反馈信息进行分类整理与归纳分析。

4 结果与讨论

4.1 词汇测试

词汇测试数据的配对样本T 检验结果显示:(1)测试总分从测试1 到测试2 无差异(t =-1.757,p>0.05),从测试2 到测试3 有极其显著的差异(t =-4.414,p<0.05),这表明数据驱动式词汇学习的有效性,同时也表明DDL 可能需要一段时间让学习者适应语料库工具和方法的使用,然后才能突显学习效果(见表1);(2)进一步比较学习者在词义、形式及用法3 个分项的表现,结果显示:此3 项都显示出历时性的变化差异,测试3的3 个题型得分均显著或极其显著地高于测试1的相应部分,这表明语料库工具的使用能够有效促进学习者准确地掌握词汇的意义、形式和用法;(3)但是此3 项也存在差异。 语料库工具对词形和用法认知的促进效果先快后慢。 在此两项上,测试2 的得分显著高于测试1,然而测试2 和测试3 的得分无统计学意义上差异,说明后期促进作用趋缓。 词义掌握的历时变化趋势与词形、用法不同,每次测试的词义得分都显著高于前一次测试(Mean Diff. =2. 316,sig. =0. 027;Mean Diff. =2.163,sig. =0.038),这表明DDL 对学习者准确把握词义有明显促进作用,而且这种促进作用的效果持续且稳定。 导致此3 项上历时变化趋势不同的原因可能在于:与词义理解相比,词形和用法更能通过语料库索引行直观呈现,因而更容易且更快地被认知。

表1 3 次词汇测试的配对样本T 检验

3 次词汇测试的历时比较研究表明:数据驱动式ESP 词汇学习成效显著,它不仅能够有效促进词汇总体认知水平的提高,而且能够促进学习者准确把握词汇的形式、用法和意义。 这与其他DDL 词汇学习的研究结果一致。 Huang(2014)考察采用DDL 方法进行词汇语法模式习得的效果,结果发现DDL 学习者产出的文本中含有数量更多的搭配和类链接模式(collocational and colli⁃gational pattern),使用目标词汇时错误更少,研究者将这一结果归因于语料库索引行呈现方式有助于学习者关注到目标词汇的搭配与语法形式,因而提高目标词汇使用的准确性。 刘萍和刘座雄(2018:57)认为数据驱动式词汇学习法要求学习者自己观察、发现目标词汇在形式、意义和用法方面的细微之处,须要学习者付出更多的认知努力,加强他们对目标词汇的注意和加工,因而增进理解,加深记忆,进而促进词汇学习的效果。

4.2 语料库使用情况的书面反馈

语料库书面反馈信息揭示出学习者利用ESP语料库在ESP 词汇学习中获得多方面的帮助。总的来说,DDL 学习者利用语料库工具和资源进行以下探索:(1)动词时态和语态的用法。 (2)专业术语中名词的单复数。 例如,有学生探索发现,由多个名词构成的专业词组或词串(bundles)其中修饰性名词没有复数形式,中心名词却可以有复数形式。 (3)专业术语中的词序问题。 例如,A基因是gene A,还是A gene? 检索结果表明,类似专业术语的英、汉语表达词序相反;(4)专业术语及缩写形式前冠词(定冠词? 不定冠词? 零冠词?)和介词的使用。 例如,5 days post incubation(孵化之后的第5 天),缩写为dpi,既然此表达中已经有时间标记词post,有学习者困惑该专业术语及其缩写前是否需要用介词;(5)专业术语中分词的形式。 例如,专业术语“生长抑制效果”中,使用现在分词还是过去分词growth⁃inhibiting/inhibited effect;(6)词汇搭配用法。 例如,有同学探索发现,虽然study 和research 意义相同,但是它们的搭配用法却不相同,study 更多地和of 搭配,research 则和on 搭配(见图1);(7)专业术语中词汇的选择。 例如,学习者不能确定“抗菌肽”对应的英文表达该选哪个形容词,是antimicrobial peptides,还是antibiotic peptides?

由此可见,专业术语中名词的单复数、谓语和非谓语动词的用法、专业术语的缩写、词序、拼写形式、实词和功能词的选择与搭配均困扰着ESP词汇学习者。 这些困惑都能在ESP 语料库中找到令人满意的答案,ESP 语料库为ESP 词汇的使用提供专业且权威的参考和借鉴。

图1 搭配用法

4.3 博士生对语料库资源和DDL 的评价

绝大多数调查对象对语料库工具资源(95.8%)和DDL(93.6%)持积极肯定的态度。 主要的评价归纳如下:(1)ESP 语料库是ESP 学习不可或缺的资源。 书面反馈中,多位博士生表达类似的观点:单个专业词汇也许还能在电子词典中查询,但是对于专业术语或者专业领域特有的词组及其缩写、多词固定表达的查询,ESP 语料库独具优势。 (2)语料库用概率和频率揭示业内专家使用专业词汇的总体趋势,这些数据能够用以验证语言直觉,带给二语学习者语言使用的信心。有学习者这样反馈:语料库数据展示某个表达所出现的频次,意义相似的不同表达被用频次所占的百分比,提供语言直觉的验证方法,增加SCI 论文写作中选词用语的信心。 (3)DDL 是一种授人以渔的学习方式,提高ESP 词汇学习效率和学习者的自主学习能力。 有学习者反映:接触语料库之前,英语词汇学习主要依靠词典、相关文献、教材以及教师,这些资源对于ESP 词汇学习提供的帮助十分有限。 首先,专业程度高的词汇在这些资源中很难查到;其次,即便查到目标词汇,所得到的、为数不多的几个例句不足以揭示目标词汇的使用全貌。 相比之下,语料库工具和资源可以让学习者自己探究专业词汇在专业领域内的使用,语料库集中呈现大量的语境,足以让学习者把握目标词汇的使用特征和规律,有助于提高学习者的自主学习能力,而且经过探索学习所获的知识更加牢固。 此外,相比其他资源,语料库检索快捷,词汇的学习效率也得以提高。

书面反馈也揭示出语料库数据驱动学习中存在的问题和困难:(1)现有农科语料库中专业文献涵盖面不足以满足不同专业背景学习者的需求,部分专业的文献在语料库中缺失。 90.3 %的博士生表示愿意参与语料库扩建以解决语料库文献不足的问题;(2)现有的网络语料库检索方式有待进一步简化。 尽管博士生多少有一点编程基础,但是75.8%的调查对象仍反映语料库检索表达式的编写复杂、繁琐。 即便如此,92.7%的博士生仍表示在课程学习结束后会继续使用语料库,以提高SCI 论文写作质量,这一结果印证调查对象充分意识到语料库资源对ESP 学习的重要性。

4.4 对ESP 教学的启示

本研究带给ESP 教学以下启示:(1)ESP 语料库的建设。 作为ESP 教学的重要资源库,目前很多语言教师都在创建具有所在大学学科优势和行业特色的ESP 语料库。 本研究表明ESP 学习者对ESP 语料的专业细化程度超出语言教师的预想,今后ESP 语料库的设计与建设可邀请不同学科的专业人士参与,以保证语料库文本的代表性、学科分布的合理性,最大限度地满足不同专业学习者的需求。 (2)DDL 的适用对象。 语料库的使用存在一定的技术门槛,探究式、发现式、自主式的DDL 要求学习者具备一定的素质条件和动机因素。 数据驱动学习的始创人Johns(1990)对DDL 的适用对象预设为:成年人、具有良好的学习动机、掌握一定的研究方法和学习技能。 本研究中,农科博士生面临SCI 论文撰写与发表的需求,具有较强的ESP 词汇学习动机,作为专业领域的研究者,其探究式、发现式的学习能力较强,这可能部分解释本研究中DDL 能够达到预期效果的原因。 有专家指出能否采用DDL 要充分考虑学习主体是否具有DDL 学习的条件,否则可能出现学习者对DDL 不适应,甚至导致学习效果适得其反(陈坚林 史光孝2009)(3)DDL 实施的前提条件和保障。 本研究中,DDL 实施前进行语料库检索技术培训、QQ 互动群编程高手负责解答各种检索技术难题、网络语料库平台CQPweb 兼容多种分析功能、从引导式DDL 到自主式DDL有一个自然过渡等等多种因素相互作用,构成数据驱动学习取得成功的前提条件和保障。

5 结束语

鉴于ESP 词汇不仅词汇量大且具有专业特殊性,对ESP 教学构成瓶颈,本研究尝试在农科博士生ESP 教学中引入自建的农科英语语料库资源和工具,设计并运行数据驱动式ESP 词汇教学模式,引导学生利用网络语料库平台的多种功能,对ESP 词汇进行形式、意义和用法的深度探索学习。 词汇测试的历时性研究结果证明数据驱动式ESP 词汇学习的有效性。 书面反馈揭示出ESP 语料库以其业内专家语言的真实性、地道性和权威性,为ESP 词汇学习提供有效的帮助。ESP 语料库成为ESP 词汇学习不可或缺的资源和工具。 语料库数据用以验证语言直觉,增强外语学习者语言使用的信心。 数据驱动学习被认为是授人以渔学习方式,有利于学习者自主学习能力的提高。 专业词汇的掌握直接影响着专业领域英语论文的写作质量和研究成果在国际水平的发表,在双一流建设的背景下,充分利用ESP 语料库和数据驱动学习可解决ESP 词汇学习的瓶颈、促进高层次学习者ESP 能力的提高和高水平英语论文的产出,适应双一流建设对国际化人才培养的需求。

猜你喜欢
博士生语料库检索
赋权增能与边界拓展:博士生培养模式变革的逻辑建构与路径选择
理想与现实之间:博士生学术职业社会化的张力及其消解
基于语料库的清末民初日源外来词汉化研究
中南大学教授、博士生导师
迎春佳作
CNKI检索模式结合关键词选取在检索中的应用探讨
通过实际案例谈如何利用外文库检索提高检索效率
瑞典专利数据库的检索技巧
运用语料库辅助高中英语写作
英国知识产权局商标数据库信息检索