基于语料库的大一新生学术词汇产出能力及教学研究

2020-05-24 03:49宋岩霍颖
现代英语 2020年13期
关键词:语料库学习者学术

宋岩 霍颖

一、 引言

随着大学英语教学改革的推进,学术英语教学的重要地位日趋显著。 大学英语教学改革的高级目标之一是培养具有创新潜质的高水平学生参与国际学术交流的需要的能力。 学术英语教学正是实现该目标的有效方式。 学术词汇是学术英语学习的基石,但在语言教学中,学术词汇多成为学生自学的内容,缺少课堂教学的指导而被忽视。

二、 学术词表研究

学术词汇也被称作半专业词汇,是指“不被West(1953)的通用英语词表所包含的高频词”(Sager,Dungworth & McDonald,1980)。 学术词汇在专业写作中被频繁使用,且给学习者带来学习困难的非专业词汇,构成了学术论文的框架。 学术词汇不包含学生要学习的某一学科中的内容词汇(content vocabulary),而是指任何学科的学生都要掌握的用以产出结构上条理分明的写作任务的非内容词汇(Coxhead,2000)。 主要学术信息不是靠学术词汇来传递的,但学术观点的提出、研究活动描述、研究结果的解释却经常需要使用这些词。 Paquot(2010)将学术词汇定义为“表征学术工作、组织科学话语和构建学术文本修辞的一整套可供选择的词汇”。 学术写作在语体上较为正式,写作中所使用的学术词汇的多少决定了文章的正式程度。

Robinson(1987)指出,教材也许不需要关注非常专业的词汇,因为学生可以从其他途径了解它们,但恰恰是半专业词汇给学生的学习造成很大困难。 她在对四本农业教材的词汇特征进行分析时发现,其中的专业词汇只占了全部词汇的15%,而半专业词汇,即学术词汇则占据60% ~70%。 与专业词汇相比,学习者对学术词汇的熟悉程度要差一些。 此外,学术词汇出现的频率比通用词汇出现的频率要低很多,这就导致学习者对学术词汇的掌握有一定的难度。 Santos(2003)对美国大学教材进行分析时发现,16%左右的词汇为学术词汇,这部分词汇很少出现在日常学习和生活中,并被二语学习者所使用,所以导致掌握这些词汇成为学习者的一大困难。

20 世纪70 年代开始,很多研究者整理了不同版本的学术词表,辅助学习者学术英语的学习。 Coxhead(2020)指出,1917 年Campion & Elley 以大学教材、学术报告和期刊为基础,整理了23 部教材、19 篇期刊论文以及大学考试试卷, 编辑出学术英语词表。Praninskas(1972)的学术词表是建立在美国布鲁克大学大一文理必读10 本教科书为基础的语料库之上的;Lynn(1973)收集52 本大学教科书和三个专业50 名学生的课本1000 条注释,编辑了一个以词频为标准的197 个词族的词表。 Ghadessy(1979)汇编了化学、生物和物理专业20 本教材,学生注释过的词汇被人工记录,整理了包含795 个单词的词表。 但四个词表的汇编和整理都是非计算机辅助下手工进行的,且对词汇数量的界定没有明确的说明(Coxhead,2000)。 Xue &Nation(1984)通过对上述四个词表的编辑和整合,以词族为单位,创建了大学英语词表(UWL)。 这个词表被学习者、教师、课程设计者以及研究者广泛使用。 但作为四个词表的合并产物,在对词族的筛选方面缺乏统一的原则,生成词表的语料库规模较小,文本主题范围较窄。 Coxhead(2000)在前人基础上,编辑了学术英语词表(AWL)。 Paquot(2010)以语料库为基础,采用“三层筛”,即关键性、范围和分布均匀性的方法,提取出包含930 个学术词汇的学术关键词表(AKL)。 为了便于回顾和学习,该词表被细化为名词、动词、形容词、副词和其他词共五个子词表。 但AKL 的影响力不及AWL。 Coxhead(2000)的AWL 是以词汇出现频率、覆盖率和频率均匀性为筛选条件,以大学英语一年级难度的414 篇文本,约350 万运行词的书面学术语料库为基础构建出来的,包含570 个词族。 570 个词族按照在学术语言中出现的频率由高到低60 个一组,最后一组30 个,分成10 组。 AWL 不包含GSL(通用词汇表)中的词汇且覆盖了语料库书面学术文本词汇的10%。 AWL 的词表研究影响深远,为研究者创建专业英语词表提供了参考。

本研究旨在结合词汇广度和深度两个维度,借助检索软件研究非英语专业学生学术词汇产出能力。 研究问题如下:

1. 大一新生学术词汇产出能力如何;

2. 产出性学术词汇在新生作文中如何分布和搭配;

3. 如何使学生提高学术英语词汇能力从而为今后的学习打下坚实的基础。

三、 研究方法

本研究以Learning Style 为作文题目,要求学生在30 分钟内完成200 字以上的写作任务。 全校新生共4186 份作文被收集上来。 利用词汇量化常用统计工具RANGE32GSL 和AntConc3.5.8,对研究对象的产出文本进行量化统计。

四、 数据统计

本研究将AWL 的10 个子表内嵌至RANGE32GSL中。 利用RANGE32GSL 对文本中的形符、类符和词族的情况进行统计。 结果如表1 所示。

表1 十个子表形符、类符和词族分布情况

文本语料库中的总形符数为59508 个,其中405个分布在学术英语词表子表一中,占全部形符的0.7%。 分布在其余子表形符数及比例同解。 除子表五(3%)之外,所有形符占总形符数的比例均低于1%。 除子表五和子表十外,形符比例从子表一至九基本呈下降趋势。 不在学术词表中的形符为58484 个,为总形符的98.3%。

文本中的类符总数为2551 个。 其中分布在学术子表一中的有79 个,占总类符数的3.1%。 分布在其余子表类符数及比例同解。 子表一和二中的类符比例相对较高,子表三至七为中等水平,八到十类符比例相对偏低。 不在词表中的类符数为2367 个,比例为92.8%。

文本中出现的总词族数为1181 个,其中540 个分布在学术词表的子表一中。 在十个子表中的词族出现数量呈递减趋势。

不在学术词表中的词汇多数分布在通用基础词表一和二(RANGE 自带),或不在RANGE 自带的三个词表中。 基于形符、类符和词族分布的比较情况来看,学生对学术汇表掌握的广度远远不足。

五、 数据讨论

(一)学术词汇产出能力情况

对照《中国英语能力等级量表》(2018)和《大学英语课程教学要求》(2007),学习者掌握的词汇量应达到6395 个单词和1200 个词组,其中约2200 个单词为积极词汇。 本语料库共包含2551 个类符,较之课程教学要求的词汇量相差甚远。 其中382 个为学术词表词汇。 其中在子表一和二中的分布比例为3.1% 和2.6%,虽在同类子表中的比例较高,但在学术词汇使用上,与Coxhead 提出的学术英语高频词汇占据学术英语文章总词汇的10%的比例相比,相差两倍还多。子表三到七中,类符比例均在1% ~2%之间。 子表八到十的类符比例就更低了。 总的说来,学生的学术词汇产出能力较低,学术英语词汇匮乏。 这对学术英语语言的理解和应用造成很大的障碍。

(二)产出性学术词汇搭配情况

第一,词语搭配过于简单。 根据英国国家语料库(British National Corpus,BNC),achieve 在词丛搭配左侧时,与其搭配的名词频率最高的为aim, control,level, membership, points, effect, increase, transition等,且经常为-ing 形式的短语做主语或achieved+宾语做状语的形式。 而本研究学习者多使用achieve+target/goal/something,achieve 多为一般现在时主动语态中。 achieve 在词丛搭配右侧时,本族语者多用can do/have done/could be done/be going to do 的形式,且被动语态居多。 本研究受试者多使用will/can/may+do 的形式,且主动语态居多。 受试者在“能使用复杂的固定表达,如词语搭配、习语”(《中国英语能力等级量表》)方面的能力亟待提高。

第二,词汇使用较为单一,重复性使用频率较高。子表五和十的形符数较其他子表凸显,分别为1802 和376,可见学生存在重复使用某些学术英语词汇的现象。 《中国英语能力等级量表》中指出的“表达不同功能、意图和态度时,能选用恰当的同义词”的能力,在受试者的语言使用中显得不足。

第三,不能区分一般正式与非正式的词语。 在受试者的作文中,口语化的表达如I think, so, after that,I will tell you,in my opinion,sort of,I’d like to 等,以及通用词表中的高频词出现频率高,影响学术文章的正式程度和表达的客观性。

(三)词汇搭配强度与频率不一致

搭配强度是词语间聚合关系的描述指数。 achieve和与其搭配的词汇间的搭配强度和频率不一致,原本搭配强度很高的词汇使用的频率却很低。 通过对语料库的检索,target, stage, section, honors 等词和achieve互为搭配,即target 和achieve, stage 和achieve, section和achieve,honors 和achieve 间互信息性较强。 这与语料库的命题写作任务有关,反映了语料库一定的局限性。 但也从另一个侧面体现出了受试者的词汇搭配的单一性。

六、 结语

本研究从词汇广度和深度两个维度出发,考查学生产出性学术英语词汇的分布和搭配情况,发现学生学术英语词汇使用上存在词汇量匮乏、用法单一和正式性欠佳的问题。 在今后的学术英语教学中,对学术词汇应该予以更多的关注,教师应利用如产出导向法、词块教学法等多种教学手段和方法,帮助学生掌握AWL 中的词汇,并向外扩展。 另外,由于中国学习者自身的思维和文化特点,教师应该充分利用自建英语语料库和自建英语词表,并对比母语语料库和学术词表,帮助学生在语义环境中掌握学术词汇的常用搭配,形成词汇网络体系,从深度和广度拓展词汇知识。

猜你喜欢
语料库学习者学术
在线学习环境下学习者画像构建研究
基于语料库的清末民初日源外来词汉化研究
学术是公器,不是公地
学术动态
学术动态
中国实践的学术在场
你是哪种类型的学习者
十二星座是什么类型的学习者
非正式学习环境下基于移动终端的学习者模型研究
运用语料库辅助高中英语写作