语料库技术驱动下的大学英语教材评价分析——《21世纪大学英语读写教程》分析

2012-01-12 11:51
武汉纺织大学学报 2012年2期
关键词:词类语料库学习者

赵 波

(河南师范大学,河南 新乡 453007)

语料库技术驱动下的大学英语教材评价分析
——《21世纪大学英语读写教程》分析

赵 波

(河南师范大学,河南 新乡 453007)

教材设计的科学性是影响大学英语教学质量的重要因素,对教材的科学评定有助于教材的改进以及教师教学策略的调整。本文作者利用语料库技术,从词汇层面对《21世纪大学英语读写教程》(全4册)进行了多维度分析,观测了包括用词多样性、和《大学英语四级考试大纲》要求的呼应程度、对学生自学能力培养的关注度、题材多样性等多种要素,发现了问题并提出了建设性的应对策略。

语料库技术;大学英语;教材评价

大学英语教学改革是当下高等教育领域中一个备受关注的话题,针对教学方法、教学理念、课程设置等方面的研究和论述已产生出丰硕的成果。然而,针对大学英语教材的评价分析尚不多见。此外,由于评价一套教材的优劣有很多方法和尺度,考察的要素可以包括文章题材、用词多样性、文体风格等等,目前为止的针对课本科学性的分析大多建立在定性研究的基础之上,主要依托评判者的知识体系和主观感受来完成,缺乏稳定的可操作性。

一、研究背景

考虑到从1985年国家出台《大学英语教学大纲》开始就明确了:“大学英语基础阶段的教学必须把重点放在语言基础上”。1999年《大学英语教学大纲(修订本)》再次指出大学英语教学目标是:“帮助学生打下扎实的语言基础。”2004/2007年《大学英语课程教学要求》提出的“大学英语的教学目标是培养学生的综合应用能力,特别是听说能力”实际上还是在打语言基础,作者认为一套教材的重点应放在学生语言基础的培养上,而词汇则是语言基础中的基础,因此一套教材的科学性在很大程度上依赖于其词汇构成的科学性。

二、研究方法

本文将研究的目光聚焦于《21世纪大学英语读写教程》(复旦大学出版社出版,是现行较为常见的教材之一,以下简称《教材》)的词汇构成。借助语料库检索软件的词表、类符形符统计、一致性分析等功能,分析该教材的用词多样性、和四级大纲词汇要求的呼应程度、对学生自学能力培养的关注度、题材多样性等多种要素——从这些纬度来标注一套教材的科学性。

(一)类符、形符

所谓的类符(type)指的是每一个在语料库中首次单独出现的词形,类符数可以告诉我们文本一共有多少不同的词形;而形符(token)则是同一个词在语料库中出现的次数,形符数则标明了文本一共有多少词。例如:在下面这句话中He sells newspapers every day, and she sold 500 newspapers yesterday, sells和sold就是sell这一类符所对应的两个形符。在词频统计中单纯的形符和类符数是没有什么意义的,其意义主要体现在标准化的类符形符比中。

(二)标准化类符形符比

人们一般认为,在一个语料库或是文本中,类符与形符的比值越大,就说明该语料库或者说文本的词语使用更好地体现了多样性。然而,英语的词汇量是一定的,特定语料库中类符的增加不可能与形符增加的幅度保持一致,所以当语料库容量达到一定程度后,类符数增加的幅度越来越小,类符形符比也会越来越小,以至于最终无法反应出语料库用词的多样性。标准化处理后的这一比值则可以更科学地说明问题。具体做法是:将一个语料库按照特定形符数分割成若干个文本,计算出每一个文本的类符形符比,然后求出其平均值。

(三)词汇密度

词汇密度是用于描述一套教材用词丰富程度的重要标准。一般认为,一个文本或是一套教材的词汇密度越高,该文本可读性越强,语言变化也会越复杂,进而,语言学习者最容易感到难以驾驭的词素知识出现几率就会越高,如果教材能够对这些知识提供科学的讲解和完善的练习,那么,这套教材对于学习者来说就是好教材。Nation(2000)提出了“词汇密度=类符数/形符数”,不过,考虑到在对不同词容量的语料库进行比较分析时数据的可比性,本研究将词汇密度=标准类符形符比。

(四)朗文释义词汇

所谓的释义词汇指的是词典编纂者在诠释词条时所采用的一组词汇。词典编纂者需要用这些基于频率计算的被严格挑选的词汇解释词典中所有的词条。不同的词典编纂中确定的释义词汇词表是不一致的,目前最具代表性的是《朗文当代英语词典》编纂过程中所使用的释义词汇,包括2226个单词,10个前缀和39个后缀。由于这些释义词汇构成了词典释义的基础,学习者要想能准确全面地使用词典就必须首先完全准确地理解这些释义词汇。或者我们可以这样说,作为大学英语学习者重要信息来源的教材,如果不能有效地涉及这些词汇,帮助学习者了解和正确使用这些词汇,那么,从培养学习者学习能力的角度来讲,这套教材的科学性就值得考究了。

(五)LOB语料库

LOB语料库的全称是 Lancaster-Oslo-Bergen 语料库,20世纪 80年代由兰开斯特大学、奥斯陆大学以及挪威人文计算中心联合编订。本文之所以选择LOB语料库作为参照词库,主要因为其设计的科学性、收录文本的规范性。该语料库包括500个文本,每个文本2000字,涉及15个文本领域,包括:新闻报道、社论、综述、宗教、技艺、贸易、兴趣爱好、传说、纯文学、传记、随笔、文件、报告、学术及科技文章、普通小说、悬疑侦破小说、科幻小说、探险小说、游记、浪漫爱情故事、幽默等,体现了文本的多样性、全面性;所有文章都在英国本土出版,由英国作家完成,保证了文本语言的规范性,避免了诸如美式英语等不同风格的干扰,非常适合作为衡量教材的标尺来使用

三、数据统计及分析

(一)类符、形符统计

将《21世纪大学英语读写教程》(全四册)建库分析后,得到的统计数据为:形符数1-4册分别为:22,456、26,246、26,130、33,586;类符数 1-4册分别为:3,890、4,368、4,612、5,300;标准类符形符比1-4册分别为: 54.93、52.00、50.84、52.80。从统计情况来看,从第一到第四册的教材中,形符数发生了明显变化,类符数与总句数虽出现变化,但幅度不大,其他各项监测指标基本无差别。尤其在观察了标准类符形符比后,作者发现,四册教材的词汇密度惊人的相似,换言之,这四套教材的用词多样性、词语结构的复杂程度趋同。根据Krashen的语言输入假设理论,学习者在学习过程中所接触的语言材料应该略高于其已有水平,用公式表述为:i+1。这里的i指的就是学习者已有的水平,“1”就是略高于“i”水平的知识添加。基于这一理论,作者认为,教材的编写理应秉承词汇多样性逐级递增的模式,而这一点,在本套教材的四册分布中并未很好地体现出来。

此外,作者还观察了前一册出现过的词类是否在后一册中得到了有效的体现和覆盖(毕竟教材本身不光要肩负介绍新知识的使命,也要肩负帮助学习者温习旧知识的责任),统计数据如下:只现于1册、未现于2册类符数1858,只现于2册、未现于1册类符数2335,1册类符消亡率52.24%(1册类符消亡率=(1册类符数-只现于1册、未现于2册类符数)/1册类符数),2册类符新生率53.46%(2册类符新生率=只现于2册、未现于1册形符数/2册类符数)。从这个统计不难发现,2册较之1册的类符重温情况并不好,1册中几乎半数的类符在 2册中得不到体现,换言之,2册较之1册的最显著变化在于具有新词义的词条的增加。

为了考察相邻两套教材的接续性,本文作者进一步统计了共现于1、2册教材的词类的出现频率,统计结果为:尽管第1册中的词类有47.76%被保留下来,然而这些被保留下来的词类能够在第2册中保持出现10次以上的仅占共现于1、2册词类总数的16.54%,换言之,只有共现于1、2册词类总数的16.54%的词类可以在第2册教材中每单元平均出现 1次,按照现在比较普遍的课时安排来考量,相当于1.5周出现一次;只有共现于1、2册词类总数的16.58%的词类可以在第2册教材中每2单元平均出现 1次,按照现在比较普遍的课时安排来考量,相当于3周出现一次;而占到共现于1、2册词类总数的66.88%的词类出现次数小于5次,其中出现次数为1次的词类占共现于1、2册词类总数的28.99%,按照现在比较普遍的课时安排来考量,相当于4--16周出现一次。这么低的 2册重现率也是非常不利于学习者依托教材的温故学习效果的。

利用同样的方法,作者分析了2册与3册、3册与4册教材之间的词类更新及温故状况,总的来说,(1)四册教材保持了基本恒定的标准类符形符比(及词汇密度),对于学习者来讲可能没有突兀的用词多样性变化,易于接受,但缺乏明确的递进性,不利于学习者在用词多样性上循序渐进的提高;(2)四册教材保持了相当一致的更新率,虽然2—3册的形符、类符增加都不明显,但当深入到具体词条的更替分析时,作者发现,1—4册逐级上升的替代率或者说去“旧”(前一册教材中提到的一些词条)补“新”(后一册教材中较之前一侧增加的词条)率基本恒定在50%左右,单就扩大学习者词汇接触面的角度来衡量,这套教材的效率是很高的;(3)在对相邻册的教材进行比对后,作者发现即便之前一册教材中涉及的词类或词条在随后册的教材中出现,出现的频率却比较低,不利于依托教材温故知识的同学对之前知识实现有效的巩固和提高。

(二)参照朗文释义词汇的对比分析

这一部分的分析,主要是将朗文释义词汇做成词表(朗文出版社在释义词汇中包括了 2226个单词,10个前缀,39个后缀;在本研究的朗文释义词汇词表中,不包括 49个词缀),《21世纪大学英语读写教程》词汇做成词表,然后进行比对:考察《教材》对于基本释义词汇的涵盖情况。

具体统计情况如下:《教材》中未体现的释义词汇384个,占释义词汇总量比重为17.25%;《教材》中体现且涉共四册教材的释义词汇753个,占释义词汇总量比重为 33.83%;《教材》中体现且涉及共三册教材的释义词汇384个,占释义词汇总量比重为17.25%;《教材》中体现且涉及共二册教材的释义词汇355个,占释义词汇总量比重为 15.95%;《教材》中体现且涉及共一册教材的释义词汇350个,占释义词汇总量比重为15.72%。数据表明,朗文释义词汇并未全面地被《教材》涵盖,六分之一的释义词汇在教材中未被涉及,在全部四册中得以体现的只有三分之一。虽然这种状况的出现并不能就说明《教材》语料的选择不科学,但至少说明,这套教材就培养学习者学习的能力方面,做得不够好。

(三)参照《CET4考试大纲》词汇表的对比分析

之所以选定《CET4考试大纲》(以下简称《大纲》)词汇表作为参照词表,主要是考虑到4级水平是大学英语在完成两年的教学任务后期待学生达到的水平。这一部分的分析,主要是将《大纲》词汇做成词表(共涉及词条 4604个),《21世纪大学英语读写教程》词汇做成词表,然后进行比对:考察《教材》对于基本释义词汇的涵盖情况。

具体统计情况是:《教材》中未体现的《大纲》词汇1252个,占《大纲》词汇总量比重为27.19%;《教材》中体现且涉共四册教材的《大纲》词汇925个,占《大纲》词汇总量比重为20.09%。简而言之,《21世纪大学英语读写教程》(1-4册)在对大纲原则的贯彻上存在问题,25.02%的未被涉及率则可能导致学生依托这套教材的学习很难保证达到国家规定的《大学英语四级》词汇标准。

(四)参照LOB语料库的对比分析

这一部分的研究则是要利用 WordSmith Tools中的Keywords(关键词)功能,在比对《21世纪大学英语教程》词表和LOB语料库词表后,观察《21世纪大学英语教程》的关键词分布特征,进而通过这些关键词判断《教材》文章主题选择上的特点。比照后,关键词列表如表1:

表1 参照LOB语料库后生成的《21世纪大学英语教程》的关键词统计信息

通过对这些具有较大关键性的词条加以观察和分析后,作者发现,这些词条大多关联的话题是日常生活、学校生活、人物描述。与LOB语料库涉及15个文本领域(包括:新闻报道、社论、综述、宗教、技艺、贸易、兴趣爱好、传说、纯文学、传记、随笔、文件、报告、学术及科技文章、普通小说、悬疑侦破小说、科幻小说、探险小说、游记、浪漫爱情故事、幽默等体现了文本的多样性、全面性)相比,题材显得过于单一。

虽然大学英语学习者生活得环境主要是校园,但是他们所学习的语言知识注定是要在更广泛的领域里加以利用的,过分单一的题材,会极大限制语言知识被利用的几率,进而影响学生学习语言的积极性。况且,教材的单元分割格局是非常有利于多题材的提供的,能否很好地利用这种便利,将在很大程度上影响一套教材的品级。

四、针对《教材》的思考

一套教材的编订需要大量的专门人才根据教学要求(如《大纲》要求)从大量的预料中进行筛选,根据题材的地道程度、一致性、篇幅的适用性整理成册。然而,正是由于太多原则的限定,教材的编写很难做到适合所有标准,满足所有人群的需要。但作者认为,在教材不能轻易被改动的情况下,在教材以外采取一些方法,显得尤为必要:

首先,《教材》的篇幅是一定的,但是《教材》相关的练习册、快速阅读材料却可以不断更新,涉及内容也可以更加灵活,教学时间的安排也可以非常的机动。

其次,教师应压缩完全依托《教材》内容的教学活动,引导学生涉猎更多话题相关的真实预料,而获取这些预料的方法就可以是依托语料库技术的,比如,利用wordsmith软件提供的关键词功能,在获得了一定量的预料之后,通关对关键词的观察,确定被选定的语言材料是特定话题或主题相关的,进而作为补充材料提供给学生。

再次,学习者也应掌握语料库的检索技术,利用KWIC(带语境的关键词)功能,根据自己实际使用的需要,获取特定词条在真实语境中使用的状况,以弥补教师知识的局限性和教材涉及语料的局限性。

最后,这套教材的不足是显而易见的,那么,针对大学英语学习者不同专业知识的需要,适时地开展专业英语教学就显得尤为重要。各级学校应该把专业英语的学习放在一个更加重要的位置来展开。

[1] J.Sinclair. Corpus,Concordance,Collocation [M]. Oxford: Oxford University Press, 1998.

[2] Krashen, Stephen. Second Language Acquisition and Second Language Learning [M]. New York: Pergamon Press, 1981.

[3] Nation, I. S. P.. "Vocabulary size, text coverage, and word lists", in Schmitt; McCarthy, Vocabulary: Description, Acquisition and Pedagogy[M]. Cambridge: Cambridge University Press, 1997. 6-19.

[4] 何安平,郑旺全.语料库视角下的高中英语教材与教法研究[M].北京:人民教育出版社,2009.

[5] 卫乃兴,李文忠,濮建忠,等.语料库应用研究[M].上海:上海外语教育出版社,2005,(2).

[6] 唐洁仪,何安平.语料库在外语教学中的应用[J].外语电化教学,2004,(99):42-45.

Corpus-driven Evaluation and Analysis of College English Textbooks

ZHAO Bo
(Henan Normal University, Xinxiang Henan 453007, China)

The design of textbooks is one of the most influential factors in the whole course of college English teaching, and the scientific evaluation of textbooks contributes serves both the improvement of textbook itself and adjustment of teaching strategies. Aided by the corpus techniques, author of the thesis tries to describe 21st Century College English Reading and Writing (Volume I-IV) on the lexical level multi-dimensionally. Such factors as lexical diversity, correspondence between textbooks and the officially-made CET4 syllabus,contribution to learners’ improvement of self-teaching abilities, diversity of the subject matters, are discussed. Besides, some defects and counter-measures are provided as well.

Corpus Techniques; College English; Textbook Evaluation

H31

A

1009-5160(2012)-0086-04

赵波(1982-),男,讲师,硕士, 研究方向:语料库语言学及应用语言学.

猜你喜欢
词类语料库学习者
你是哪种类型的学习者
《语料库翻译文体学》评介
十二星座是什么类型的学习者
用词类活用法扩充词汇量
从成语中学习词类活用
汉语学习自主学习者特征初探
基于“字本位”理论再谈汉语词类问题
基于COCA语料库的近义词辨析 ——以choose和select为例
高校学习者对慕课认知情况的实证研究
基于JAVAEE的维吾尔中介语语料库开发与实现