大学外语CBI教学起始水平实证研究

2018-09-17 01:49
英语知识 2018年3期
关键词:词汇量语篇学术

龚 兵

(深圳职业技术学院,广东深圳)

1. 引言

从上世纪六七十年代Widdowson(1978)等学者提出将专业内容作为二语习得的教学途径,到八十年代浸入式教学模式、“内容教学保护模式”、“辅助课程模式”等多模式并举,起初指在一语环境下的内容依托式教学(Content-based instruction,简称CBI),旋即风靡全球,成为专门用途英语(English for specific purposes,简称ESP)以及整个教学竞相采用的模式(Flowerdew,1993)。CBI模式不同于语言驱动的主题式教学(theme-based instruction),其学科内容驱动的本质要求学习者和教师均需具备相应的专业知识和综合语言技能,否则,CBI教学将难以维系。国内研究表明,能基本听懂全英课程的学生大约只有5%左右(韩建侠,2008;李文翎等,2009),使用全英模式传授专业信息,往往“演变为对牛弹琴的闹剧”(汤俊芳,2007)。有学者提出,只要国内大学新生的词汇量能达到《大学英语课程教学要求》(简称《教学要求》)中的一般词汇量要求(4700个),可以直接过渡到专业英语的学习(蔡基刚,2012a)。学术文献阅读能力是CBI教学的最基本要求和CBI课堂教学效果的最根本保障。本研究拟从国内大学生词汇量水平和学术文献阅读能力着手,以词汇阈限假设和词汇能力假设为理论框架,以本校港航专业管理英语CBI阅读课程为实例,就《教学要求》中提出的4700个词汇量能否成为国内大学CBI模式的教学起点问题进行探讨。

2. 理论假设

2.1 词汇阈限假设

词汇阈限假设(Lexical Threshold Hypothesis)认为,如果学习者没有最基本的词汇量,将难以达到“最低阅读理解水平(adequate comprehension)”。多少词汇才能达到“最低阅读理解水平”?West(1941:24,引自Nation & Coady,1988)曾提出,原文生词比例不能超过2%,这是自由阅读的阈限。这个比例能否成为大学二语或外语阅读词汇阈限?另两项词汇阈限研究(Laufer& Sim,1985;Laufer,1989)发现,3000个词族即可保证认识真实学术语篇中95%的单词(生词率为5%),5%的生词率应为大学水平学术阅读理解的词汇阈限。 Laufer(1992)就词汇量与学术阅读能力的相关性再次展开研究,结果发现,3000词族可预测56%的理解能力(55%是海法大学当时阅读理解的及格分(Laufer,1989),4000词族的阅读理解能力为63%,5000词族为70%的理解能力。即超过了3000个,每增加1000个词族,阅读理解能力提高7%,因此,3000个词族是一个“turning point”。也有研究(Hirsh & Nation,1992;Hu & Nation,2000;Nation,2006)提出,3000个词族并非是词汇阈限水平,“最低阅读理解水平”至少应在70%以上,要达到71%的“最低阅读能力”就需要能认识文本中98%的单词(Hu & Nation,2000)。但这些研究基本都是以原版英文小说阅读所需要词汇量为基础,与本文探讨的CBI学术阅读词汇阈限关系不大,本文不做详细引述。

针对以上不同结论,Laufer和Ravenhorst-Kalovski(2010)以学术语篇文本覆盖率、学习者词汇量和学术理解分数为变量,进一步就词汇阈限假设进行验证。该项研究将“最低阅读能力”设定为56%,最低词汇量设定为3000个词族。该研究受试平均词汇量为6000到8000个词族,文本覆盖率达到了98%。4000到5000个词族的学习者认识文本中95%的单词。Laufer(2013)综合两项研究成果(Laufer & Ravenhorst-Kalovski, 2010;Nation, 2006)提出三个阈限值,自由阅读的最佳阈限值为8000个词族(含专有名词),借助词典的自主阅读最低为5000个词族左右(含专有名词)。3000词族可以满足95%的理解,5%的生词可以借助词典或其它手段来学习。本文对Laufer论述的理解是,8000乃一语大学生最低标准,5000则为二语学习者最低要求,低于5000,即3000个词族左右则需要借助语言驱动的学术英语课程来帮助完成剩余2000个词族的学习。如果这个假设成立,那么,4700个词汇量可否成为国内高校开设CBI课程的起点呢?

2.2 词汇能力假设

受结构主义语言学影响,词汇知识框架、词频统计、词汇量测试均把词汇能力视为“成品”,忽视儿童、二语和外语习得者的词汇能力发展过程,其结论存在众多疑点。滥觞于上世纪九十年代的交际语言能力理论主张从更宽泛的视角看待交际能力、从互动观审视交际能力成分之间的关系、交际能力与其它认知能力发展的关系、从语境角度去评估语言能力(Bachman和Cohen, 2002: 6)。鉴于此,词汇能力假设指出,无论是Cronbach词汇知识框架(1942)、Richards词汇知识框架(1976)还是Nation词汇知识框架(2001:26)都只是对词汇知识静态的和离散性的描述,都忽视了语言习得者的词汇能力发展。动态来看,词汇知识向词汇能力的转化不是二维的“零和”概念,而是一个连续体,从接受到产出、从消极到积极、从部分习得到完全习得,其变化过程包孕了众多复杂细微的环节(Melka, 1982)。

上世纪八九十年代,Palmberg、Chapelle和Meara各自提出了不同的词汇能力假设。Palmberg(1987)把词汇能力视为连续体(con-tinuum),一端是“潜在词”,另一端为“完全习得”,其发展过程可能是阶段性的、渐进的和螺旋式的(Palmberg, 1987)。Chapelle(1994)词汇能力(vocabulary ability)假设主张词汇能力是词汇语境能力、加工能力以及语用策略能力的结合体。Henriksen (1999)的假设则认为,词汇能力发展是从词汇知识的部分习得到精确习得、词汇知识由浅入深、从接受到产出的发展历程。Meara(1996)的假设强调心理词库中的词汇知识网络结构,认为考察词汇能力既要看其“量”,更要看其“质”和“可及性”(accessibility)。

以上假设都认为,词汇知识和词汇能力属于不同概念。词汇知识是指学习者记忆中有关词形、词义、语用等知识点,不能代表这些知识点已经成为心理词库中的完整词条(Jiang,2000),即各种离散知识点已经形成一个自动连接的、稳定的认知模块。词汇能力假设强调词汇知识点在心理词库中的整合性和在语用时提取的自动性。二者区别在于,词汇知识在心理词库中未形成一个完整的词条(lexical entry),而词汇能力则是词汇知识高度整合的、完整的词条;词汇知识运用是“有意识的”,而词汇能力运用是“自动的”(Jiang,2000)。

CBI的核心是专业知识,专业知识的吸收离不开大量的学术文献阅读和听课,因此,CBI需要的是高度整合后的词汇能力,而非离散的词汇知识。

3. CBI起始水平研究

词汇阈限假设提出,5000词族可以保证最低水平的学术阅读,但多项研究结果似乎并不支持这个结论。Cobb和Horst(1999)就香港城市大学一、二年级退课和挂科现象,从词汇量与专业学习之间的关系进行了研究,结果显示,三名学生在3000频段的得分率均很高(94%;83%;94%),5000频段(44%; 11%; 55%)和大学学术词汇(UWL)(61%: 55%: 55%)频段的得分率也已过半,文章指出,认识语篇中绝大部分词汇并不能保证有效阅读。这一结论得到另一项研究(Chui, 2006)的证实。Chui(2006)对187名香港中文大学学生的学术词汇深度进行了调查,发现学生只能解释20个目标词中64.5%的词义,多数学生的得分率仅为1.16(1.16/20),目标词的词缀知识和搭配知识分别为52%和57%,结果再次表明,认识语篇中的单词不等于能理解其语境意义。最近的一项词汇能力与二语学术写作能力关系研究(Y ksel, 2015)表明,40名土耳其大学生的英语词汇量在2000、3000、5000、AWL和1万水平上的分布依次为81%、83%、75%、71%、38%(经过本文作者换算),词汇量非常可观,但其联想词汇水平的得分率为66%,产出词汇均停留在1K+2K水平(均值为92.68%),AWL只有5.42%,数据同样证明,词汇量水平远高于词汇能力水平。这些结果均说明,词汇量水平可能高估了CBI教学所需要的词汇能力水平。

蔡基刚(2010)将大学英语四级(简称CET4)水平定为全英语专业教学(English as a medium of instruction,简称EMI)起始水平。严格意义上讲,EMI是CBI的后置课程,对英语水平要求更高。国内另两项实证研究结果表明,国内高校CBI的起点至少应为大学英语四级优秀水平(韩建侠 俞理明,2007;俞理明 韩建侠,2011)。假设CET4优秀水平为国内CBI起点,要达到这个水平需要多大词汇量?根据徐锦芬和聂睿(2016)的研究结果,4300个词汇量无法达到CET4及格水平。

4. 研究方案

4.1 研究假设

因词汇量测试中的目标词来自各种词表,而这些词表研制者均认为,表中的词代表的是词族,所以,本文中一律将所有研究得出的词汇量视为词族数。若能证明5000个词族不能成为CBI开课的依据,就自然否定了4700个词汇作为开课起点的主张。本研究以本校2015级港航专业159名一年级学生为受试,拟通过评估受试词汇量、词汇分布、词汇能力、阅读材料词频概貌与管理英语阅读理解成绩之间的关系,检验以下假设:

(1) 本项研究受试与普通高校和重点高校学生的词汇量总体和分布没有差异;

(2) 3000个词族与5000个词族可以保证认识学术语篇中95%的单词;

(3) 4700个词汇可以达到55%的最低学术阅读理解阈限。

4.2 工具

研究工具共四种:(1)词汇量测试工具;(2)阅读理解测试工具;(3)词频概貌分析工具;(4)词汇能力测试工具。工具(1)为Nation 和Beglar(2007)设计的一万四千频段的Vocabulary Size Test(VST)。工具(2)的题型为T/F判断题,材料选自同一网站,共两篇,每篇5个问题。工具(3)采用的是Compleat Lexical Tutor网站中的VocabProfiler。工具(4)的设计方案是,根据阅读材料词频概貌分析结果中的三种词汇的词族表(K1+K2、AWL和Off-list words),采用等距抽样,每种词汇抽取10个目标词。为了验证词汇量与阅读词汇能力之间的关系,目标词的词义以阅读材料中的语境化词义为准,若目标词在多词单位中已经去词汇化,则以多词单位为一个语义单位进行考察,如例1中的 “in turn”;若一词多义,则以语境化词义为准,如例2中的“driven”(驱动的);若有搭配,则以搭配意义为准,如例3中的“developing...code”,所给词义与句意不符者不计分。

例1. Controlling leads to identification of new problems that in turn need to be addressed through establishment of performance standards.

“in turn”means: __________________

例2. In customer driven business, each employee cares about each customer.

“driven”means:__________________

例3. These individuals must commit to developing the business ethics code and leading its implementation.

“developing”means:__________________

4.3 实施步骤与数据处理

三次测试均在第一学期结束前一周完成,为第二学期的实验做准备。测试分三次在语言实验室进行。实验所用语料取自国外管理专业学习网站中的10篇英语原文。阅读材料难度指数(Gunning-Fog Index)为10.4,要想读懂该材料,母语者至少需要接受10.4年的正规教育,即高中二年级水平。

工具(1)为在线测试,数据取自在线网络测试结果。工具(2)共10题,每题2分,共20分。工具(4)中,每种词汇10个目标词,每题1分,每种词汇总分10分。数据分析工具为SPSS21.0。为了检验词汇阈限假设中的两个阈限值3000和5000,本文将3000词汇水平以下的样本去除,将余下84名受试分为3K和5K两组,选用ANOVA的描述性统计和Scheffe检验方法对数据进行统计分析。

5. 结果与讨论

5.1 研究结果

5.1.1 本研究受试的词汇量总体及其分布

本文将84个样本分为两组,3000—4999个词汇量为3K组、5000以上为5K组。两组在14K水平的词汇总量数据(表1)显示,两组均数约为4005个,3K组(N=71)平均词汇量约为3765个,5K组(N=13)约为5315个。从总量来看,3K组的词汇量略高于普通高校的2899个(蔡基刚,2012b)和2983个(徐柳明 刘振前,2014),5K组略高于重点高校的3313个(蔡基刚,2012b)和4297个(徐锦芬,聂睿,2016)。

表1 14K水平的词汇总量描述性统计结果

词汇量分布是观察学术阅读理解能力的另一个重要指标。因两组受试在11K至14K各频段的得分多数为零,本文只统计1K~10K的得分率。表2数据显示,两组得分率在6K以上各段未达到30%,两组受试只有1K水平的认知率达到了80%,2K水平得分率均低于60%,其它各水平依次处于递减状态,这个结果与徐柳明和刘振前(2014)的结果基本一致(表3)。5K组与徐锦芬和聂睿(2016)的研究结果基本吻合,词汇分布集中在5K水平以下。数据支持第一个假设,本项研究受试与普通高校和重点高校学生的词汇量总体和分布没有差异,3K组可以代表普通高校的水平,5K组可以代表重点高校的水平。两组其它数据可以用来检验3000个和5000个词汇阈限值。

表2 两种词汇水平在1K-10K各词频段的得分一元方差描述性统计结果

表3 本研究与徐和刘(2014)的研究五千频段得分率%

5.1.2 阅读材料的词频概貌和受试的阅读词汇能力

词频概貌分析结果(表4)显示,阅读材料中,2000个通用词汇(K1+K2)的文本覆盖率为81.36%,AWL和表外词(off-list words)的文本覆盖率分别为18.64%(10.95%+7.69%)。这意味着,即使学生认识所有2000个通用词汇,如果AWL和表外词认知率偏低,将难以理解本实验所用的CBI阅读材料。而本次受试和国内普通高校、重点高校学生的词汇量分布(表3)都未达到理解这样难度语篇的水平。学术文献阅读是CBI教学的根本,如果学习者的英语水平无法保证有效的阅读理解,CBI教学将难以维系。

在地性是公共艺术近年的学术话题之一,但是,我们不少人更多地将其定格在作品的文学性内涵的在地性。好像是作品内容只要取自当地题材就算是在地性。据笔者的理解,在地性应该包括作品的内涵、作品与所在环境的物理关系以及作品材质的本土性。所以说胡泉纯的《天坑地漏》应该算一件典型的在地性作品。

表4 阅读材料的词频概貌

表5 3K和5K阅读词汇理解成绩描述性统计结果

表5显示,3K组通用词、学术词和表外词的正确理解率分别为41%,33%和8.6%;5K组分别为68%、39%和18%。显然,两组受试3种词汇理解力均偏低,没有达到理解本阅读材料所需要的词汇能力。表4和表5数据不支持第二个假设,说明3000个词族与5000个词族不能保证理解学术语篇中95%的单词。

5.1.3 词汇量与学术阅读理解能力

5000个词汇能否应对学术语篇的理解呢?徐锦芬和聂睿(2016)发现,4297个词汇的重点高校学生大学英语四级阅读得分只有56.70分。对比Cobb和Horst的研究(1999)结果:三名退课学生在3000频段的得分率分别为94%、83%、94%,5000频段分别为44%、11%、55%,AWL高达61%、55%和55%),显然,这三位退课学生的词汇水平远远高于国内高校的词汇平均水平(见表1、2、3)。由此,本文基本推定,5000个词汇及其分布并非是影响学术知识接受能力的主要因素。有必要就两组受试学术阅读理解能力进行进一步测试和分析。

表6显示,两组阅读理解得分具有显著差异(p=.000),表明词汇量与学术阅读能力高度相关。两个变量之间的正相关关系并不是两者之间的对等关系。表7数据显示,3K组阅读理解均值约5.24,占总分20分的26.2%,5K组约7.54,得分率为37.7%。两组得分率均低于40%,远低于55%的学术理解阈限,不支持第三个假设,即4700个单词达不到55%的最低学术阅读理解阈限。因此,离散性的词汇量知识总量不能直接解释为相应的阅读理解能力。5000个词族数与95%的理解能力并不能直接对等。

表6 多重比较检验结果(Scheffe)

表7 两组词汇量与阅读理解成绩描述性统计结果

5.2 讨论

Hirano(2015)通过研究发现,标准化测试结果与实际学术阅读能力存在差距,7名难民的标准化测试结果表明他们具备了学术阅读能力,但真正学术阅读中总有一种“I read, I don’t understand what’s going on.”的感觉。这种“感觉”并非个案,而是二语习得者的共同感受。为何存在这种差距?本文以实验阅读材料为例,就高频词、学术词汇与低频词在学术语篇理解中的互动关系、词汇量与综合语言能力、词汇量与CBI开课水平之间的关系展开讨论。

5.2.1 通用词汇对学术语篇理解的影响

词汇阈限假设认为,头1000个通用词汇均为熟词,不会对具有3000个词族知识的读者造成理解障碍。如果该假设成立,认识语篇中头2000通用词汇,意味着能理解语篇中81%的单词(见表4),以上各项研究结果中的数据显然不支持这种假设。形式-意义识别需要较好的语法和语篇知识的配合,且需要多次反复辨认、准确断句方能确定语境意义。去词汇化、一词多义、通用词汇专业化、隐喻越多,高频词语境化词义的确定就越困难。例4和例5中的助动词(does)、代词(this)的指代关系、转类词的词性(professional)、一词多义(lead)、多词单位的断句(incorporated...into...;have...developed)都是影响学术语篇正确理解的重要因素。头2000通用词的理解障碍会使读者对其它词汇的理解“雪上加霜”。

例5. If you incorporated the value statements into your strategic planning process, you have part of your code of business ethics already developed.

5.2.2 通用词汇的专业化对学术阅读理解的影响

词汇阈限假设将头2000个词汇界定为通用词汇,AWL为通用学术词汇。例6为本研究阅读材料词频概貌分析结果中的一个自然段,本文对四种词汇重做分析,以进一步检验该阈限假设。

例6.Organizing is establishing the internal organizational structureofthe business.The focus ison division,coordination,and control of tasksand theflow of information withinthe organization.Managers distribute responsibility and authority to jobholdersin this function of management.

单线代表K1;双线代表K2;虚线代表AWL;阴影代表表外词,总字符数40个,25个K1字符,占62.5%,4个K2词,占10%,9个AWL词,占22.5%,2个表外词,占5%。按照词汇阈限假设,假定认识全部通用词汇,对该段文字的理解能力就达到了70%,加上认识全部AWL词汇(22.5%),理解能力就达到了92.5%。要验证该假设,就必须确定头2千通用词汇和AWL词汇在管理英语阅读材料中不属于管理学科技术词汇。例6中的organizing(组织职能)、division(分配)、control(控制)、flow(流)、organization(组织)属于1K水平的通用词汇,都是管理学技术词汇,是该专业教材重要论述的概念。AWL词汇如coordination、distribute、responsibility、authority、function均已专业化为技术词汇,蕴含较深的学科知识,比如function是通用学术词汇,只知道 “功能”并不能保证学习者懂得管理职能(management functions)包含的具体内容(planning、organizing、leading、controlling、coordinating、staffing等)。忽视通用词专业化现象就会导致词汇测试结果失去预测效度。

5.2.3 词汇量水平难以预测学术阅读理解水平

词汇阈限假设中的词汇量可分为两种:一种是言语社团词汇总量(Read, 2010: 16),另一种是语言社团个体的心理词库总量。词汇阈限假设中的目标词汇量是二语或外语习得者若要参与目标言语社团的交际所必须达到的词汇量。前两种词汇量在词汇阈限假设中是“终端成品”,而后者可能只是个“毛胚”或“半成品”。一语、二语和外语学习者的心理词库在在数量上和词汇知识整合的程度上均存在较大差异。研究表明,来自香港全英学校(EMI)的学生高频词和AWL的接受性词汇水平远高于来自中国大陆的学生(Fan,2001; Chui, 2006)。这是因为,外语环境下,词汇学习基本上是课堂直接教学的结果,无法通过类似一语或二语环境所提供的输入和输出机会进行有效整合。

此外,词汇量是否等同于词族知识、词汇能力甚至综合语言能力,取决于词汇知识宽度与深度是否持平,而不能仅仅看两者的相关度(Ishii &Schmitt, 2009)。Chui(2006)对该项研究中的187名香港中文大学学生的学术词汇深度进行了调查,发现,20个目标词,学生能解释三分之二目标词的词义(64.5%),但多数学生都无法给出更多的解释,20分总分,得分仅为1.16,目标词的词缀知识和搭配知识分别为52%和57%,这再次表明,猜对词汇量测试中的词义并不能说明其掌握了目标词所有的词义(Schmitt, 1998),认识测试中的目标词不等于认识其它派生形式(Schmitt& Zimmerman, 2002)。该结果直接否定了词汇阈限假设的主张:只要二语习得者的词汇量超过“beginning proficiency level”就具有了词族成员的形式-意义的识别能力(Beglar, 2009)。概言之,外语习得者的词汇能力远低于各自的词汇量水平。

5.2.4 词汇量与CBI的起始水平

根据2002年上海市教育考试院公布的《高考英语词汇手册》的4200个词汇量要求,蔡基刚(2012a)推定10年后大学新生可达到4700个《教学要求》中的一般词汇量要求,蔡引用章振邦教授(2003)的原话说,“有这样英语基础的中学毕业生上了大学,应该可以直接过渡到专业英语的学习”。从国内大学生的词汇分布数据来看,5000个词汇基本集中在2000到4000词频段,而CBI课程所需要的大学词汇和专业词汇以及低频段词汇分布太低,因此无法保证学生能够深度解读文本信息。如果国内大学生读懂中、低难度的学术语篇,要听懂、读懂更高层次、更深奥的专业性语料,CBI教学效果自然不容乐观(李文翎等,2009;韩建侠,2008;汤俊芳,2007)。

大学外语CBI教学与主题式英语教学(Themebased instruction)有着较大区别,前者的阅读量、语言难度、知识信息量都大于后者,更重要的是前者以掌握专业知识为中心,语言习得是附带习得,后者以语言学习为重心,专业知识只是手段。因此,CBI教学中,知识与语言形成一种相互影响、相互制约的关系。如果均达到了相应水平,二者就进入到良性循环,彼此相互推进,否则,二者就进入到恶性循环。无论是全英专业教学(EMI)还是内容与语言整合式学习(CLIL),CBI都无法回避专业内容,而专业内容的接受与运用要求学习者具备相应的综合语言技能,而不是掌握大量的离散性词汇知识。章教授的原文是:“学习和掌握这类专业英语同样也需要打好基础,听说读写译全面发展”(章振邦,2003)。本文再次引述章教授的原话,旨在强调综合语言水平才是CBI开课的重要依据,而非词汇量水平。

6. 结语

本研究结果表明,本研究受试3K组的词汇量与普通高校生源的词汇量大体一致,5k组词汇量与重点院校生源的词汇量基本相等,即两组分别达到了3000个和5000个词汇量阈限,但分布均集中在5000词汇水平以下。根据该词汇量网络测试工具的诊断建议,3000个高频段认知率不足80%,均需要重新学习,这意味着国内普通高校学生英语基础薄弱,还处在打基础阶段。鉴于此,徐柳明和刘振前(2014)指出,“目前普通本科院校不可盲目照搬重点大学的做法,完全取消EGP,直接开设 ESP课程”。本次研究表明,即便是国内重点大学的学生也未必都达到了CBI的开课水平,高校应量力而行。

本次研究结果只能用于词汇阈限假设检验,并非否定词汇阈限假设研究成果对二语习得及教学的作用。Laufer(2013)明确指出,词汇阈限假设研究的作用在于指导词汇学习目标、词汇大纲设计、教学材料和词汇学习任务的选择。换句话说,它不能用于某项教学改革政策的制定或作为选择某种教学方法的依据。因此,将词汇量作为国内高校CBI开课的理据显然是对词汇阈限假设研究结果的误用。

猜你喜欢
词汇量语篇学术
中日能源语篇中语言表征的对比研究
基于语篇分析的课例研究
学术是公器,不是公地
学术动态
学术动态
孩子的词汇量与其婴儿时期的看护者有关
中国实践的学术在场
基于语篇的初中英语教学策略
Receptive and Productive Vocabulary in Language Teaching
带“HAVE”的表达