梁红梅 何安平
(华南师范大学,广州,510631)
随着语料库语言学的发展,语料库对语言教学的影响日益凸显。语料库提供的语言材料真实、量大,内容丰富,能反映最鲜活的语言使用,对语言的使用范式也极富解释力;此外,语料库的研究手段(如词语索引行、词频表、关键词表等)还为探究性学习提供了技术支持。但是,目前语料库还未能进入语言教学的主流,其中存在的主要问题包括(见Braun 2005;何安平2010):
(1) 现有语料库主要是为研究语言而设计和建立,其规模大,话题和语域种类繁多,但内容通常难以符合教学要求;
(2) 语料库的体例与传统教材的体例相去甚远,从中提取的词语索引行也往往会因为过于纷繁复杂或不完整而给人“一团乱麻”的感觉;
(3) 语料库的标注体系(如口语语料库中的音韵标记)通常令人费解;
(4) 语料库只显示文字和数据,而语言教学却已进入“多媒体”时代。
于是有学者(如:McCarthy 2001;Widdowson 2003;Braun 2005;Flowerdew 2008)指出,语料库不能直接应用于语言教学,而是需要经过“教学加工”(pedagogic mediation/processing of corpora)才能走进语言教学的各个层面,如大纲设计、教材编写、课堂教学,以及效果评估等。其中教材具有教学资源、教学指南和教学互动媒体等多种功能,其在传播新的教学思想和教学理论方面起着举足轻重的作用,因此,语料库语言学延伸至语言教学的新理念和新技术也会首先反映到教材的编写改革中。但是,语料库要经过什样的教学加工才能走进语言教材呢?本文拟从语料库“教学加工”的涵义出发,着重探讨如何在教材编写中实现语料库的“教学加工”。
语料库的“教学加工”是指为了实现语言教学要求,而对语料库的内容和使用技术进行教育学意义上的加工(Braun 2005)。对语料库内容的“教学加工”在于建立适用于语言教学的语料库,其中要遵循的两个重要原则是语料的真实性和连贯性。一般的语料库虽然能够提供丰富而且真实的语言材料,但都只是语言事实的文本记录,如果要应用于教学,则需要根据具体的教学目标和教学要求使其重新语境化。具体做法是从中选择符合学习者的兴趣和需求而且与他们的生活密切相关的语料,并在此基础上创设教学所必需的语言交际情境;同时,教学语料必须围绕一个个主话题层层展开,所以还得从语料库中选取几个或更多个相关的语料文本构成连续体,确保学习者知识构建的连贯性。此外,由于现代多媒体技术在语言教学中的应用越来越广泛,应用于教学的语料库还应该与其他信息媒体手段整合起来,例如,为口语语料库配备相应的语音版本或配以视频和图像等,构建成为多模态教学资源库。
对语料库技术的“教学加工”主要体现在教学的实施方法上。语料库强调通过频数驱动和词语索引行的呈现手段来揭示语言的使用范式,但这些手段必须辅以语篇分析才能应用于教学,即首先让学习者熟悉整个语篇的交际情境、话语内容及其文化内涵,然后才关注其语言形式的语料库检索结果,因为从熟悉的文本中检索出来的词语索引行是比较容易理解的,还可以加深学习者对语篇的理解和诠释。
目前,国外已经出现多套语料库指引的(corpus-informed)EFL教科书和练习教材,例如:CollinsCobuildEnglishCourse(Willis & Willis 1989),Innovations(Dellar & Hocking 2000),Headway(Soars & Soars 2003),CuttingEdge(Cunningham & Moor 2003),NaturalGrammar(Thornbury 2004),Touchstone(McCarthy,McCarten & Sandiford 2005)等。从编写者的编写思路来看,语料库指引的EFL教材有以下共同特征(Willis 1990;McCarthy 2004):第一,教材的大纲设计体现语言使用的频数信息,优先考虑最高频和最典型的词汇和语法,以及自然交际中最常用的表达法和交际策略;第二,教材的内容以真实语言为素材,语例来自语言使用事实而不是凭空编造(但可能会有局部改写)。可见,语料库及其研究成果已经或多或少地进入教材编写。下面我们就从教材语料的选编、语言知识的呈现以及练习的设计这三方面探讨教材编写中的语料库“教学加工”。
这属于语料库内容层面的“教学加工”。通常有两种做法:改编法(modeling approach)和语料库驱动法(corpus-driven approach)(Ranalli 2003)。
首先看看改编法。它是指根据教学需要,从现成的大型语料库中选取相关的语篇或对话,通过修改后编入教材。这种教学加工可以确保所选的语料话题真实,语言自然,而且适用于教学。尤其是语料库中的真实对话,通常都要经过较大的改动才能编入教材,因为真实对话与传统教材中的对话之间存在很大差异(Gilmore 2004;转引自McCarten 2010:423),例如:真实对话中提到的人、事物和地点都只是对话者才熟悉的,而且对话没有明显的开头和结尾;对话中经常出现不适宜编入教材的禁忌语或话题;有些话语含有大量的重复、改述、犹豫、错误起始和离题等现象;有许多让语言教师难以接受的非正式用法和省略;有许多同步话语,既难听懂又不容易以书面形式呈现出来;少有可用于教学的相关语例,其中的词汇和句子结构通常会因为过于晦涩难懂而不符合教学要求;对话太长,而入门级教材的对话或课文一般都只限制在50-60词之间;话轮分配很不均匀,难以进行对子操练。为了把语料库中的真实对话编入教材,McCarten(2010:424)提出了如下改编原则和方法:
(1) 缩短话轮长度(除非是讲故事),但是听者做出的反馈可以保留下来;
(2) 确保说话者之间要有交互,比如在接过话轮时首先要对前一个说话者做出必要的回应;
(3) 保持适当的词汇密集度,教材中对话的词汇量和信息量通常都不能太大;
(4) 在不影响理解的情况下保留真实话语中特有的一些语言特征,如重复、改述、不完整句等;
(5) 遵守Brown和Levinson(1987)的礼貌原则。例如,英语本族语者在讨论中通常使用间接言语策略,因此,他们会更经常使用Idisagreewiththat而不是Idisagreewithyou。
下面是对真实对话进行改编式教学加工的一个典型例子。为了呈现英语中用于加强语气的话语结尾语(tails of the utterance),Seidlhofer(2003:99)从CANCODE语料库(TheCambridgeandNottinghamCorpusofDiscourseinEnglish)中节选了以下这段对话:
A: And I came over Mistham by the reservoirs, nice it was.
B: Oh, by Mistham, over the top, nice run.
A: Colours are pleasant, aren’t they?
B: Yeah.
A: Nice run, that.
对话中,A告诉B自己是走什么路线去到B家的,B很友好、很随意而且很得体地给以回应,A和B的言语交互中出现了nice it was和nice run等话语结尾语。Seidlhofer(2003)认为,如果要把以上这段对话编入教材,则需要对其进行修改,主要是把原始对话中的省略句改成完整句。例如,把nice it was改成It was nice it was,把by Mistham, over the top改成you came over the top by Mistham,把nice run改成That’s a nice journey,把Colours are pleasant改成The colours are pleasant,并且把nice run that改成It was a nice journey that。以下是改编后的版本:
A: And I came over by the village of Mistham.It was nice it was.
B: Oh, you came over the top by Mistham.That’s a nice journey.
A: The colours are pleasant, aren’t they?
B: Yes.
A: It was a nice journey that.
显然,修改后多多少少会改变对话的本来面貌,尤其是省略句已经不再是其典型特征,而且,原本用于话语结尾语和省略句的非正式用语run也换成了journey。但是,改编后的对话更加清楚、整齐,既符合教学目的,又能保证语料真实自然。
接下来再看看教材语料选编中的语料库驱动法,即根据教学大纲的要求建立相关的学习语料库,既可以用作教材的教学文本,又可以作为编写相关练习的重要资源。这种做法不但遵循语言频数驱动原则,还能实施于有意义的交际情景中(Willis 1990)。根据词汇大纲(lexical syllabus)编写的CollinsCobuildEnglishCourse(Willis & Willis 1989)(以下简称CCEC)教材的语料选编过程便是一个典型例子。词汇大纲根据COBUILD语料库的研究成果而制定,该大纲要求教学首先要教自然英语中高频词的典型意义及其典型使用范式(Sinclair & Renouf 1988)。因此,CCEC教材着重凸显日常英语中最高频的2500个词的典型意义及其典型用法,其中第一册(Level 1)重点覆盖词汇大纲所列出的最高频的700个词的典型意义和典型使用范式;第二册(Level 2)在重现上述700个词的同时,以凸显接下来的850个高频词的典型意义和典型用法为主;第三册(Level 3)则在重现上述1550个高频词的基础上以凸显余下的950个高频词的典型意义和使用范式为主。基于以上教学目标,CCEC教材的编写者建立了能够使上述高频词及其典型意义和使用范式置身于真实语境的学习语料库,并把其中的语料编入CCEC教材,从而把日常英语中高频词的真实使用呈现给学习者,主要步骤见图1。
图1 CCEC教材语料选编中的语料库“教学加工”过程
如图1所示,在建库之前首先要广泛调查,确定学习者可能感兴趣或对其有价值的话题(这些话题后来也就成为CCEC教材中的话题了)。然后围绕各个话题设计一系列的口语和写作任务(这些任务后来也成为CCEC教材中的练习任务),并聘请受过正规教育的英语本族语人士来完成;其中口语活动录音后转写成文本,这样所建的学习语料库既有口语材料(包括录音及其文字版本),又有书面语材料。根据教材各个级别的目标语言点确定学习语料库的内容后,编者还请了一些学习者来进行先验调查,检验文本的效度,把不适合的内容删掉。然后根据难易度确定教材的话题顺序,并编写相应的练习指令语。最后,通过检索词语索引行以确保各个级别都涵盖了各自要求凸显的目标语言点,然后才编入CCEC教材。值得注意的是,为了确保口语材料真实自然,被录音的英语人士事先都不知道是为编教材所用,只知道是为一个研究项目而收集资料。因此,他们并没有刻意简化自己的语言,所有对话都是为完成一个共同任务而进行的真实交际,这样的对话几乎包含了真实口语语篇的所有典型特征(如停顿、犹豫、转话题、要求澄清等),如:
(DF=David;BG=Bridget)
DF: So.What do you do, again? You’re a secretary, or
BG: Yes.
DF: more than-
BG: I’m a secretary for Alistair.
DF: Okay.Erm...
BG: And I also do all his admin.And I work for John, who’s our African Manager.
DF: Okay, so like a PA.
BG: To Alistair, yes.
DF: Yeah.Okay.
BG: And then, I sort of help John out with all his administration.
DF: Right.Erm...Are you planning to stay where you are?
BG: Yes.
DF: In your job?
BG: For the—for the time being.
DF: Erm...So you’re quite happy with it?
BG: Yes.
DF: Erm...Have you got any long-term plans for the future, in terms of work?
BG: Erm...I’m not sure.I—it depends sort of what happens between now and then really.Erm But, for the time being I’m happy.I’ll just see what happens.
DF: Right.How long have you been there?
BG: Since May, last year.
DF: Oh.So you’ve only—you have—have you
BG: I haven’t even been there a year yet.
DF: Yeah.Yeah...Okay.Right.
在以上对话中,Bridget(BG)和David(DF)谈论Bridget的工作,该对话的话轮总数比传统教材中的多得多,用了二十几个话轮才完成一个很简单的话题,这主要是因为该对话的话语结构不是简单的一问一答。例如DF在多处用了yeah,okay等词来表示理解或赞同对方的回答,因此其话语结构基本上都是“提问-回答-反馈”,而且每个话轮都简短易懂。此外,right一词在对话中出现了两次,都是用于结束上一个话题以便转入下一话题;对话开头使用的again则用于衔接前面的话语,等等。所有这些特征都是真实对话所特有的,在凭空编造出来的对话中很难找到(Willis 1990:125)。无论是改编法还是语料库驱动法,目的都是为了使所选语料既符合教学要求,又能把真实自然的语言呈现给学习者。
这是属于语料库技术层面的“教学加工”。目前,语料库及其分析软件并不为大多数教材使用者所熟悉,因此,教材一般不会把语料库检索的词语索引行或其他相关的统计数据表直接用于呈现语言知识,而是以隐性的方式把语言的语料库检索结果呈现出来,即教材编写者在教材中提供关于目标词及其词汇搭配和结构型式的频数信息,但不需要告诉读者这些信息的来源出处以及为什么要提供这些信息(McCarten 2010:422)。下面是选自Touchstone教材(McCarthy,McCarten & Sandiford 2005)的两个例子(图2,3)。
图2呈现了must一词在日常对话中用于表达“have to(不得不,必须)”义和用于表示推断的用法分布(各占10%和90%),并配有例句。图3呈现了I mean这个表达法在日常对话中的使用频率(是最高频的15个表达法之一)、典型意义和典型用法(即用于表明接下来要重述自己的观点或是对自己之前说过的话进行补充或解释),并用配有插图的一个简短对话来举例说明。可见,尽管Touchstone教材的语言知识点都来自语料库的检索结果,但编者并不直接采用语料库的检索界面,而是以教师和学习者都非常熟悉的形式把目标语言点的使用频率及其典型意义和用法呈现出来。这不但可以避免教师和学习者产生畏惧感,而且所提供的信息还有助于激发学习者的学习兴趣和学习动机,提升学习者对高频词和典型表达法的意识。
图2 语料库的语言信息在教材中的呈现相貌
图3 语料库的语言信息在教材中的呈现相貌
这也属于语料库技术层面的“教学加工”。Willis(1990),McCarthy(2004)和Braun(2005)等学者一致认为,仅仅把反映语言事实的语言材料呈现给学习者是不够的,还应在此基础上设计有利于提升意识的(consciousness-raising)练习任务,引导学习者通过分析、体验和探究去发现和归纳语言的使用范式。也就是说,教材编写中的语料库“教学加工”还应进一步落实到教材的练习设计中。
教材练习设计中的语料库“教学加工”主要体现在练习语料的呈现和练习任务的设置两大方面。首先是对练习语料的“教学加工”。经过“教学加工”编入教材的教学文本可以用作编写练习的语料资源,即编者根据教学需要,通过语料库技术从中提取目标语言点的词语索引行,并以学习者熟悉的界面呈现出来。也就是说,把DDL学习法(data-driven learning)(Johns 1991)引入到教材练习设计中,但是其中的语例往往不是以语料库词语索引行的原始界面出现,而是以含有目标语言点的整洁的句子或语篇呈现出来。然后,在此基础上编写练习指令语以便设置练习任务,主要是引导学习者充分利用自己对语言的亲身体验,通过分析和探究去归纳目标语言点的使用范式。下面以CCEC教材第二册关于高频词by的一个练习为例,进一步说明教材练习设计中的语料库“教学加工”。
by
(1) showing who or what does something
Themicrowavesareabsorbedbythefood.
B&B-inmostcasesitwillberunbytheowner.
(2) answering the question ‘How?’
Microwavesworkbyusingadevicecalledamagnetron...
Theyonlydealwithenquiriesbyletter.
(3) answering the question ‘When?’
(注:教材原文在此处配有图画)
Bythetimewegotdownstairstheywerealreadyhalfwaydownthestreet.
(4) meaning ‘near’or ‘next to’
Iwouldprobablywaitbythecar.
Find two examples for category 1, three for category 2 and one example for categories 3 and 4.write down the other four phrases with by.What do they mean?
a)IcangetbyinFrench...
b)I’mfairlyinterestedinsport,butbynomeansfootball.
c)Wewentupbycar.
d)Sheanswersthedoor,lookingabitangry,asit’soneinthemorningbythen.
e)Heseesthisgirlstandingbytheroadsidehitching.
f)Theyproduceheatbyfriction.
g)Ensureyoursafetybygettingmicrowaveovensservicedregularly.
h)IwasdrivinguptoLondonbymyself.
i)There’llbealeftturnfollowedbyanimmediateright.
j)IwasapproachedbyanAmericanmother.
k) ‘Bytheway,’Isaid, ‘whydidyoulietohim?’
该练习首先展示了by一词在日常英语中的4种典型意义和用法,即:(1)用于表示某人或某物做了某事;(2)用于回答“How?”的问题;(3)用于回答“When?”的问题;(4)表示“在……附近”或“在……旁边”。而且,每个义项都配有1-2个例句。接着,编者从CCEC教材的学习语料库中提取一批含有by的语例(即a-k),并在此基础上设置练习任务,要求学习者从中找出与前面所列的by的各种意义和用法相匹配的语例(即从a-k中找出与第一个义项相匹配的2个语例,与第二个义项相匹配的3个语例,以及与第三和第四个义项相匹配的各1个语例),而对于那些不能与上述任何一个义项相匹配的语例,则要求学习者从中找出4个含有by的固定短语并解释其含义。
归结而言,EFL教材练习设计中的语料库“教学加工”主要有以下特点:
第一,语例取材于与教材相配套的学习语料库(即教材的教学文本)。这样的语例对于学习者来说不但是可理解的(comprehensible),而且还可能是已经理解了的语言输入(comprehended input)(Willis 1990:65)。
第二,尽管与目标语言点相关的语例都是从学习语料库中检索和提取,但并不是以语料库词语索引行的原始界面出现在教材练习中,而是以学习者熟悉的整洁的句子或语篇呈现出来。
第三,练习首先是展示目标语言点的典型意义和用法,然后在此基础上设置练习任务,鼓励学习者批判性地分析一批相关语例,并把目标语言点的使用范式与意义相匹配,从而归纳语言的真实使用。
由上可见,通过语料库“教学加工”可以把真实世界的语言引进到教材和课堂教学,使学习者有更多机会去理解和使用自然语言,这正是语言教学的最终目的。而且,随着多媒体技术和语料库建库技术的发展,将会出现越来越多集声音、图像和文本为一体的多模态语料库并应用于教材编写,甚至还可以建立反映课程内容和目标的语料库并对其进行分级,以便低水平学习者也有机会接触这些材料(Allen 2009;转引自McCarten 2010:425)。因此,语料库“教学加工”在教材编写中的应用将会变得越来越广泛。
Braun, S.2005.From pedagogically relevant corpora to authentic language learning contents [J].ReCALL17(1): 47-64.
Cunningham, S.& P.Moor.2003.CuttingEdgeAdvancedStudent’sBook[M].Harlow: Pearson Education Limited.
Dellar, H.& D.Hocking.2000.Innovations[M].Hove: Language Teaching Publications.
Flowerdew, L.2008.The pedagogic value of corpora: a critical evaluation [A].In Frankenberg-Garcia, A.etal.(eds.).Proceedingsofthe 8thTeachingandLanguageCorporaConference[C].Lisbon: ISLA, British Council & Benjamins.115-19.
Johns, T.1991.Should you be persuaded—two examples of data-driven learning materials [J].EnglishLanguageResearchJournal(4): 1-16.
McCarten, J.2010.Corpus-informed course books design [A].In A.O’Keeffe & M.J.McCarthy (eds.).TheRoutledgeHandbookofCorpusLinguistics[C].London/New York: Routledge Taylor & Francis Group.413-27.
McCarthy, M.J.2001.IssuesinAppliedLinguistics[M].Cambridge: Cambridge University Press.
McCarthy, M.J.2004.Touchstone:FromCorpustoCourseBooks[M].Cambridge: Cambridge University Press.
McCarthy, M.J., J.McCarten & H.Sandiford.2005.Touchstone.Student’sBook1 [M].Cambridge: Cambridge University Press.
Ranalli, J.M.2003.ELT coursebooks in the age of corpus linguistics: constraints and possibilities [OL].http:∥www.cels.bham.ac.uk/resources/essays/Ranalli6.pdf.
Seidlhofer, B.2003.ControversiesinAppliedLinguistics[M].Oxford: Oxford University Press.
Sinclair, J.M.& A.Renouf.1988.A lexical syllabus for language learning [A].In R.Carter & M.McCarthy (eds.).VocabularyandLanguageTeaching[C].Harlow, Longman.140-60.
Soars, L.& J.Soars.2003.NewHeadway,Intermediate[M].Oxford: Oxford University Press.
Thornbury S.2004.NaturalGrammar[M].Oxford: Oxford University Press.
Widdowson, H.G.2003.DefiningIssuesinEnglishLanguageTeaching[M].Oxford: Oxford University Press.
Willis, D.& J.Willis.1989.CollinsCOBUILDEnglishCourse[M].London: Collins COBUILD.
Willis, D.1990.TheLexicalSyllabus:ANewApproachtoLanguageTeaching[M].London: Collins COBUILD.
何安平.2010.语料库的“教学加工”发展综述[J].中国外语7(4):47-53.