张春青
摘要:使用语料库大数据辅助分析文本,能够揭示文本的隐含特征。本文使用AntConc软件和三个版本高中英语教材语料库,分析了读后续写原文和评分样文的关键词。结果显示,关键词能够灵敏地反映语篇用词风格和拼写错误等体现续写样文档次的要素。
关键词:读后续写;评分样文;语料库;关键词
读后续写指的是一篇记叙文被截去后半部分要求考生续写。该题型依据的是互动协同模式理论,具有促学效应。评分标准和样题通过《普通高等学校招生全国统一考试英语科考试说明(高考综合改革试验省试用)》向涉考者公布。自2016年浙江英语高考考查读后续写题以来,全国各地陆续开始考查读后续写题型,教师对了解续写样文的标准有着迫切的需求。样文是教师设计教学活动的重要依据,是其在教学过程中需要不断思考和研究,以便更为精准把握考查内容的重要范本。本文从英语读后续写试题分析入手,运用语料库工具,分析续写样文中的关键词,以期对使用该题型省份的广大师生有所启发。
一、语料库中的关键词分析
语料库是一个由大批量真实使用的语言信息汇集而成的,用计算机储存和提取并用于语言调查和分析的巨型语言资源库,它已成为不可或缺的语言研究及语言教学的资源和手段。除了花费大量资源建设的具有特定用途的大型语料库外,教师在教学中也可建设小型语料库辅助教学。例如,可以建设学生作文语料库,了解学生写作的语法、词汇和语篇等方面的特征。同时,教师还可使用免费搜索软件AntConc搜索目标语言,具体搜索方法可见AntConc所在网站或参考何安平等学者的研究[1]。
关键词(keywords)是指统计意义上拥有特殊频率的词[2],关键词表(keyword list)是指在某一语料库中出现频率显著高于另一语料库中出现频率的词型列表。使用语料库检索软件AntConc或WordSmith等内部设置的对数似然(log-likelihood)或卡方(chi???-squared)检验,教师能够比较目标语料和参照语料两个词频表,从而自动形成关键词表。表中词汇的关键值(keyness)越高,越表明该词在目标语料出现的概率显著高于该词在参照语料出现的概率。如图1所示,quake在人教版(2019)必修1第4单元课文“The night the earth didn't sleep”中出现了3次,全文546词,该词占全文的比例为0.54%。但是,quake在1026226词的Crown语料库中出现次数为0,相比之下,quake在课文中的出现频率较高,具有较高的关键值(keyness=45.05)。某词是否为关键词,其主要标准之一是p<0.05,计算方法在软件内有相应的设置,由图1可以看出,p值小于0.05,接近0。
关键词主要包括3种类型:专有名词、主题词及虚词[3]。有学者指出,关键词表反映了文章的主题(what the text is really about)去除了细枝末节[4]。专有名词等实意词,往往可以揭示语料的主要内容,有时还能凸显用词特色。语法(虚)词则往往能够揭示语料的修辞和文体风格。关键词还可揭示语篇词汇和整体语篇的互动模式,如分析关键词中的实意词(尤其是名词)在语篇的密度分布和关联性,从而揭示语篇的大意和话题发展脉络。另外,在阅读技能教学中,关键词与语境共现行之间的互动切换,不仅能帮助阅读者快速地把握语篇的主要话题乃至内容细节,还能辅助训练他们快速阅读、泛读大意、精读细节、积极预测、验证事实、依据话题发挥联想、分类整合词汇语义、综观语篇话题布局以及在语境中归纳语法模式和寻读相关词语等技能。部分高频关键词的语例还可辅助学习者对该语篇内容进行小结、口头或笔头复述以及学习相关词汇语法知识,等等[5]。可见,关键词表虽然不会完全替代以往的逐词、逐句、逐段式阅读,但是能在当今阅读资源空前丰富的时代,帮助人们快速地捕捉、聚焦、处理关键信息。
二、续写试题和题目关键词分析
本文分析的续写试题是2021年6月浙江省英语高考试题,共336词,主题是父子关系。其故事梗概如下:我的父亲是运送牲畜的卡车司机,受教育程度不高,我感觉自己中学毕业就能超过他了。他从14岁就开始干活,挣来的钱被爷爷用来贴补家用。我上八年级,理想是做橄榄球队的四分卫,我和父亲互不了解对方的世界。暑假期间,除了打球、读书和练习乐器,我也去农场参加劳动强度很大的除草劳动。但是父亲的一席话,打消了我的积极性,他认为参加劳动可以为家里做贡献,促进成长,我因而认为自己挣来的钱不归自己支配。尽管农场有农活,我也不打算去做了。后面两段中,第一段的开头语是:我带回来了119美元的支票;第二段的开头语是:我很惊讶,父亲居然允许我支配自己挣的钱了。
根据前文线索和伏笔分析续写内容,教师可以发现以下内容:一是父子互不了解;二是儿子能否超过父亲;三是爷爷用父亲的钱贴补家用,这个做法是否会延续下去;四是他对农场的工作不感兴趣了,后面态度是否会改变。这意味着续写的故事要大致沿着这个脉络来进行:一是父子之间加深了了解,感情不断深入;二是感觉自己可能没有超过父亲;三是要提到爷爷用父亲的钱这件事,因为第二个文段的首句明确了父亲决定不再使用儿子的钱贴补家用;四是他可能受到激励,想做更多的工作促进自己成长。从两个段首句来看,第一,父子之间的对话,不宜节外生枝;第二,父亲让我支配自己挣的钱,上一代的命运不会在我身上重演。另外,从主题一以贯之的角度看,后面也要涉及自己的成长、父亲的睿智和学历无法改变的父子情深等主题,以便与前面提到的几个内容相呼应。按照以上分析,可以预测,关键词中会有dad、I、surpass、money及其同义词和表达自己愿望的词汇。
从表1提供的关键词来看,第一类虚词my和I揭示了文章叙述的第一人称视角和主要人物关系;dad、trucker、grade和eighth表明了父亲最显著的特征;farmer、weeds、cockleburs、foxtails、labors、earnings和paycheck合在一起,说明了暑假作者在农场里的劳动状况;对于各类杂草的详细列举,从一个角度揭示了劳动的复杂性和艰苦性;quarterback和trombone是作者的理想和爱好;wished、contributing、surpass则体现了作者的希望、父亲的想法和自己的预估;practiced是个例外,它成为关键词是因为该词是美国英语用法,而参照的高中英语教材语料库(人教版、外研版和北师大版)中用的都是英国英语,拼写为practised,体现了文本的语言特征。
三、续写原文和样文关键词分析
(一)原文结尾的关键词分析
原文结尾指的是原作者所写的结尾。原作者在结尾处表达了父亲对当年把辛苦挣来的钱交给爷爷的不满之情,并允许儿子支配自己挣来的钱。儿子计划买心仪的自行车,也体会到了父亲的良苦用心,感受到家庭中公平和敬业的价值观(value)。续写原文部分的关键词如下:dad(4)、something(5)、I(11)、value(2)、my(6)、AMF、cathartic(情绪的宣泄)、savings。括号中的数字表示该词在文中出现的频数,出现1次不标注。由于这些词都达到了关键词所需的关键值,所以关键值不再标注。
以上关键词可以分为三类:(1)专有名词“AMF”,它在原文中指的是一款自行车的品牌,是作者想要购买的。(2)代词I和my表明了文章的主人公。另一个代词关键词是something,如斯科特(Scott)所言,虚词常常揭示文章的风格等特征。点击原文的语境共现行发现,something多用在父亲的谈话中(如图2),符合父亲的受教育程度和对话的口语特征。(3)第三类是形容词和名词,包括cathartic、dad、value、savings,这类词体现了文章的主题,又称主题词,与《普通高中英语课程标准(2017年版2020年修订)》中的主题基本一致。对于父亲来说,允许儿子支配自己挣来的钱,是对他过往不满情绪的宣泄,所以cathartic非常精确地总结了父亲和自己谈话时的态度与感受。另外,父亲让我开个银行账户(savings account),value在原文的结尾既做名词(the value of hard work),又做动词(spend it on something you can use and will value),前者体现了父亲对劳动的感悟,后者体现了父亲对孩子的爱,都指向文章的核心要素——代际理解。
(二)五档和四档续写样文关键词分析
五档续写样文(23分)和四档续写样文(18分)属于较高分数段。五档作文关键词包括 :my(9)、money(5)、argue(2)、dad(2)、bat、blink、gripped、paycheck、popped、reigned、surpass、sat(2)、I(11)、kept(2)。I和my揭示了作者的叙事视角,dad是作文的主角,名词money、paycheck是文中的重要细节,钱是故事冲突的焦点,球拍(bat)则是作者渴望买到的东西。动词argue是对作者和父亲谈话的定性,sat和kept在如此短的篇幅内使用了两次,既描述了谈话时的状态,又表明了作者多使用小词的写作风格。作者使用surpass在文末点题,与前文呼应。从内容角度看,五档作文完全符合预期。gripped、popped、reigned、blink四个词被定义为关键词,是因为在三大高中英语教材中这4个词的出现频率为0。这体现了作者的语言能力,由此推断他能够准确写出这些词汇,一是因为阅读量大,二是在平时运用过。
四档续写样文的关键词包括:dad(5)、my(13)、surpass(2)、head(4)、I(13)、pleading、relieving、trucker、asked(3)。其中,关键词my、I、dad的表现与原文和五档作文的关键词表现相同。surpass也是在最后出现,呼应前文,凸显了作者的阅读理解能力和对全文结构的掌控力;trucker也是如此。head出现了4次(如图3),asked出现了3次(如图4),体现了作者的用词风格,也是该生须提高之处。例如,可以用其他词或结构来替代ask,避免用词的单调性。同样,pleading和relieving也并非高中教材中出现的词汇。
(三)三档、二档和一档续写样文中的关键词分析
评分标准规定,三档续写文本中的语言错误不妨碍理解,二档续写文本中的语言错误则妨碍了理解。三档续写样文中,dad和I依然是高频关键词(见表2),但作者较少使用my,而me却成为关键词,体现了作者的个人用词偏好(尽管是无意识的)。与原文、五档续写样文一样,money是文本的关键词。frustration和surge是教材语料库中没有出现过的词或形式,hugged和welled则是新教材中没有出现过的词汇形式,体现作者对于教材之外语言的积累。三档续写作文中出现了一个新情况:guesture和imaged两个词汇拼写错误,正确拼写是gesture和imagined,四档和五档作文则没有这种状况。
二档续写样文中,my、I和dad(包括dad's)仍是主要关键词。另外,形容词最高级nicest修饰labors,在结尾处想说明劳动最光荣,但这样总结全文明显偏颇。另外,和三档续写样文相同,文中有拼写错误packcheck,原文本有这个词,但是作者却抄错了。作者用了两次couldn't,显示了个人的用词偏好,与上文相同,可用其他表达替代。impress虽然拼写正确,但是从原文来看,作者是想用imagine,“I couldn't impress my dad's life when he was 14.”则属于使用错误。在二档续写作文中,作者没有运用教材以外的词汇,拼写和用词错误与三档续写样文持平,来自原文的关键词增多,如labors,显示出该档次样文作者语言水平低于三档作者。
一档续写样文从原文可以看出,句子多抄袭自原文片段,逻辑混乱,从其关键词中也可以看出。首先,因为是抄袭自原文,所以没有拼写错误;其次,虽然有dad,但是没有I,这是不可想象的,因为我是故事主人公,表明全文呈碎片化状态。最后,关键词基本来自原文,说明抄袭较多。尽管clothes是作者自己的产出,但是它与故事主旨关系不大。
四、结论及对教学的启示
通过上文分析,可以得出以下几个结论:(1)五个档次的续写样文关键词基本都包含我(I)、父亲(dad)和钱(money)三个基本要素,最低档样文缺失I,表明全文逻辑呈现混乱状态。(2)关键词中部分教材语料库外的实词的正确使用体现了学生的语言水平。五档续写样文使用的教材语料库外的实词最多,四档和三档续写样文都有两个以上,另外surpass作为呼应前文的词汇,是两个最高档续写样文中的关键词,体现了学生的语言学习和运用能力。(3)中低档续写样文中出现了拼写错误。
五个档次的续写样文关键词分析也给教师的英语教学带来一定的启示。首先,理解是读写结合写作的根本。从关键词来看,I、dad、money及其近义词是原文的要素,某一项的缺失则可能表明该文不合逻辑。读写结合写作要求学生在较短时间内进行深度理解,以便在写作部分回应原文埋下的伏笔,如自己是不是超越了父亲,较高档次的续写都使用了surpass一词。其次,课内外的学习积累非常重要。英语学习中,学生会遇到一些虽然没有出现在高中英语词汇表中但在故事写作中非常有用的词语,对此,要有意地记录并在写作中使用。对于这类词语使用的恰当性,教师要给予及时反馈。最后,高质量的写作能力并非一蹴而就,要达到一定的水平,需要长期的科学训练。中低档作文中的拼写错误和用词不当,其原因之一就在于训练和反馈不足。
读后续写是读写结合的写作活动,提倡该题型的初衷,是通过续写和阅读原文两个活动之间的互动和协同,提高学生的语言习得效率,关键词分析和随后的使用符合读后续写的理论基础。笔者建议,首先,教师要提升关键词内容教学意识。从关键词的种类来看,它分为专有名词、主题词和虚词,教师应该帮助学生在活动中了解各类关键词的特征,从写作角度进一步把握语篇。其次,教师在教学中除要求学生总结主旨大意和梳理要点之外,还应设计活动,提升学生寻找关键词的能力。此类活动应以个人寻找和小组活动结合的形式展开,让学生在寻找关键词的活动中,深度理解文本主要内容,为下一步的写作打好基础。最后,建议学生在练习读后续写或写作过程中,应在阅读过程中有意识地画出关键词,以供下一步写作选择使用。
注:本文系2020年浙江省普通高校“十三五”新形态教材“语料库辅助中小学英语教学的理论与实践”(课题编号:080570042020)的阶段性研究成果。
参考文献
[1][5]何安平,梁红梅,唐洁仪.语料库辅助英语教学入门[M].北京:外语教学与研究出版社,2017.
[2] SCOTT M. PC Analysis of Keywords-and Key Keywords[J]. System,1997,25(2):233-245.
[3] SCOTT M.WordSmith Tools Manual[M]. Gloucestershire:Lexical Analysis Software Ltd,2015:236
[4] SCOTT M, TRIBBLE C. Textual Patterns: Key Words and Corpus Analysis in Language Education[M].Philadelphia: John Benjamins,2006:56.
责任编辑:孙建辉