陈丽曼
我国香港地区从2004 开始推行全港性系统评估(Territory-Wide System Assessment,简称 TSA)。全港性系统评估属于低风险评估,考试的目的在于希望通过掌握学生整体表现,监控教学质量,以此获得全港学生学习水平的资料,为学校的学和教提供支持与参考。作为评估全港地区义务教育阶段学生情况的考试项目,TSA 评估包括面向全体和个别抽考两种方式,测量评估全港地区小学三年级、六年级和中学三年级学生群体,以获得小学至初中学段学生的学业情况信息。
TSA 评估较为全面,考核维度多元,以小学六年级英国语文学科(简称英语)为例,TSA 试题包括说话、听力、阅读、写作四个环节,这与我国内地大部分地区小学高年级英语测试只设纸笔考核有所不同。本文以近两年TSA 小学英语评估试题为例,对香港英语公开考试评估进行分析,以期为我国内地小学高年级英语测评提供参考,借鉴其经验,思考如何更好地改进小学英语评估。
TSA 有一套科学严谨的评估设计流程,详见图1[1]。以英语学科为例,由大专院校的学者担任试卷主席,主席带领英语专责小组制定评估蓝图,命题小组完成命题工作后,专责小组会对相应的试题进行审查,以确保评估题目的质量。专责小组成员通常由全港高等院校的专家及教育局和考评局的科目主任、校长和一线教师组成。小组成员一半以上是资深教育工作者,是具有专业知识和经验的考评人才,其中有经验丰富和训练有素的考试行政人才、开发考评及各种测评服务的专家,以及研究和发展测评工作的专业人员。
图1 TSA评估的设计流程
相比较而言,我国内地大部分城市在监测基础教育质量工作中,尚未能从当地的教育局事务独立出来,评估主体和模式比较单一。如广东省某一地级市教育局,负责基础教育质量监测只有下设的一个科室和三位学科科员,人员投入和研发经费比较单薄,专业的覆盖面不广,导致评估对地区的影响效果也相应减低。
TSA 评估和我国内地小学英语评估都属于基础教育质量监测,鉴于TSA 评估由社会第三方评估组织承接的做法,内地城市可以效仿这种教育评价机制,发挥社会组织专业性、权威性的特点,更好地保障和落实每位学生的教育得到评价。
1. TSA 试题设计参照我国香港地区的课程文件制定相应的评估目标。《英国语文课程第一、二学习阶段基本能力(试用稿)》《英国语文学习领域课程指引(小一至中六)(2017)》《英国语文教学质量大纲(1997)》等课程文件,为TSA 小学英语试题评估提供了设计依据。试题包括说话评估、听力评估、阅读与写作评估;其中,说话评估为口语考试,大约10-20分钟,听力和阅读与写作评估为纸笔考试,大约20-50分钟(见表1)。
表1 2020年度TSA小学英语评估内容安排
我国内地小学英语评估参照《义务教育英语课程标准(2011年版)》命制试题。大多只设纸笔测试,某些城市会有统一的口语测试,如福建省厦门市、广东省佛山市等,但考试形式也是以校本考核为主,较少出现当地教育局统筹的公开考试,因此口语考试的影响力度和广度相对较弱。故我国内地现行的小学英语考试基本是纸笔测试,通常由听力和笔试两大部分构成,时间约为60-90分钟不等。
目前,我国内地大部分城市对英语课程缺乏口语能力的考查,这是因为口语测试涉及的人员和资金投入较大,难以在大范围实施,因此还大量存在“哑巴”英语现象。参考TSA 评估开设“说话”考评的做法,在沿海地区师资力量充足的学校开展校本评核和口语测评,还是切实可行的。
表2 我国内地部分城市小学六年级英语考试
TSA 在试卷设计上通常有几份题本,以此涵盖语言学习的所有基本能力,每个学生只需作答其中的一个题本,题本与题本之间通过共同题目来连接,这种以锚题链接的不同题本设计可以更加直观地进行等值分数比较。表3 以2020TSA 六年级英语“阅读与写作”为例,描述全港性系统评估题本设计的模式。
表3 2019 TSA六年级“阅读与写作”题本设计(包括共同题目)
锚题将不同的题本链接起来,参加评估的学生在不同题本上的作答会合并成一个数据矩阵matrix,基于锚题(即共同题目)做等值,尽管学生作答不同的题本,但对学生的能力的估值不受试卷难度的影响,客观上保证了评估的信度和效度。
TSA 评估中的试题内容与香港地区小学课程文件紧密相连。评估内容直接影响学生的学习内容和学习方法,评估要随着课程的改革和教学目标的改变作出相应的改革,以全面评核学生是否达到知识与能力的目标,因此在评估中要充分体现课程目标[2]。具体锚题与课程要求一一对应,凸显两者相互呼应、互为作用的理念。见表4。
表4 2020TSA六年级英语评估试卷分布(题型相同为锚题)
从表中可以看出,TSA 评估包含阅读、写作、视听、说话四个范畴,既有锚题链接不同题本,又有不同的题目区分课程能力,全面覆盖英语课程培养的不同目标,促进学生“听、说、读、写”能力的协调发展。评估关注阅读篇章、聆听信息、口头表达和书面表达等英语学习内容的有机联系,引导教师处理好教与学之间的关系,避免单方面的知识或技能教学,使英语课程目标、内容与课程评估之间实现较好的统一。
我国内地小学英语考试的题目构建通常从知识内容和认知层次两个维度出发,知识内容是英语学习中的字词句篇、听说读写等项目,认知层次是指学生在学习过程中的认知能力,如识记、理解、分析等。
根据英语学科知识的特点,目前内地小学英语考试已有了明显的改变,在题型的权重上注意平衡。例如,考查英语词汇“识记”的试题比例下调,以往因为“识记”目标易于检测,而予以过高的权重,导致很长一段时期英语教学出现死记硬背的学习导向。由于对认知层次的认识调整,试题注重反映学生的年龄特点和认知发展,逐步增加高层次认知目标试题的比重,如增加开放性问题,考查综合性语言应用能力的看图说话题或作文题等。
表5 我国内地小学六年级英语评估试卷分布
TSA 小学英语评估主要包括说话和纸笔两种形式,说话评估主要检测学生在“开口说”“大声说”基础上进行的多项口语能力,包括大声朗读、师生交谈和个人描述等题型;纸笔评估则包括听力、阅读以及写作3 个环节。鉴于“说话评估”任务设计和评分方式灵活主观的特点,往往对评分员的要求很高[3],因此TSA 在香港考评局的安排下,一年安排两次考务简介会议,对学校评估行政及主考教师进行有针对性的培训,以确保评估项目的信度和效度得到有效实现。
TSA 六年级说话评估共有12 种题卷,每位学生只需随机选做其中一种。奇数卷共有“大声朗读”“师生交谈”两类必答题型,偶数卷是考生个人进行的讲故事或作话题演讲的口头报告。下面以2019年TSA 六年级说话评估为例,详细说明其具体的操作流程,见表6。
表6 2019 TSA说话评估模式流程
说话评估是由香港考评局从每所学校随机抽出12 或24 名学生来接受评估,考试时间分成三个时段进行,每个时段使用指定的题卷。如14 日上午评估24 位学生,使用题卷01-04,12 位学生使用单数卷,12位学生使用偶数卷。接受评估的学生同时段进行考核,既能保证充分运用评估时间,又兼顾了口语评估中要求的个人展示和双向交际的特点。
从具体的评估题卷来看,“大声朗读”话题紧扣学生的实际生活,能够快速消除学生对考试的畏难情绪,从而使学生顺利完成评估任务;师生互动基于“大声朗读”的基础之上,任务贴近校园生活,而并非是成人化、专业化的话题,因此学生能自由发挥、大胆地表达自己的感受,使互动成为双方真实的信息交流。如2020 年TSA 小学六年级英语评估的师生互动的题目有“Swimming”“A stormy night”等,考官会围绕各主题向学生提出关于wh-几个维度的问题,让学生就某一观念或问题发表个人见解和看法。如考官提出Have you seen any big rainstorms before?学生回答Yes/No.考官会追问Where are you on that time?由于考官问题是随着学生应答情境进行变化的,难以提前准备,更能体现应试者真实的口语表达水平。
口头报告是现时思考和临时组织语言生成的,注重考查学生语言表达的连贯性和灵活性,渗透语言的篇章意识和整体逻辑,体现语言的综合能力,具体题目见图2[4]。
图2 2020 TSA评估六年级“口头报告”试题
从题目可以看出,由于题材新颖无固化,学生无法提前背诵准备,这就需要学生在考场中联系自身的生活经历,对语言重新编码,因此能够更好地考核学生语言建构和实际运用能力。
TSA 评估把阅读与写作、听力两部分归为纸笔评估,考试时间安排在说话评估之后。以2019TSA英语评估为例,具体评估安排见表7。
表7 2019 TSA纸笔评估时间安排
同样是听力评估,TSA 在测试中注重年级学生的发展梯度,体现试题的递进难度,六年级题数比三年级题数多,考试时间也相应增加。为了体现学生在小学毕业时达到的听力水平,TSA 六年级的评估材料通常选取篇幅长、信息量大、真实语言载体的语篇,与三年级的单句有所区别。例如新闻报道、天气预报、人物现实对话、故事等等,用以考查学生在真实语境中的听力水平。以2020TSA 小学六年级听力评估中的试题为例,Listen to the news on the radio 属于新闻报道类,文本播报了3 则新闻内容,分别是一则交通事故,两起高空抛物的事件,最后是天气预报。听力试题在播放过程中均预留了阅读卷面问题和答卷时间,对篇幅较长的文本作了总听-细听-检查的答题设定,及时消除学生的陌生感,给予学生思考题目的停顿时间,体现了语言学习循序渐进的规律。具体结构见表8。
表8 2020 TSA小学六年级听力试题“听新闻报道”
听力评估充分考虑到学生的心智特点和语言水平,预留正式作答的阅卷时间,保证学生的思考和涂卡时间,既考虑到学习者的实际情况,又能对听力材料进行局部处理,这些做法都是值得现行听力评估借鉴的。在我国内地小学的一些英语听力考试中,会出现考虑不周或考题过难的情况。听力语篇过长过难,没有预留足够的答卷和思考时间,从而造成录音内容和答题割裂,学生在没有预留停顿思考的录音播放过程中,来不及思考和搜寻信息,从而错过答卷时机,容易造成听力考核失效的普遍现象。
近年来,TSA 评估吸收了当前语言发展的新理念,在相关的测试环节中引入语篇概念,调整各环节的题目数量比例,结合学生生活内容的变化,引入新颖、时效性强的语言材料,使TSA 评估呈现持续健康的发展趋势。其特点能为我国内地小学毕业阶段的英语测评提供参考。
阅读与写作是英语评估两个主要的测评维度。同以往TSA的试题不同,2020阅读评估设增加到4个语篇,语篇体裁丰富多元,有场景剧本、寓言故事、韵律诗、谜语等。每份题卷共有32道题,包括单项选择题、填空题、填表题等,分值为32分,是TSA评估中分值最高的一项,突出了阅读在英语学习中的主要地位。以2020年TSA阅读评估中一篇Betty is watching a play为例,语篇设计5个答题部分,每部分分别有选择题、填空题和排序题多种题型,尽可能地调动学生运用不同的阅读策略去完成任务。具体见表9[5]。
TSA 英语评估体现了当前语言教学中宽泛的语言知识观,强调在“篇”中理解语言、建构语言,改变学生重复机械学习浅层语言的情况,设计了如表9中意义、思维相互连贯的话题语篇,充分利用语篇的功能和结构,使学生能够了解不同语篇的组织结构和承载的语言意义。表9 中,Betty 阅读三个人物John、Jim、Mary 在购物广场购物的 3 个场景,故事分成4 个部分的小语篇,学生要完成5 个环节的答题。在这个过程中,学生能够清楚了解到每个人的购物倾向和消费观,小伙伴甚至还争辩起“I(Jim)really hate(s) shopping for food in a supermarket with my(his)mother.”Jim 陪伴妈妈购物时的不耐烦态度是否妥当?故事的最后,John 情愿冒上被妈妈批评晚归的可能,也要坚持和Mary 在喷泉旁边等待Jim 一起回家,三个好朋友又回到和好如初的故事。语篇内容贴近学生生活实际,场景的表达具有现实意义,贴近学生的兴趣倾向,反映他们内心的想法而引起共鸣,能让学生迅速克服阅读困难,比较顺利地完成评估任务。
表9 2020 TSA六年级阅读评估试题基本结构
2020TSA 小学英语写作评估是变化最大的一个部分,体现了写作理念的新方向。在以往的评估中,写作作为独立部分出现,主要的考试形式是思维导图为载体的命题写作,形式单一,思维训练固化,要求学生能写出80 词左右的文章,评估要求比较高。2020 年TSA 的写作题型发生变化,引进了我国内地高考的新题型——读后续写的形式。在我国内地一些高考试验省份中,读后续写是要求考生在阅读350词左右短文的基础上,按照原有的故事脉络,合理续写两段内容[6]。TSA 评估率先引进该题型,设计符合儿童认知特点的语篇,贴合小学生的语言表达水平,降低书写词汇的数量要求,用评估导向学生高年段的语言写作,很好地架起语言阶段学习的桥梁。
同样以2020TSA 阅读评估Betty 阅读三个人物John、Jim、Mary 在购物广场购物的短文为例,学生经过对文本的深耕研读后,紧接着写作部分随即提出If you were John or Mary,would you be angry with Jim? Why or why not? Write about 30 words.从中可以看出,TSA 善于引进新题型理念,引导学生改变以往长期粗放式的阅读习惯,转向对文本精细化的研读,让学生在阅读过程中模仿语言表达的形式,从而切实提高写作质量。此外,TSA 评估注重写作的真实性,大量使用实际生活中的文体,如写回信、家庭防火提示、想象性故事等,这样的语言知识观更加强调语言知识和语言运用两者之间的紧密结合,有效地整合了学生的语言综合运用能力。
评估标准不仅是教师设计评估任务、学生自我评估的基础,也是解释评估结果、构思反馈的依据。在TSA 英语评估中,有别于纸笔测试的客观题,说话评估没有一致的答案,如何区分学生口语水平高低,成为保证整个评估系统信度和效度的重要一环。依据课程目标和学生的认知情况,TSA 制定的评估标准采取了“等级维度、水平描述和附作品样例”形式,等级范围清楚,描述清晰,便于操作。以2020年TSA小学六年级英语评估“师生互动”环节为例,评估标准从说话内容和语言使用两个维度来评估学生,依据学生的不同表现分为五个等级,4 级为最高等级,逐级递减(见表10)[8]。
表10 TSA小学六年级师生互动评估标准
TSA 说话评估的各个环节都制定了一一对应的评估标准,标准划分等级清晰,描述具体,而且提供了样例来预测考生的其他表现,便于教师在实际中操作,也避免了双方由于交际中的随意性和模糊性带来的评估困难。
我国香港地区从2004 年起,每年坚持实施TSA评估,以评价导向课程标准的具体实施,促进学生学习方式的改变,使教师的教学行为与课程实施紧密相连,体现了考试的导向作用。探究TSA 英语评估的理念,借鉴其经验做法,能为内地小学高年级英语教学带来一定的启发。
我国英语实施课程改革以来,虽然学生英语水平进步的幅度较大,但课堂重听写、轻读说的现象还是普遍存在的。教师在课堂上处理语言知识耗时过多,让学生失去练习语言技能的机会。TSA 英语评估把说话作为独立成项的评估内容,这是源于香港地区有相关专职部门编制命题,组织开展测评工作,对相关测评人员进行培训等,教育成本投入较高。在我国内地大部分地区由于需要的资源投入较大,难以做到如香港地区的统一考试。一线教师可以效仿TSA 重视学习过程的做法,在课堂上多采用课堂提问、校本考核、书面评语等方式对学生进行过程性评价。
例如,小学高年级的学生自我意识逐渐发展,对教师的作业反馈越来越重视,教师可以想办法在书面反馈这方式上采取打分、评语或等级和评语相结合的方式。比如,You does your work neatly. You’re on the right track in trying to solve the problem. 在作业中,教师的评语不仅告诉了学生已经取得的成绩,还有提供指导意见引导下一步该如何做。What’s the difference between the words? You marked the rules about the question,but does it help you understand the relationship between Q&A?作业本上的书面评语以及教师的口头评语具备反馈及时、贯穿学习过程等特点,能实时反馈学生的学习。
在评估中,学生作为评估的主体之一,需要在评估前清楚认识达到目标时的各种表现,因此,教师应该和学生一起制定评估的标准,让学生产生良好的参与感,消除评估带来的焦虑。例如,教师先引导学生说出优秀表现的考量指标,提供参考的范例,然后学生参考标准指引,讨论或修订各项评量标准。在“说话评估”这类考试中,教师可以提供TSA 中对Reading Aloud 的考量目标,来培养学生口语表达时达到的最佳水平。如① Reads fluently and clearly with appropriate pausing and intonation. ②Make a very few or no pronunciation mistakes. 为了提醒学生在互动环节和交流者要有眼神交流的交际策略,教师还可以出示“Award a score level of 1 if the student has appropriate eye contact with the oral examiner. 如果学生与口试考官有适当的眼神交流,就给1分”,引导学生养成与人沟通的交际策略。
TSA 英语评估并不是一成不变的,它在实施过程中也不断吸取前沿的教学理念和评估做法,如2020年TSA阅读与写作评估题型有了新变化,这是源于引进我国内地一些高考试验省份读后续写这种新的考查方式。它旨在考查学生的综合语言运用能力,能全面提升语言学习的有效性。在小学六年级英语课堂上,教师可以在阅读教学中细化研读文本,让文本研读为读后续写提供内容和语言。例如,笔者在粤人教版《英语》引进课外语篇Great Shun大舜的故事,先让学生明确时间顺序,按照故事情节发展“起承转合”四个层面进行语篇梳理,组织阅读教学过程,使学生掌握故事的发展脉络,并绘制思维导图,见图3。
图3 六年级课外语篇Great Shun故事脉络图
根据这一图示,学生能清晰地概括出大舜成长的关键性事件,理清故事的前因后果,理解故事发展进程。最后教师提出启发性问题:The old emperor-Yao come to Chonghua’s house and said: I will give you a big house and food,but you can’t help your family anymore. If you are Chonghua,do you agree?Why or why not? Write down 30 words. 教师基于文本,在故事结尾创设尧和大舜谈话的情境,通过给予大舜粮食、房舍等奖励,提出要大舜接受不能和家人相见的条件,更不能帮助他们,假如你是大舜是会如何做。学生通过对故事语言的学习,会表达出I will help my family all the time,because my mother once talked to me be kindly with everyone. 在分析文本的基础上,有语言框架的支持,学生能更容易地进行仿写或续写,实现语言和思维的双发展。
TSA 英语评估紧密联系香港地区的课程标准,重视语言测试的基本要素,考核范围包括听、说、读、写四方面,全面指向学生的基本能力,这些做法和经验对于我国内地展开英语测评,改进课程与教学有着重要的参考价值和意义。但正如任何一种评价项目都有着长处和不足,我们要理性看待TSA 评估的结果和现象,也要从TSA 评估中可能忽略的考量指标,积极构建适合本土操作的测评手段和体系。