王旭东/浙江省温州市教育评估院质量评价科科长
浙江省基础教育课程改革专业指导委员会委员
王旭东
长期以来,小学生学科评价结果以总分呈现,已经成为学生负担压力的源头。随着教育评价的改革推进、中国学生核心素养的落实,小学生学科学业评价要消除分数化评价,实施项目化、等第化评价。各小学都应构建以校为本的学生学业评价体系,有效促进学生有意义的学习和健康成长。
学生学业评价体系主要由各学科测评内容项目、测评方式和评价标准组成。评价体系必须基于课程标准,基于本校教与学的实际,结合学校办学理念和特色,体现校本化评价。
区域性统考通常采用纸笔测试,统考结果通常以学科总分形式出现,学科等第划线也是全区域一个标准,这些数据常常用于学校教学质量评定、教师教学业绩评定,加剧了“唯分数论”的导向,成为小学生学业负担和学习压力最重要的来源。在2016年浙江省教育质量综合测评中,温州市72.1%的四年级学生认为主观学业负担较重,29%的四年级学生有学习焦虑,主要表现在于“校内各种考试太多”“学校老师布置的作业太难”和“家长、家教、辅导班等布置的作业太多”。数据还发现四年级学习压力感较大的学生,其主观幸福感、自尊心、师生关系、同伴关系、亲子关系等表现较差,其一般焦虑感较高、学习焦虑感较高、网络成瘾的人数比例明显偏高。这些压力负担与学生作业量感受、考试频率感受、学习紧张、作业难度、考试难度、课堂教学内容难度、校内竞争压力、考试焦虑、课外作业量感受、父母攀比压力、父母期望压力等显著相关,这些相关因素都与分数评价显著相关。
2001年,教育部《基础教育课程改革纲要(试行)》指出,“改变课程评价过分强调甄别与选拔的功能,发挥评价促进学生发展、教师提高和改进教学实践的功能”,也就是说,中小学课程评价要促进学生的学习和发展,促进教师的专业发展。2014年,浙江省教育厅发文明确规定:“严禁在小学低年级统一考试,严禁按成绩给学生排名”,“小学低年级段不准采用统一的纸笔测试”、“一二年级期末考试和考查推广非纸笔测试形式”。在省教研室评价部门的引领下,全省各地学校纷纷尝试项目式评价,无分数化评价。2016年9月,上海市教委发布《关于小学阶段实施基于课程标准的教学与评价工作的意见》和《小学中高年段基于课程标准评价指南(征求意见稿)》,要求小学中高年级语文、数学、英语三门学科实施“等第制”评价,从小学低年段向中高年段延伸,同时低年段“等第制”评价还从语数外扩展至所有学科。浙江省也要求小学各年级各学科成绩评价都要项目化,各项目评定都要等第化,项目和等第设置要校本化。
采取等第化评价,消除了“分分计较”的思想,会明显降低学生的学业负担。上海从2013年起,在小学一二年级实行“等第制”评价,“学生学习压力小”的比例已从30.93%提高到74.19%。消除课程分数化评价是对“甄别与选拔功能”的釜底抽薪的重要举措。
项目测评类型通常分为纸笔性评价、表现性评价和过程性评价三类;中高年级段学生学科评价由过程性评价、表现性评价和纸笔测试三类组成;低年级段学生学科评价由过程性评价和表现性评价两类组成。
表现性评价。表现性评价通常要求学生在某种特定的真实或模拟情景中,运用先前所获得的知识完成某项任务或解决某个问题,以考查学生知识与技能的掌握程度、问题解决、交流合作和批判性思考等多种复杂能力的发展状况。测试内容体现多维度学习目标,具有一定的复杂性和开放性,表现性评价能够检测高级认知能力、情感、态度等重要的教育结果,重点测评动手实践、合作交流与创新能力、情感和态度等内容与领域,弥补纸笔测试的不足。表现性评价侧重听、说、读、讲、演、奏、做等方面,通常以比赛、活动、展示、项目测评等方式进行,如常见的游园考、乐考悦考、闯关考、期末嘉年华等。
过程性评价。过程性评价是对学生日常学科上课、作业、活动等学习过程中表现出的学习行为、学习态度、情感和价值观等综合性评价,是基于学生学习生活全过程的观察和记录做出定性评价,可以采取教师评价、学生自评和同学评价方式进行。
过程性表现类通常还可以分成作业评价、课堂表现、学科活动等子项目。作业评价侧重作业态度、作业的准确性、完成的及时性、自我订正表现等。课堂表现侧重课前准备、听记认真程度、提问交流、小组合作等。活动参与指学生参与学科性活动的积极性和效果,如语文的课外阅读、科学的家庭实验室等。也可以直接将这些表现整合成一个项目“平常表现”。
纸笔性评价。小学一二年级不允许纸笔测试,小学中高年级段的语文、数学、英语和科学学科每学期末可以进行一次纸笔测评。提倡以校为本的纸笔测试,反对区域性统一纸笔测试。校本化纸笔测试,要注意难度的把握,要发挥测试的激励功能和诊断功能,要发挥纸笔测试的优势,要提高教师的命题能力,加强试卷命题过程的管理,优化试卷的质量。
纸笔性题目具有覆盖面广的优点,侧重考查知识的记忆和理解。表现性评价题目具有深度性和实践性的优点,侧重实践应用和综合能力。过程性评价具有考查学习品质、学习态度等综合素养等优点。由单一的纸笔测试转向多元化测评,使得测评内容立体丰富,能弥补单一测试类型的局限。
纸笔测试试卷往往要讲究内容结构效度和重难点。现在要把一个学科测评“拆分”成几个项目测评,这几个项目相当于以前一份试卷中的几道“大题目”,这几道“大题目”必须体现学科核心能力和重要知识模块。
测评项目结构要完整
上海要求各学科围绕学习兴趣、学习习惯和学业成果三个维度设置学科特色的评价项目。笔者认为,学科测评项目的构建可以从学习结果和学习过程两个维度展开(见表1)。学习结果的评价通常采用表现性评价和纸笔评价,要处理好两者的内容整合性。学习结果评价可以从“知识、能力”和“技能、情感、态度”两个方面进行再分解。
知识、能力方面侧重学科知识模块和低层次认知能力,测评类型以纸笔测试为主。例如:语文学科从知识模块角度可以分解为现代文、古诗文和写作等子项目。数学学科可以分解为数与代数、几何与图形、统计与概率等。
技能、情感、态度方面侧重学科高层次能力和行为化的技能,测评类型以表现性评价为主。例如:语文表现性评价方式可以采用写字、手抄报、故事会和朗读演讲、无领导小组讨论等。数学表现性评价方式可以采用口算、估算与笔算(含计算器使用)、动手操作(拼摆、画图、制图、模型制作等)、真实调查统计测量等。英语表现性评价可以采用课文复述和口语、唱英语歌曲、讲英语故事、编演英语课本剧等。科学学科可以采用实验操作、系列观察、科技制作、研究小报告等。音乐学科可以采用现场视唱、打节奏、演唱(独唱、合唱)、舞蹈、演奏乐器等。美术学科可以采用现场书法、绘画、泥塑、剪纸等。
学科备课组要做好学科项目整体策划案。依据教材内容和教学实践,确定项目数量、各项目测评重难点、测评方式和测评时间。做到项目数量合适,项目评价质量优胜;测评方式丰富,突出表现性评价;测评时间分散,避免集中在期末。
项目内容要突出重难点
学科学业评价主要考查学生的学科基础知识、运用学科知识解决实际问题的能力、学科学习有关的中国学生核心素养。运用学科知识解决实际问题的能力主要指学生利用学科知识解决真实情景和科学情景等实际问题的能力,参与实践活动的情况及其在实践活动中的具体表现。学科学习有关的中国学生核心素养主要指学生的学科思想与方法的领会情况,包括知识迁移能力、观察和解释能力、预测推理能力、批判性思维和创造性思维能力等,还有学生的学习习惯、方法、能力和意志品质等素养。例如:语文学科要突出听、说、读、写的能力;科学学科要关注学生科学知识与方法、科学意识与实践探索能力;体育学科要关注学生体育与健康知识、体育技能与体质素养、意志品质等;音乐学科要关注学生音乐知识与技能、欣赏、审美与表达能力。
表1:学科测评项目的构建
表2:学科学业评价项目体系
目前,我们发现学校表现性评价出现简单化、形式化、娱乐化倾向,很容易导致考查重难点不突出,很难反映学科学习的整体效果。笔者认为,表现性评价要内涵化、课标化,要求项目内容具有一定的覆盖性和典型性,保证项目测评的结构效度。每个项目也要保证测评的科学性和准确性,必须基于课程标准,必须突出重难点,保持“教-学-评”的一致性。例如:常见钟表问题的表现性评价试题:评委先把时钟模型的时针和分针各拨到一个位置,让学生读数;再告知学生一个时刻(如8点15分),要求学生将时针、分针拨到相应的位置。这样的试题只测评钟表读数,钟表读数并非课程的重点内容。因此,这个试题应该如下改编:评委先把时钟模型的时针和分针各拨到一个位置(如9点35分),让学生读数;再把时针和分针各拨到13点10分位置,问学生时间变了多少小时?多少分钟?改编题不仅测评钟表的读数,而且测评了学科重难点——时间单位的转化。
学龄儿童一旦进入小学,在与同学一起学习、游戏和活动中,很容易出现与“他人比较”的心理,会发现自己许多地方“不如他人”,尤其小学生学业成绩的分数的微弱差异,也会导致学生的自信心下降,影响身心健康成长。虽然我们都明白,小学生成绩区分度很低,难度值基本上高于0.85,相差一两分没有多大价值,但是很容易用于排名,很容易被儿童误解为“差异很大”;采用等第评价,可以淡化排名现象和“差异感”,有利于强化学生的自信心,减轻学生的学业负担。
等第化评价采用三个等级比较合适。建议用星级表示,如★★★、★★、★,或AAAAA、AAAA、AAA。不提倡采用优秀、良好和合格。如此表达,符合学生和家长的心理。
笔试成绩等第划线通常有两种,一是基于测评分数,这种划线要充分考虑试卷的难度和效度,试卷难度过高过低都会影响划线。二是基于排名,这种划线方式可以避开试卷难度的影响,但是有“竞争”的意味。笔者认为,小学笔试评价等第划线应将这两种方式进行整合,本着“发挥评价结果的导向性和激励性,促进学生的发展”划线。在实际操作中,允许补考或免考,尽量引导学生通过努力达到最高级别。
表现性评价标准要与量具同时完成。在具体测评时,要引导学生尽可能达成最高级别。例如,小学二年级数学“测量”项目:用10厘米长的三角尺量一根弯曲没有弹性的长24厘米的毛线。评价分为三档:拉直毛线,一尺一尺量,方法和读数正确,得★。对折一次,量一次,再量一次(或估算),方法和读数正确,得★★。对折三次,量一次,方法和读数正确,得★★★。小评价师可以用“你还有什么更快捷更科学的方法吗”引导学生获得★★★。
过程性评价的评价标准必须在开学初公布,让学生对照评价标准管理自己,发挥评价的导向功能。可以采取学生自评、同学他评、教师评价等多元主体评价,特别要凸显个人自评,自评不仅仅是一个评价过程,更是一个自我反思的过程,自我评价素养对孩子未来的成长具有较大的影响力。
图1
学校层面顶层设计宏观化
学校层面顶层设计思想应该为“测评内容突出核心素养,形式侧重表现性和过程性,组织有学校特色”,分别依次从测评时间、测评学科、测评年级和测评方式四个维度进行策划和优化,如图1所示。
测评时间集中在期末,由于时间和工作量紧张,测评项目数量会受到很大的限制,影响了学科内容的结构效度。学校要根据学习进度将测评项目分散在各月份,各课程每学期可以安排2~4次,让各项目考查的时间比较充足,保证考查的深度和广度。过程性评价通常分为两次,一次安排在期中,发挥督促和导向功能。纸笔测试安排在期末,不建议在过程中实施。各学科测评都必须以表现性评价为主。
学校层面的顶层设计要关注时间结构的均衡性、年段项目数量与结构的均衡性、学科项目与结构的均衡性,要关注整体氛围和主题的设计,尽心尽力测评出每个学生的优点、潜能、不足及发展态势。
年级评价体系要整合化
年级段学业评价主要从组织成本上思考评价体系,要对各学科的评价项目进行结构优化,尤其在各学科项目的数量和时间上进行协调,对有些不同学科项目进行合并整合。例如:英语听说能力和语文听说能力可以合并到“听说能力”,也可以把各学科的平常表现整合成三类:语文、数学、英语等学科的平常表现,体育、艺术、技术学科的平常表现,拓展性校本课程的日常表现。
学科评价体系要专业化
各学科课程的测评项目的数量和内容要依据课程标准、教学内容、学科特点、教学实际、学生兴趣、学校特色等做策划。各学科组要对本学科的学业评价做中观设计,既要充分研究学科项目评价,也要兼顾相关联的拓展性课程的项目评价。就是同一个项目,在不同学期、学年也要有不同的要求,不同的评价标准,保持“教-学-评”的一致性。如语文的写作,随着学段的提升,水平要求也在提高。
学科组的设计体现学科的专业性,要关注项目结构、项目内容的科学性和学科特色,保证各项目测评的有效性,可参考表2进行设计。
学生的成绩单由学校发布,由学校统一盖章,表明学校是学生评价的主体。然而,由于长期存在普遍性的区域统考、校际联考,导致学校自我命题权、成绩认定权等评价权不断沦陷。随着课程和评价改革的推进,学校特色化、个性化建设和拓展性课程校本化的研发得以进一步实施,教育行政部门和校长逐渐恢复“学校是学生评价主体”的理念,都认识到“一套区域性统一的纸笔试卷不能科学评价不同学校的学生”,特别是《中国学生发展核心素养》发布后,学校必须建立以校为本的学生学业成绩评价体系,才能促进学生全面又个性化的发展。学业评价校本化,可以消除校际之间的横向比较,有利于淡化“教育的功利性”。
各地教育行政部门都发文严格控制小学生区域性统考,随着政策的执行力度加大,区域性统考现象逐渐减少,学校层面自行组织的考试越来越多。上海市实施小学等第化评价以后,很多学校基于市教委的评价指南,开始研制学校的等第制评价方案,引领等第化评价校本化。温州市建设小学、广场路小学、石坦巷小学、平阳县鳌江小学等已经先行一步,各学科采取项目等第化评价。这些学校同一个学科测评的项目数量不同、项目内容不同、评价标准不同、测评方式不同,初步体现了学生评价校本化的思想。
小学生学业评价改革依然任重道远。一改传统的分数评价,实施项目化、等第化评价,学校和教师都会遇到巨大的困难和挑战。学校必须结合课程体系、办学理念、学校特色和学校实际,做好顶层设计,创设积极的评价改革氛围,让项目化、等第化评价成为学校文化的重要组成,成为落实中国学生核心素养教育的最重要途径之一,从而促进学生优质学习和健康成长。