顾乃景
教学评价是教育教学的重要环节。科学素养评估框架的建立对教学目标制定、课程实施、学业测评等具有重要的指导作用。《全民科学素质行动规划纲要(2021-2035 年)》提出:“完善科学教育质量评价和青少年科学素质监测评估。”[1]促进我国科学教育评估水平的提升,需要立足我国国情,同时积极借鉴国内外先进经验。每四年举办一次的国际数学和科学教育趋势评估(Trends in International Mathematics and Science Study,TIMSS)作为当今世界上大规模学生评价的典型模式之一,凭借其“科学性”得到了广泛认可,目前已发展至TIMSS 2023。作为最新的一次评价,TIMSS 2023突出强调“数字化评估”特点。本文从评估内容和试题编制两方面介绍TIMSS 2023 科学评估框架的概况,同时结合与历次科学评估框架的比较,为我国的科学教育评估提供参考。
TIMSS 2023 科学评估框架施测对象为四年级、八年级学生,主要围绕“内容领域”“认知领域”和“科学实践”三个维度。具体而言,内容领域(content domains),即需要评估的主题;认知领域(cognitive domains),即评估的思维过程。这三个维度凸显了TIMSS对科学课程实现程度的考查清晰度。
1. 凸显“分段”“分层”特点,内容数量缩减
由表 1、表 2 可见,就整体内容而言,TIMSS 内容领域呈现“分段”“分层”的显著特点。“分段”即其内容主要针对四、八两个年级且具体内容有所差异。“分层”指具体内容领域下,均包含一定子领域(或相关主题范围),每个子领域下又涉及一个或多个主题,每个主题又可以通过具体细化的目标来得到进一步的解释和说明,这些目标代表了学生应掌握的预期知识、能力和技能。“分段”“分层”的特点充分体现了TIMSS“遵循学生认知发展规律,如阶段性、顺序性特点”及“将评测能力外显为具体化、可测量的行为”的设计理念[2]。就TIMSS 2023 而言,基于“四、八年级所教授的科学性质与难度存在不同”,四、八年两个年级内容领域具体内容及占比有所不同:内容上,四年级包含生命科学、物质科学、地球科学三部分,八年级则包含生物、物理、化学、地球科学四部分。占比上,八年级生物占比为35%,虽仍超过1/3,但相较于四年级生物科学45%而言,下降了10%;在八年级中,物理与化学是两个新增的独立内容领域,其相较于四年级物质科学更加细化,且总比例增加了10%;地球科学领域,两个年级占比相同,均为20%。
表1 TIMSS 1995-2023四年级内容领域变化情况
表2 TIMSS 1999-2023八年级内容领域变化情况
纵向上看,历次评估内容数量上总体呈缩减趋势。TIMSS 1995主要针对五个年级学生进行科学评估:9岁占比最大的两个年级,即多数国家的三、四两个年级,13 岁占比最大的两个年级,即多数国家的七、八两个年级,以及中学教育最后一年的学生。其科学框架在9 岁(三、四年级)阶段涵盖生命科学、物质科学、地球科学、环境议题和科学本质四个内容区域(content areas),13 岁(七、八年级)阶段包含生命科学、物理、化学、地球科学、环境议题和科学本质五个内容区域[3]。TIMSS 1999 主要针对八年级学生进行科学评估,基于“科学数据比较分析的便捷性”,将TIMSS 1995环境议题与科学的本质细分为环境与资源议题、科学探究与科学本质两部分,由5 项转为6项,且相关比例有所调整,即包含地球科学、生命科学、物理、化学、环境和资源议题、科学探究与科学本质六个内容领域(content domains)[3]。
TIMSS 2003 以来,评估对象固定为四、八年级。具体而言,在四年级阶段,六次评估内容领域及评估时间占比未发生变化,均包含生命科学、物质科学、地球科学三个内容领域。而在八年级,TIMSS 2003将TIMSS 1999 环境与资源议题、科学探究与科学的本质两部分合并为环境科学,由6 项转为5 项,且相关比例有所调整,即生物、物理、化学、地球科学、环境科学五个内容领域;TIMSS 2007 删去TIMSS 2003环境科学部分,由5 项转为4 项,且相关比例有所调整,即生物、物理、化学、地球科学四个内容领域,并沿用至TIMSS 2023[3-10]。可见,数量上的变化特别是内容领域的整合精简,如四年级评估重点侧重于生命科学,而八年级评估更强调物理、化学[11],突出反映了TIMSS“遵循学生认知发展年龄阶段性的特点”。此外,科学教育本身就是一门跨领域的交叉学科,涵盖了生物、物理、化学、地理等多个领域的知识,科学素养的培养也需要多个学科的有机联系,TIMSS 2023的内容领域分类充分展现了“综合性”的特点。
2. 重视知识逻辑体系,主题日趋精炼
针对四、八两个不同年级,历次评估主要呈现“项数减少”“细节变化”“主题精炼”的特点。就四年级而言,TIMSS 以“加强学生对日常现象的理解”为目标。三个层面的主题内容均经历过两次大的变化:
一是项数减少,如TIMSS 2007 物质科学较之TIMSS 2003 由 9 项 转 为 6 项 ,TIMSS 2011 较 之TIMSS 2007 由 6 项转为 3 项,至 TIMSS 2023 物质科学由三个主题构成:“物质分类、特性和物质变化”“能量形式和转化”“力与运动”,主题日趋精炼。
二是细节变化,如TIMSS 2023 生命科学“人类健康”较之TIMSS 2019 更改较大,明确指出“将常见传染病的传播与人类接触(如触摸、打喷嚏、咳嗽)联系起来;确定或描述一些预防疾病传播的方法(如接种疫苗、洗手、与病人保持身体距离)”,这与当前全球新冠疫情肆虐的背景相关联。TIMSS 2015 之后,物质科学更加重视四年级学生对物质常见状态和形式变化的了解,这与学生身心发展阶段相符合,也为后期物理和化学的研究学习奠定了基础。TIMSS 2019之后地球科学更加注重学生对与自身生存息息相关(或者说有直接影响)的知识的学习,如天气、气候等,这些变化充分反映了TIMSS 评估立足于“现实情境”的特点,重视与实际生活的紧密联系。就八年级而言,TIMSS 以“使学生学习理解实际应用中所需的中心概念和原则,以便为以后进行更高级的学习做准备”为目标。与四年级类似,四个层面的主题内容均经历过两次大的变化:一是项数减少,如化学自TIMSS 1999以来,项数经历了多次变更,TIMSS 2003将TIMSS 1999 主题总数由3 项扩展为6 项,TIMSS 2007将TIMSS 2003主题总数由6项又缩减为3项,至TIMSS 2023化学由三个主题组成:“物质的组成”“物质的性质(特点)”“化学变化”。二是细节变化,如TIMSS 2023生命科学“人类健康”较之TIMSS 2019更改较大,更突出了“对疾病的原因、传播、预防和抵抗:描述常见的病毒、细菌和寄生虫疾病(如流感、麻疹、艾滋病毒、Covid-19、破伤风、疟疾)的原因、传播和预防”。同四年级生命科学类似,这与当前全球新冠疫情肆虐的背景相关联。此外,具体顺序描述有所变化,如TIMSS 2023 地球科学将“地球资源及使用和保护”置于“地球在太阳系和宇宙的位置”之前,更加符合认知常识。总之,TIMSS 2023 内容领域的设置充分反映科学技术的发展和对人类及社会的影响,体现了科学性、前瞻性和现实性的统一。
1. 基于良好的科学基础,更加凸显应用的重要性
对学科知识的认知维度进行清晰界定,可以达到知识科学分类的效果,从而促进学生对相关知识的有效理解。TIMSS 2023科学认知是指学生在评估过程中“需要参与”的思维过程,即学生在认知领域上应该达到的水平,由知道、应用和推理三个层面构成[12],详见表 3。
表3 TIMSS 2023科学评价框架的认知维度评价构成
知道、应用和推理三个层面的确定基于布鲁姆教育目标“认知领域”的分类,具有良好的科学基础。具体而言:知道层面,是学生在准确且广泛的事实知识基础上,回忆、识别、描述及提供事实、关系、过程、概念、程序和设备的能力,TIMSS 2023知道层面具体包括识别、描述、举例三个层次。应用层面,是学生将概念知识(如相关科学事实、关系、过程、概念、程序和设备的知识)与特定背景相结合,并使用这些知识对相关材料(组)进行比较、对比及分类,从而形成解读(解释)并解决问题的能力,TIMSS 2023 知道层面具体包括比较/对比/分类、联系、解读模型、解读信息、解释五个层次。推理层面,是学生综合使用相关证据,分析、归纳出结论,以便更好地应对复杂或陌生环境的能力,TIMSS 2023推理层面具体包括预测、设计、评估、得出结论、分析、综合、概括、证明八个层次。认知领域三个层面均在四、八两个年级进行使用,但每个层次目标的占比不同,这与学生认知能力、经验理解的广度和深度有关。如基于学生的认知发展规律,TIMSS 2023 八年级推理层面的比例较之四年级上升了10%,更加凸显高年级学生推理特别是证据使用能力的提升。
纵向上看,在 TIMSS 1995、1999 中,并未涉及“ 认 知 维 度 ”,而 是“ 表 现 期 望 ”(Performance Expectations),即期望学生展现的科学行为,TIMSS 1995 主要包括“理解简单信息”“理解复杂信息”“理论化分析和解决问题”“使用工具、常规程序和科学过程”“调查自然世界”五部分,见表4、表5。总体上,TIMSS 主要是围绕“问题解决”,相关能力划分符合学生实际情况,并伴随年龄增长日益重视推理能力的发展。
表4 TIMSS 2003-2023四年级认知维度评价构成变化情况
表5 TIMSS 2003-2023八年级认知维度评价构成变化情况
2. 水平界限日趋具体化,重视思维能力水平发展
由表 6、表7、表 8 可见,自 TIMSS 2007 将认知维度定义为“知道”“应用”和“推理”以来,三个层次的具体内容日益呈现“具体化”“清晰化”“逻辑化”的特点。在“知道”层面的具体考核内容方面,TIMSS 2007、2011 均为5 个水平但具体内容有所变化,如“应用工具和程序”改为“应用科学工具”。TIMSS 2015 将 5 个水平调整为 3 个水平,即“回忆/识别”、“描述”和“举例”,并沿用至TIMSS 2019。TIMSS 2023 将“回忆/识别”简化为“识别”,各个水平之间的界限更加具体化、清晰化[13]。在“应用”层面的具体考查内容方面,TIMSS2007、2011 都是 6 个水平且无差异。TIMSS 2015 删去“寻找解决办法”,并将“关联”置于“使用模型”之前,6 个水平调整为5 个水平并沿用至TIMSS 2019。TIMSS 2023 将“使用模型”调整为“解读模型”,使得难度有所降低。在“推理”层面的具体考核内容方面,TIMSS 2007-2023 都是8个水平但有所调整,如TIMSS 2011 将TIMSS 2007“分析/解决问题”简化为“分析”,“设计/计划”简化为“计划”。TIMSS 2015 将 TIMSS 2011“整合/综合”简化为“综合”,“假设/预测”改为“形成问题/假设/预测”,并将“评估”置于“得出结论”之前,并沿用至TIMSS 2019。TIMSS 2023 将 TIMSS 2019“形成问题/假设/预测”简化为“预测”,并将“分析”“综合”置于“得出结论”之后,使得整个推理逻辑性更强。总体上,历次评估变化中,三个层次水平难度虽有所降低,但界限日趋具体化、清晰化,更加重视学生思维能力水平的发展。
表6 TIMSS 2007-2023“知道”层面变化情况
表7 TIMSS 2007-2023“应用”层面变化情况
表8 TIMSS 2007-2023“推理”层面变化情况
科学实践方面,TIMSS 重视过程性评价,突出“基于证据”。科学实践(Science Practices)是TIMSS 2015提出的新概念,其目的在于“帮助学生更好地发展自身进行科学研究的理解力”。在此之前,TIMSS 1999-2011中并未涉及科学实践这个概念,而是科学探究(Science Inquiry)[2],其中 TIMSS 1999 并未单独列出“科学探究”,仅将其纳入“科学探究与科学的本质”(Scientific Inquiry and the Nature of Science)内容领域之中。由表9 可见,TIMSS 2023 科学实践列出了五个具体的方法:根据观察和理论提出问题、设计调查并形成证据、处理数据、回答研究问题、基于证据展开辩论。
表9 TIMSS 2023科学实践五个方法[10]
科学探究重视“分析数据”及“解释问题”,而科学实践重视“以证据为中心”及“理解科学本质”,更加强调科学实践的闭环性,即问题的提出与解决(解释)均建立在证据基础之上,同时强调后续的辩论,更加深化学生对相关实践(知识)的理解。
表10 TIMSS 2003-2011“科学探究”与TIMSS 2015-2023“科学实践”的比较
纵向上来看,TIMSS 2023 较之 TIMSS 2019,突出了理论和调查综合使用的特点[13],如TIMSS 2023更加重视“日常生活和学校学习的各种环境因素”,不能孤立地评价科学实践。
试题编制是科学素养评估体系的核心[14]。TIMSS 2023 提 出“ 群 体 适 应 性 评 估 ”(Group Adaptive Assessment)这一新概念,即所有国家和地区都将管理相同的评估项目,并提供两套难度不同的数字化评估题册,不同国家和地区可以根据题册难度的转化参数,并结合自身实际进行选取,从而达到项目评估难度与学生以往成绩间的一致性[15]。“群体适应性评估”的提出,使评估难度与学生以往成绩能更好地匹配,便于更好地评价所有学生的学习成绩,这充分显示了TIMSS 重视“评价应面向全体学生,尊重学生的水平差异和个体差异”的理念。
TIMSS 包括多项选择、问答题两种题型[2]。值得一提的是,TIMSS 2019 倡议并在TIMSS 2023 正式提出基于场景的“问题解决和探究任务”(problem solving and inquiry tasks,简称 PSIs),通过模拟真实世界和实验室的情况,鼓励学生整合使用已有知识、技能进行广泛调查并参与一种或多种科学实践,从而达到“理解科学概念和科学本质”的效果。如TIMSS 2023 中提出“植物的养料”这一 PSIs 例子,通过让学生设计并使用虚拟实验,从而达到研究植物生长和发展过程的目标。
示例1:植物的养料
通过按键▲和▼控制水量,观察植物的生长情况。
在这个例子中,首先让学生对影响植物生长的环境因素做出猜想、假设及判断,如实验中涉及的水分、养料等。然后,让学生通过使用模拟实验,探究或探明水分、养料等因素对植物生长的实际影响。同时,让学生通过控制水分、养料的多少进行定量对比,从多方面评估这些环境因素对植物生长的作用及影响,达到“学生在‘场景化’问题解决过程之中实现对生命科学探究”的效果。
此外,TIMSS 2023继续保持着“收集针对学习科学的背景政策的关键信息”这一传统,向学生、家长、教师及校长等群体发放背景(经历经验)问卷,了解学生在家庭和学校中的表现情况,同时结合相关政策信息,如教育体系、课程内容、教学实践等,探寻这些背景信息与学生成就之间的关系。概括起来,主要包含五个具体领域,即学生属性、家庭环境、学校环境、课堂环境和国家环境。通过这些丰富的背景数据,可以充分揭示学生成绩与测试之间关系背后所蕴藏的学生环境和经历的差异性。
TIMSS 强调应当考虑学生的心理特点,展现“趣味性、生动性和活动性”。TIMSS 2023使用计算机辅助评估技术(eTIMSS),如开发多种多样的互动项目类型及功能,采用彩色图形及视频动画等呈现方式,构造出相应数字环境,吸引并鼓励学生通过屏幕指导、文本输入、手绘图式等方式参与问题解决,如学生可以在数据显示器屏幕中移动、旋转对象来解决问题,并可以通过输入文本、计算方程或点击图片等方式来进行操作。
示例2:糖的溶解
两块蓝色糖果放在两个相同大小的杯子中,A杯加入 75 毫升 10℃的水,B 杯加入 75 毫升 90℃的水。下面的视频记录了加入水后,30 秒内杯中发生的变化。30秒后,哪杯水的浓度更大?并说明理由。
这一例子采用嵌入式视频,允许学生通过观看蓝色糖果在不同温度水中的扩散速度来推测溶解后的溶液浓度。在测试中,学生不仅可以通过视觉观察获得直觉经验,也可以通过推理进行理性思考。物质在水中的溶解速度受到多个因素的影响:在相同条件下,水的温度越高溶解越快;蓝色糖果在水中颜色越深,扩展面积也越大。本题根据视频和互动界面演示科学概念,让学生在问题解决的过程中经历探究物质相互作用的过程。
此外,TIMSS 2023 为便于不同国家和地区灵活使用,采取“数字”“纸质”两种交付方式。就数字化评估而言,可以达到“传送形式多样”“平台载体灵活”“评估效率提升”的效果,如自动收集数据并加以评分,大大降低了纸质印刷及运输成本,充分展现了TIMSS 2023“数字化评估为主流”的定位。
示例3:植物的结构
下面这棵植物哪些结构可以产生花粉,请点击它。
在信息技术的支持下,学生不仅仅可以通过点击图片中植物的不同部分,来了解植物结构的花粉功能,还可以通过互动界面自主选择符合要求的植物结构。同时,作为一道多项选择题,在学生答题的过程中,系统也可以记录下学生的答题过程,特别是其选择或更改选择的记录,由此分析学生的认知水平及多项选择的能力。此外,该问题也可以改编成纸质多选题,便于信息技术支撑能力不足的国家和地区使用。
通过评估内容、试题编制两方面的研究可以看出,TIMSS 评估框架始终秉持着“继承基础上创新”的理念。为了实现“以评促教”“以评促学”的评测目的,通过对TIMSS 2023 科学评估框架的介绍及与前七次框架内容的比较,并结合《全民科学素质行动规划纲要(2021-2035 年)》及《义务教育科学课程标准(2022版)》的要求,建议我国科学素养评估可以从以下几方面入手:
一是强化学段链接,构建有效评估体系。制定各学段统一连贯的科学课程标准是十分必要的[16]。要积极贯彻“培养学生的核心素养,为学生的终身发展奠定基础”的理念[17],借鉴“群体适应性评估”的概念,不仅要注重学生最后共同标准的实现,更要着重体现学生在不同起点上的提高的过程。
二是凸显三维架构,注重评估整体平衡。要坚持“保持评测整体平衡性和多样性”这一试题编制的重要原则,根据学生年龄特点如其抽象思维水平不同,进一步细化评测目标的层次性,并适时调整评估内容及方式,建构科学的评估内容、实践、题型及反应类型。
三是营造真实情境,评测解决问题能力。STEAM 以解决真实世界的问题为导向[18]。要积极破除“忽视情境”“缺少实践”及“高分低能”的倾向,“激发学习动机,加强探究实践”[19],需要营造相关“情境”,提倡启发式、探究式、开放式教学,从而保护学生的好奇心,激发其求知欲和想象力[1]15。
四是注重人机交互,增强学生“现实体验”。积极贯彻“推进信息技术与科学教育深度融合,推行场景式、体验式、沉浸式学习”要求[1]17,立足计算机交互任务,创设现实问题情境,增强学生的“现实体验”,促进科学素养内化为学生知识经验的内在组成部分,取得“评测过程也是不断学习新知识的过程”这一效果[20-22]。
五是重视非正式环境,强调“基于证据中心”。要强调“日常生活和学校学习的各种环境因素”,突出“问题的提出与解决(解释)均建立在证据基础之上”这一理念。如充分利用学校、家庭、社区的各种资源,创设良好的学习情境,采取家校合作机制,围绕科学素养发展问题,为家长提供切实可行的咨询和建议,提升其对科学教育的重视程度,以便学生在实际生活中树立基本的科学态度,形成正确的价值观和社会责任感。