吴俊生 詹伟琴
(华南师范大学物理与信息工程学院 广东 广州 511400)
NAEP(The National Assessment of Educa-tional Progress)即国家教育进步评价是美国最大的全国性长期评价,这也是由国家教育统计中心(NCES)管理的国会授权项目[1].NAEP测试的对象是四年级、八年级和十二年级的学生.数学和阅读每两年进行一次评价,科学和写作每4年评价一次.其他科目也定期进行评价,包括艺术、公民学、经济、地理、技术工程素养以及美国历史.
NAEP认为在快速变化的世界中,科学素养的培养是全国学生的重要目标.通过科学教育,学生可以了解他们所居住的世界,并学习在生活的各个方面运用科学原理.科学旨在通过实证证据增加对自然世界的了解,并且通过观察和判断这些证据可以解释和预测自然现象.因此,一个具有科学素养的人应该熟悉自然界,了解科学事实、科学概念、科学原理、科学定律以及科学理论,如物体运动,活体器官中的细胞功能和地球的物质属性等.科学素养还包括运用科学原理和科学思维方式来推进我们对自然世界的了解以及利用科学来解决现实世界中的问题.
NAEP科学框架主要围绕两个维度展开:“科学内容”和“科学实践”.
(1)科学内容
“科学内容”分为3个部分:“物理科学”、“生命科学”和“地球科学”.以十二年级为例,所占比例分别是37.5%,37.5%,25%.每部分又细分为多个领域.高中“物理科学”部分分为3个领域:“物质”、“能量”和“运动”.每个领域的内容有各自的主题,“物质”分为“物质的特性”和“物质变化”;“能量”分为“能量的形式”和“能量的转化和守恒”;“运动”分为“宏观运动”和“力影响运动”,每个主题都有其具体的说明.
(2)科学实践
NAEP不仅评价学生学习的科学内容,还将评估学生使用知识的能力.NAEP将通过“识别科学原理”、“运用科学原理”、“科学探究”与“技术设计”4个方面来评价学生运用科学内容的能力.“识别科学原理”主要是评价学生识别、回忆、定义、联系和陈述基本科学原理的能力[1].“运用科学原理”评价的是学生阐明、解释、分析、运用科学原理的能力.“科学探究”涉及到收集相关数据,使用逻辑推理以及运用想象和证据来设计假设去解释数据模式.“技术设计”方面,NAEP主要评价学生运用科学原理进行技术设计的能力.
NAEP的试题类型包括:
(1)单项选择题;
(2)建构反应题,包括简短型建构反应题,扩展型建构反应题和概念图任务;
(3)组合题,包括试题串、POE项目集、动手表现任务和交互式计算机任务[2].
单项选择题一般有4个选项,4个选项中包含一个正确答案和其他3个具有迷惑性的选项,3个看起来正确的选项应该是根据学生对已学知识可能产生的错误性理解进行制定的,包括错误的概念理解、解释、预测等等.如例1所示.
【例1】(十二年级) 如图1所示,两只狗按照下面箭头所示方向对雪橇施加相同的力,点代表雪橇.试问图2中哪个箭头最好地表示了雪橇的运动方向?
图1 例1题图
图2 例题中的设问
这道题考查的是学生受力分析的相关知识,在科学实践维度方面属于考查学生“运用科学原理”的能力,需要学生运用所学的物理科学知识预测将会观察到的现象.题目中错误选项和正确选项的受力方向比较相近,具有一定的迷惑性,学生需要熟练掌握相关知识才能做出正确的解答.
建构反应题包括简短型建构反应题,扩展型建构反应题和概念图任务.其中简短型建构反应题需要在题目给定的情境中写一个简明的解释.学生必须运用相关的信息和知识进行思考,而不是从给定的选项中选择正确答案.而扩展型建构反应题呈现的是比较复杂的问题情境,要求学生分析情境,选择并执行解决方案,并且解释运用此方案后会出现的情况.概念图是一种可靠且有效的评价方式来测试学生对于科学原理的理解.在该任务中一般是给出6~8个概念,学生需要用箭头来链接这些概念,并且用一个单词或短语来标记每个箭头来解释一对概念之间的关系.以扩展型建构反应题进行举例如例2所示.
【例2】(十二年级)学生将两只相同的烧杯放在窗台上.一只烧杯有液体A为80 ml.另一只烧杯有液体B为80 ml.经3天后,两只烧杯的液体都减少了.而且,剩下的液体B比液体A少.图3显示了实验开始时和3天后每只烧杯中的液体体积.
图3 例2题图
请问为什么3天后两只烧杯的液体都减少?
哪种液体沸点较低?
液体A
液体B
通过参考实验结果和比较液体A中的分子间吸引力与液体B中分子间吸引力来解释你的答案.
这道题是对物质气态变化以及分子力等相关知识的考查.学生做出合理的解释需要对题目的情境作出分析,考查的是学生运用科学原理解决问题的能力.学生首先需要进行简单地思考回答第一个问题,然后运用相关的科学知识对题目的现象进行解释说明.
POE项目集主要是让学生进行预测、观察和解释.学生的任务是先提供一个预测的结果并对其进行解释.主要考查学生的程序性知识和运用科学原理的能力.POE项目集可能是选择题或者是建构反应题的形式,也可能是二者的组合.如例3所示则是二者的结合.
【例3】(十二年级)如图4所示,两只相同的烧杯中有30 ℃的水,烧杯A中有20 g的水,烧杯B中有40 g的水.
试问当室温达到25℃时,哪杯水会释放更多的热量?
烧杯A
烧杯B
两烧杯将释放相同的热量
解释你的推理
图4 例3题图
首先这道题考查的是热量方面的运算知识.需要学生运用科学原理对题设的问题作出预测,预测哪只烧杯的水会释放更多热量.然后结合科学知识对自己的预测作出解释,这是POE试题常见的模式.
在动手表现任务中,学生通过运用物理知识尝试解决涉及该物理知识的科学问题,NAEP在动手表现任务中为学生提供了具体的问题、设备和材料.学生通过合理的科学程序解决相关问题,学生的成绩评定应以解决方案和调查的设计程序为基础.动手表现任务测试的是学生在解决复杂问题时展现出来的运用科学知识进行调查、探究以及解决问题的能力.
【例4】(十二年级) 第一部分:
问题1:在测试水样之前,预测哪个城镇(A或者B)会有更好的水质.由于您还没有测试城镇A和B的水样,所以您的预测将基于“水系统地图”(图5)和“参考图1”(图6)提供的信息支持你的观点.
图5 水系统图
图6 参考图
第二部分:
问题2:测试城镇A和B的水样,
使用您所有的设备对水样进行水质测试.
将测试A水样的污染物填写在1A表格的第一列,对应的污染物水平写在第二列.
使用参考材料完成表格1A中的第3和4列.
同样的,城镇B的水样按以上两个步骤完成表格.
问题3:根据表格1A,表格1B和图7的数据选择合适的位置建新城镇.
A.城镇A
B.城镇B
C.城镇A和城镇B都不合适
解释你作出选择的原因.
图7 表格2
第三部分:
问题4:图8中列出了水处理过程的主要步骤,使用表1A,1B的信息,以及你的物理化学生物知识,确定每个处理过程步骤中可去除或减少的污染物,在图8的最后一列填写污染物超标的场所.
问题5:描述您选择的场所的水污染处理所需要的物理化学生物过程,参考图7进行回答.
图8 表格3
如例4所示,题目要求学生在40 min内完成题目的操作任务和数据记录,以及结果解释等.试题首先需要学生根据所给材料选择新城镇的合适地点并进行解释.然后还需要学生利用所提供的材料进行实验分析和水处理的工艺评估.该题在科学内容维度考查的是学生“物质特性”方面的知识以及化学和生物方面的综合知识,科学实践维度方面则综合考查了学生运用科学原理和科学探究的能力.
交互式计算机任务是动手表现任务的一种补充,通过模拟自然或者实验室的环境让学生基于计算机的环境进行解决问题,这种任务通常是现实生活难以短时间观察到的,不受现实条件约束.下文以十二年级交互式计算机任务为例,对题目进行分析.
该任务要求学生调查两种金属铜和铝哪种材料可以更好地制作烹饪盘的底部.在设计和调查时,学生们使用虚拟热量计来测试两种金属的比热容.给定时间为20 min,图9是该任务的操作页面:图中是一个虚拟的热量计,当两种物质彼此接触时,热量计可以确定一种物质传递到另一种物质的热能.学生可以使用虚拟热量计来研究当不同温度时金属放在其中水温的变化.
图9 操作页面
题目的任务主要分为3个部分展开:
(1)先将60 ℃,250 g的铜放入20 ℃,250 g水中,点击“运行”按钮即可以得出结束时的温度,学生得出数据并对数据结果进行原理解释.
(2)调整设定的数据,将20 ℃,250 g的铜放入60 ℃,250 g的水中,点击“运行”按钮,得出数据.并且对结果进行解释.
(3)设计方案对铝材料进行分析实验,比较确定合适的材料作为烹饪盘的锅底.
整体看来交互式计算机的题目可以突破现实的限制进行实验模拟验证,该题考查了学生比热容的相关知识,科学实践方面则考查了学生“运用科学原理”和“科学探究”方面的能力,通过题设的引导,学生进行实验方案的设计、运行和分析,最终得出问题的答案.
NAEP试题采用的是SOLO分类评分方法,使用评分量规对学生的答案进行评分.一般分为3个层次:完全正确、部分正确、错误.对应的给出满分、部分分和零分.满分是指学生能联系多个方面进行系统地回答;部分分是指学生只能给出单一答案或虽联系多个方面却未能形成相关知识的网络;零分是指学生没有理解问题.再根据具体题目答案的要素分为2~5个评分等级[2].每个等级都有进行文字描述的答案,这些答案呈现出学生可能出现的思维过程,并且由专业的评价人员根据学生回答的答案按细化的评分量规进行给分.这些评价人员都是经过专业培训且在资深的专家监控下进行评分[3].具体如例2的评分量规所示.
令人满意的答案:
(1)学生能回答每只烧杯的液体部分蒸发;
(2)学生选择液体B有较低沸点,能解释液体B的沸点较低导致有更多的液体蒸发;
(3)学生能解释较低沸点是因为液体B变为气体需要的热量较少;
(4)学生能解释较低的沸点是因为液体B的分子间作用力较弱.
或者:
(1)学生能回答每只烧杯的液体部分蒸发;
(2)虽然错误地选择A,但是学生解释了液体B的沸点较低导致有更多的液体蒸发;
(3)学生能解释较低沸点是因为液体B变为气体需要的热量较少;
(4)学生能解释较低的沸点是因为液体B的分子间作用力较弱.
必要的答案:
(1)学生能回答每只烧杯的液体部分蒸发;
(2)虽然错误地选择A,但是学生能解释较低的沸腾温度与液体B的较大蒸发有关;
(3)学生能解释较低沸腾温度是因为液体B变为气体需要的热量较少;
(4)学生能解释较低的沸腾温度是因为液体B的分子间作用力较弱.
或者:
(1)学生能回答液体B有较低的沸点;
(2)学生能解释低沸点与更多的体积减少有关;
(3)学生能解释低沸点是因为液体B变为气体需要的热量较少;
(4)学生能解释较低的沸点是因为液体B的分子间作用力较弱.
部分正确的答案:
(1)学生回答每只烧杯中的液体部分蒸发.
或者:
(1)学生能解释液体B的沸点较低导致有更多的液体蒸发.
(2)学生能解释较低沸点是因为液体B变为气体需要的热量较少.
(3)学生能解释较低的沸点是因为液体B的分子间作用力较弱.
令人不满意的答案:学生回答完全错误.
(1)丰富试题的种类,重视学生的科学实践能力
NAEP的试题按照“科学内容”和“科学实践”进行综合设计,能较好地考查学生的知识水平和实践能力.其中单项选择题和建构反应题能检查学生的知识掌握情况,而动手表现任务和交互式计算机任务则能对学生进行表现性评价.单一的纸笔测验并不能充分地检测学生各方面的能力,采用纸笔测验加操作实验的方式可以更好地达到评价的目的.国内考试可以考虑逐渐加入一些动手操作试题或者计算机模拟操作试题,加强学生的科学实践的能力,这对于学生将来在大学乃至工作生活中都是不可或缺的.在编制操作性试题的过程中,要先定义好要评价的科学内容以及实践能力,然后进行任务的设计和任务指导语的编写,让学生知道应该做什么.最后再制定评分的细则,教师根据评分细则对学生的表现进行评定.
(2)丰富评价的功能
目前,我们国内的考试比较注重评价的选拔功能,而忽视了评价的诊断反馈功能,评价的另一个目的是为了诊断学生的学习障碍和反馈教学建议.我国的考试评价要丰富评价功能的多样性,首先对于每个评价我们要制定合适的评分指南,如NAEP中所用的SOLO分类评分方法,每个评分等级列举了学生可能出现的思维分析过程,按照评分指南对学生的答案进行赋分,了解学生的解题情况,并进而分析学生的学习障碍,为教师的课堂教学提供建议,实现评价的诊断和反馈的功能.诊断学生的学习障碍是一件复杂的工作,我们要培养专业的评价分析人员,对评价的结果进行分析,这样才能更有效地发现学生的学习困难.
(3)注重真实情境下的教学
从NAEP的试题中可以看出,NAEP注重学生在真实情境中运用知识解决问题的能力,不能孤立地去评价学生的知识水平和科学实践能力.我们在物理科学的教育方面要更加注重融合真实的情境,这样能更好地激发学生的学习兴趣和求知欲.通过自己已有的知识对出现的问题进行预测、调查、收集数据,进而提出解决问题的方案,解释选择方案的理由,由此来培养学生解决实际问题的能力.