罗国忠
(广西教育学院教研部,广西 南宁 530023)
美国康涅狄格州每年都对公立中小学学生进行统测,并根据统测结果适时调整教学,加强教学针对性和有效性,确保“不让一个孩子掉队”.它不仅测评学生是否“学会”,还测评学生是否“会学”,因此科学学科的统测内容包括知识和探究,探究测评又包括过程性测评和终结性测评:首先,由学校组织学生小组完成州教育部布置的一个探究任务,并鼓励教师对学生的探究表现进行过程性测评,即这些测评结果不计入统测分数,但把测评结果和改进建议反馈给学生,促使学生改进后续学习;几周后,由州教育部组织统一的科学学科终结性笔试,笔试成绩计入统测分数.试题包括知识题和探究题,探究题是一系列集束型问题,这些问题全都与小组完成的一个探究任务有关.
2003年10年级科学学科统测的探究任务“陨石坑”:行星被陨石撞击时,表面会形成陨石坑,坑口大小受很多因素的影响.请你与伙伴合作,首先探究陨石的下落高度对坑口大小的影响,然后探究另一个因素对坑口大小的影响.
探究材料:1袋沙子、2个碟子、3个不同质量的玻璃球、3个不同质量的塑料球、3个不同质量的木球、2个小塑料杯、2个小舀的橙色粉末、1个小勺、1把米尺(用来测量球的下落高度)、1把刻度尺(用来测量坑口大小)、安全护目镜和围裙等.
探究程序:(1)确定探究问题,明确自变量和因变量.(2)设计有效实验,要详实、具体,确保别人能重复、验证实验;要有控制和重复,确保实验有效.注意:要把橙色粉末均匀撒在沙面上,以确保球撞击沙面时形成的坑口清晰可见.(3)动手操作,要用表格记录数据,用图描绘数据.做完实验后,每人要根据自己的实验记录,独立撰写实验报告.实验记录和报告都不用评分,但会影响到你的后续独立答题,而这些答题要评分.
学生完成探究几周后,统一参加州教育部组织的科学学科笔试,独立作答一份试卷.试卷包括知识题和探究题,探究题是8道集束型问题,它们与探究任务“陨石坑”有关,分别测评明确问题、设计实验、得出结论、反思评估等探究要素.
A组学生的探究问题是:球下落的高度和撞击地面的角度对坑口形成有何影响?他们的做法是:(1)在碟子中放沙子,然后让球下落;(2)轻轻把球拿走,然后测量坑口大小.实验结果如表1所示.
表1
问题1:A组的探究问题是否清晰、明确?请详细说明.
问题2:把A组的实验结果描成一个标示清楚的线图.
问题3:根据A组的做法和结果,可得出什么结论?结论的有效性如何?请详细说明.
B组学生的实验:(1)把沙子平铺在碟子中,然后再撒上一薄层橙色粉末;(2)测量所有球的质量;(3)依次让不同的球下落,并测出坑口直径.实验结果如表2所示.
表2
问题4:B组实验存在缺陷,需要怎样改进?请详细说明.
评析:问题1主要测评能否识别科学问题的能力.A组的探究问题不够清晰、明确,因为A组实验只研究“球的下落高度”一个自变量,但其问题包含“球的下落高度”和“球的撞击角度”两个自变量;A组实验研究的因变量是“坑口直径”,很明确,但其问题包含的因变量是“坑口形成”,模糊笼统.
问题2主要测评数据处理的能力,即把数据描成线图,包括自变量和因变量是否与横纵坐标轴对应、坐标轴的标示和标度是否适当、描点是否准确、连线是否顺滑等.
问题3主要测评概括结论、反思评估的能力.从A组的做法和结果中,可得出“球下落的高度增大,形成的坑口直径也会增大”的结论,但其有效性受到诸多不确定因素的影响,如每次下落的球是否相同?撞击角度是否相同?撞击位置是否相同?沙面是否平整?是否给沙面撒上橙色粉末,使坑口清晰可见?坑口直径如何测量?每次测量手段是否一致?实验有没有多次重复等,这些不确定因素都会影响结论的有效性.
问题4测评实验设计、反思评估的能力.根据B组的做法和结果,可看出他们研究“球的质量对坑口直径的影响”,有诸多地方需要明确或改进,如应给出球的下落高度并保持不变;应给出球质量的明确数据,或说明“大、中、小”的含义(质量或直径);应改变球的质量,并保持球的直径不变;应说明球的撞击位置(理想位置是沙面中心);应说明球的撞击角度;每次实验前应平整沙面;应说明怎样测量、什么时候测量坑口大小(如拿走球之前还是之后);应在沙面撒上橙色粉末,使坑口清晰可见;实验应重复多次,取平均值等.
如果学生确实做过探究,小组成员之间必然会有思维碰撞,会不断地讨论、尝试和调整,给自己留下深刻的体验,这些体验无疑有助于答题;然而,球撞击沙面现象不复杂、也不陌生,学生即使未做过该探究,也可在生活经验基础上运用空间想象和推理,在思维空间构想球撞击沙面的过程模型,推想出影响坑口大小的诸多因素,然后再运用控制变量法进行分析,需要控制哪些无关变量,需要怎样可靠测量因变量等.应该说,这些问题测评到的更多是学生平时探究形成的一般性探究能力,较少是与具体任务“陨石坑”相关的情境性探究能力.
C组学生的实验:(1)把沙子平铺在碟子中;(2)在沙面上撒一层橙色粉末;(3)测出每个玻璃球的质量;(4)让大玻璃球从30cm处落下;(5)用其他玻璃球重复以上步骤;(6)从60cm高处重复实验.实验结果如表3所示.
表3
问题5:根据C组的实验和结果,可知哪些因素会影响坑口深度
(A)球的质量.
(B)球的下落高度.
(C)球的质量和下落高度.
(D)球的质量或下落高度都不影响.
问题6:在C组实验中,哪个变量保持不变
(A)球的直径. (B)球的下落高度.
(C)球的材料. (D)球的质量.
D组学生的实验:(1)在碟子中平铺沙子,然后撒上一层橙色粉末;(2)测出每个球的质量;(3)让球下落到沙中,测量坑口直径;(4)重新平整沙面,换其他球进行实验.实验结果如表4、表5、表6所示.
表4
表5
表6
问题7:D组在实验报告中有一句陈述:球的质量越大,坑口直径就越大.这个陈述是
(A)被D组数据支持的结论.
(B)不被D组数据支持的结论.
(C)D组实验中所作的观察.
(D)D组实验中被控制的一个变量.
问题8:在实验中,计量沙子质量最精确的单位应是
(A)茶匙. (B)勺. (C)毫升. (D)克.
评析:问题5测评识别自变量的能力,要求学生从实验设计中找出自变量,答案是(C).问题6测评识别无关变量的能力,要求学生从实验设计中找出无关变量,答案是(C).问题7测评概括结论的能力以及区分结论和结果的能力,答案是(A).问题8测评识别单位精确度的能力,答案是(D).
与问答题类似,这些题目都与所做探究有关,如果学生做过该探究,有一定体验,思维得到“预热”,就会有助于作答.即使学生未做过该探究,只要具备一定的控制变量法知识、数据分析能力,亦可顺利答题.
笔试是目前测评科学探究能力的主要方式之一,其优点是擅长测评心智性的探究思维,缺点是较难测评实践性的动手操作、交流合作,以及体验性的情感反应等.从试题评析中看到,如果学生做过探究,会有助于答题,但如果未做过探究,似乎也不太影响答题.究其原因,是因为这些试题其实是测评探究思维,学生平时探究形成较强的探究思维,就能有效应对.因此,美国康涅狄格州统一要求用低成本的笔试作为探究思维的终结性测评手段,鼓励但不统一要求教师用高成本的观察作为过程性测评手段.
这种做法与我国的探究测评大体类似,但两者仍有一些不同:(1)康涅狄格州采用集束型问题,所有问题都聚焦一个探究任务,而我们国内较少有一套试卷的所有探究题聚焦一个探究任务,多数是分散于不同探究任务.那么,集束型问题和分散型问题的测评效度究竟有何差异?(2)康涅狄格州的有些探究题更细致而深入.例如,问题4要求改进实验、问题3要求分析结论有效性,表面上似乎是测评实验设计、概括结论的能力,其实也测评反思、评估等深层的综合性能力,需要学生具有更全面、细致而深入地探究思维,要知其然也要知其所以然,而我们国内测评主要是要求设计实验、概括结论,较少进一步要求反思、评估实验设计或结论的有效性,停留于知其然这一层次.那么,两种做法的测评效度又有何差异?尽管这两个问题暗含着笔者的一些看法,但笔者还是不敢肯定,还是留给感兴趣的研究者用实践和证据去探索回答吧,相信进一步的研究能拓展我们的视野和思路.
1 Connecticut Department of Education.The Connecticut Academic Performance Test[EB/OL].http://www.csde.state.ct.us/public/cedar/assessment/capt/capt.htm,2012-12-28.