张雅琪 张军朋
(华南师范大学物理与电信工程学院,广东 广州 510006)
如何评价学生的科学探究能力始终是科学教育者和科学教育机构关注的问题.支持复杂的科学探究的学习,其主要障碍是缺乏高质量的、有深度的评价标准和方法.一方面,现有的评价标准和方法有的并不能反映科学探究方面的内容,有的则缺乏实践性或过于复杂而难以操作.另一方面,以技术为基础的评价标准和方法缺乏指导性的理论框架,难以为科学探究评价提供有效的操作和实践.因此,研究和开发具有实践导向性的科学探究的评价标准和方法就成为各国在实施科学探究教学中的关键问题,这个问题在我国变得更为突出.[1]
美国国家教育进展评价(NAEP)是美国目前唯一的也是最权威的全国学生学业成就评价体系,其2009年的科学评价框架中提出,科学探究是在识别科学原理与应用科学原理的基础上进行的,评价目的在于让学生知道如何应用科学知识和科学思维去提高对自然界的认识,考察学生对于科学知识的应用,即“做科学”的能力.
NAEP科学探究评价的形式包括纸笔测验、操作表现性任务和计算机交互任务.操作表现性任务和计算机交互任务并不是评价科学探究能力的最好以及唯一的方法,为了全面考核设计及评价科学探究的能力,纸笔测验也是必要的.
NAEP科学试题的首要原则就是面向全体学生,使不同背景的学生都能够展示他们的科学探究能力.因此,NAEP科学探究试题的编写尽可能的考察所有学生的科学探究能力,而不是特定地域特定群体.
科学探究比简单的观察事物、总结规律及解释现象要复杂得多,也比通常认为的按照固定的逻辑顺序开展科学研究要灵活的多.科学探究远不止“程序化的科学”那么简单,而是包括了对于自然界的理解和其他科学家所做出的科学探究、理论模型和解释说明进行的评价,并尝试对同一观察结果提出不止一个解释.因此,NAEP科学探究评价主要从设计科学探究与评价科学探究两方面进行.
设计科学探究方面的试题,可以向学生呈现一些有关数据的表格,让其由表格中数据总结结论.如下面这道12年级的试题:
朱莉有4个瓶子,她想知道哪个瓶子可以装最多的水.朱莉测量了每个空瓶子的质量,然后测量了每个瓶子装满水后的质量.她制作了如表1所示.
表1
问:哪个瓶子可以装最多的水?
在评价科学探究方面,可以让学生指出一个不完善的探究过程中的漏洞,或改进这个探究过程以得到更准确的数据.如下面这道8年级试题:
梅格设计了一个实验来比较3种运动鞋底的摩擦力大小,以下是她使用的仪器:
(1)运动鞋1. (2)运动鞋2.
(3)运动鞋3. (4)弹簧测力计.
她采取如图1所示的步骤,并将弹簧测力计放在运动鞋的左侧.
图1
梅格在体育馆的地面上测量了一只运动鞋底部的摩擦力,在草地上测量了第二只,在水泥人行道上测量了第三只.教师对梅格设计的实验不是很满意.请指出梅格实验的不足之处.
说明梅格应当如何改进实验来比较三种运动鞋底的摩擦力大小.
NAEP试题多采用组合题的形式,包括试题串、预测——观察——解释(POE)任务、操作表现性任务和计算机交互任务.组合试题可能全部是选择题,也可能全部是建构反应题,或二者兼有.如下面列出的12年级的试题:
密度可以用来识别金属的特性之一.如果确定了一种金属的密度,就可以确定是哪种金属,如表2所示.
表2
问题1.假设给你一只戒指,希望你能够确定它是否由纯金制成.设计一个实验来测量这只戒指的密度.说明你的测量步骤,包括需要使用的仪器,以及你准备如何使用这些仪器测量戒指的密度.
问题2.假设你测得这只戒指的密度为15.3g/cm3,如果戒指是由表2中所列出的几种金属混合而成的,你如何由计算密度确定戒指由哪些金属组成?解释你的答案.
好题目的关键就是要明确测量的目标.通过题目,学生知道被问的是什么,以及怎样的回答是正确的.
NAEP试题的编写者明确地说明了每道题的出题目的,如上面所举的问题1的目的为“测量戒指的密度”,问题2为“确定戒指的成分”.这不仅有助于根据评价标准将题目分类(属于内容领域还是实践和认知要求),并有助于开发评分标准与工具,减少评价中的分歧,为评价框架与说明提供依据.
NAEP科学试题编写者还认为,一道题目的答案不应当作为另一题解答的依据.如上面所举的问题2中明确给出了戒指的密度值,而没有要求学生先在问题1中计算密度,再由计算的结果确定戒指的成分.两道题目之间是相互关联的,但答案之间是相互独立的,因为NAEP评价的是学生“做科学”的能力,而非化简公式、计算数值等数学水平.
明确评价目标不是将题目引向另一个极端—将题目模式化.太多的条条框框可能会变成让学生按照既定的步骤进行回答,而非考察学生的科学能力.在NAEP科学评价中,学生应用科学探究的过程其实就是他们描绘自己对自然世界的理解过程,在描绘的过程中,学生应当具备科学的认知和态度,如变量控制、大样本的选择、以及承认结论的不完善性等.
题目的语言应当在不改变其测量功能的前提下尽量的清晰简明,以帮助学生理解,减少学生的困惑.NAEP科学探究试题的首要原则是测量学生应用科学知识和科学思维认知对自然界的能力,而非阅读、数学或其他能力,因此对题目阅读水平和数学水平都稍低于学生的科学水平.NAEP试题的题目极少使用大段的描述,并通过使用相似的语言结构,减少解释说明,避免双重否定和多义词语等方式使语言尽量的简单明了.同时,NAEP科学试题大量使用现代生动的语句,并避免口语化和方言.必要时,也使用着重号、边框或下划线等版式使题目更加清晰明确.
插图、曲线图和表格等图表能够形象的反应题目的信息,有效提高题目的考察效率.但是如果图表使用不当,也会增加题目的迷惑性,使学生弄不清题目究竟要考察什么.NAEP科学探究试题使用图表的首要原则是与题目内容一致或相似,尽量避免在图表中出现与题目无关的信息.所使用的图表应当包含题目中所有重要的信息.从上面问题1的表格(表2)中,即可读出“不同金属具有不同密度值”、“金的密度是19.3g/cm3”、“各金属具体密度值”等重要信息,而避免出现与考察内容无关的信息.
情境信息包括问题情境、解释说明、细节描述及背景知识等.适当的使用情境信息可以将科学概念置于全面的真实的环境中.科学探究能力的考查,需要在学生没有遇到的新的物理问题情境下进行.这就要求科学探究试题需要与学生的日常生活联系紧密,如戒指是学生生活中常见的物体,而测量其密度以确定其成分则具备了一定的新颖性.
情境信息的语言应当简单清晰、生动形象.设置的情境应当适合被测年级的科学水平,必要时可以向学生提供他们所不具备的背景知识,如各种金属的密度值等.
NAEP科学探究试题的评分原则采用SOLO分类法,将学生的答案由高到低分为3个层次,分别给予满分、部分分和零分.这3个层次的基本评分标准如下:
满分:回答问题时能够联系多个事件,并进行抽象概括.
部分分:回答问题时,只能从单一事件出发得出结论或联系多个孤立事件,但未形成相关知识网络.
零分:没有形成对问题的理解.
如上面问题1的评分标准是这样设置的.
满分:学生通过设计一个与下面过程类似的实验展示了其测量金属的密度来确定金属成分的能力.
第1步,用天平称量戒指,记录其质量m或“测量戒指的质量”
第2步,将戒指放入盛有水的量杯中,并记录放入戒指前后水的体积V.放入戒指后水的体积减去放入戒指前水的体积即为戒指的体积.
必要内容:学生回答了上面步骤中的两个或两个以上.
部分分:学生回答了上面步骤中的一个.
零分:学生没有提到上面步骤中的任何一个或学生混淆了质量或体积与密度的关系.
在NAEP科学探究试题中,有些题目可能不止一个标准答案,只要学生的回答符合科学原理,能够解释提出的问题,就应当给予正确.评分原则的制定也充分考虑了多种答案的可能性.如有这样一道12年级的题目,要求学生只使用水和量筒或量杯测量固体的体积.评分原则给出了两种可能的方法.
方法1:在量筒中倒入一些水,记录水的体积.然后将固体放入量筒中,再次记录水的体积.两次记录的水的体积差就是固体的体积.
方法2:用溢液法.在杯中加满水,放入固体,用量杯接住溢出的水,测量溢出水的体积等于该固体的体积.
在我国的科学课程标准中,近年来科学探究逐渐占有越来越重要的地位,科学探究已成为中小学科学课堂中的重要内容.随着科学探究在我国日益得到重视,科学探究评价所存在的问题也日益突出.如纸笔测验是否能够准确的反映学生真实的科学探究能力,操作考核往往过于复杂且难以操作等等.
我国科学探究评价的目标与实施的可操作性之间仍存在一定的距离.目前我国科学探究评价存在以下问题.
(1)答案相关与题目模式化.
探究试题中常设置多个问题,问题之间有着紧密的联系——第一题的答案往往成为第二题的条件.如果学生因为计算或其他失误而答错了某题,可能会将后面的作答引入歧途,数学水平成为了影响学生科学能力评价的因素之一.
如这样一道全国物理高考题,要求探究物体在斜面上运动时摩擦力与斜面倾角的关系.设计实验通过用光电计时器记录滑块通过光电门时挡光的时间来进行探究.题目首先列举了实验的具体步骤,然后要求学生用测量的物理量来完成下列各式:
① 斜面倾角的余弦cosα;
② 滑块通过光电门时的速度v;
③ 滑块运动时的加速度a;
④ 滑块运动时所受到的摩擦阻力f.
计算斜面倾角和摩擦阻力并探究二者之间关系是本题的评价目的,然而摩擦阻力的求解需要借助第②、③问的结果,这不仅为学生求解本题提供了固定的方式,而且容易造成学生“一错而再错”.
该试题的另一个特点是给定了固定的器材和实验步骤.除此之外,很多探究题也要求学生叙述经典实验的方法和步骤,失去了探究实验应具有的发散思维的精髓.这类探究题考察的仍然是学生对前人经验的积累程度,而非对于科学研究方法的体验水平.科学探究应重点考察学生理解自然界的方法与过程,而非让学生按照固定步骤的“科学方法”重复前人的科学研究.
(2)题目描述过多.
探究试题应当设置真实的情境中,这往往造成了题目中大段的描述与解释.学生在接触题目时易产生抵触与浮躁情绪,过多的文字也容易造成学生漏掉重要的信息,从而对题目产生迷惑.科学探究题目的考察目的应为了解学生科学探究的能力,而不应成为考察学生的阅读水平或做文字游戏.
(3)图表中过多无关信息.
在题目中插入图表以使题目更加生活化逐渐成为一种趋势,但应注意避免无关信息给学生带来解题的障碍.
如有一道中考题中给出了一张如图2所示的出租车车票,要求学生计算出租车行驶的时间和平均速度.所示车票中的车号、单价、等候时间、金额等信息就容易引起学生的困惑或者忽略主要信息.
(4)情境设置不够新颖与生活化.
为了使题目的设置贴近学生的现实生活,近年来的探究试题越来越多的加入了人们生活情境的元素.但是有些生活情境的设置过于陈旧,大多数素材来源于教材或教学内容,如课本上已经详细说明的仪器或实验,缺乏介绍科技前沿的情境.而一些技术生产类的情境又与学生的生活相距过于遥远,学生难以直观地想象其具体的场景.另外,多数探究题目的情境设置在实验室中进行,给定了标准的实验器材,缺乏学生生活中常见的现象或物体,不利于培养学生从身边事物发现科学问题的能力.
(5)应鼓励学生多方式回答问题.
学生对于所呈现的情境材料有着不同的理解,解答问题的思路与方法也应不尽相同.探究试题应当鼓励学生通过不同的途径处理与回答问题.如学生可以通过图示、表格或方程式等方式来解答问题.探究试题应当能够评价学生科学知识与能力方面的水平与学业成就.
美国NAEP在评价学生科学探究能力方面所做的工作,对我国科学探究评价无疑具有一定的借鉴与参考价值.我们应当在充分研究的基础上,将NAEP科学探究评价中的精华部分与我国的国情相结合,以促进我国中小学教学中科学探究评价的进一步发展.
1 张军朋,许桂清.中学物理科学探究学习评价与案例.北京:北京大学出版社,2010.
2 U.S.Department of Education,NCES.NAEP Sample Questions[DB/OL].http://nces.ed.gov/nationsreportcard/itmrls
3 NAGB&U.S.Department of Education.Science Framework for the 2011National Assessment of Educational Progress[DB/OL].http://www.nagb.org