肖巧玲 俞如旺
关注考生思维流畅性的纸笔测验有效性分析
——以一道生物试题为例反思命题
肖巧玲 俞如旺
在新一轮课程评价改革中,纸笔测验由于在测量知识技能的学习成效等方面具有较高的信度和效度,在中小学仍是一种重要的评价方式。在试题的编制设计中,应关注考生思维的流畅,在试题信息含量、情景呈现、问项排列、参考答案设置等方面应科学合理,以提高试卷的内容效度,从而保证纸笔测验的有效性。
课程评价改革;纸笔测验;命题技巧;高考
新课程改革倡导评价方式的多元化,以促进学生在知识与技能、过程与方法、情感态度与价值观等方面得到全面发展。新课程强调对学生的质性评价,有人因此就误以为强调质性评价就是要排斥量化评价尤其是量化评价中的纸笔测验。他们认为纸笔测验在评定一个人的发展状况时表现出简单化、表面化、数据化、缺乏人性化等特征而不能反映出学生的发展潜能,不利于学生创新精神的培养。事实上,纸笔测验在测量知识技能的学习成效,评价学生的综合分析能力、逻辑推理能力和文字表达能力等方面具有较高的信度和效度。因此纸笔测验当前仍是一种重要而有效的评价方式[1][3]。
纸笔测验中试卷的内容效度是考试成绩数据能够正确、有效反映被测验者的学习成效和能力差异的根本基础。中小学为了检验教学效果,设置了半期考、期末考、单元考、月考、周考等众多名目的考试,并给予每一次考试很高的权威,通过排名次、比高低评价学生教师,诊断学习成效。但是很少有学校在测验后进行数据统计分析时,能认真反思试卷本身质量,即试卷是否有效。低效度的试卷被使用是纸笔测验在课程改革中遭人诟病的另一重要原因。影响试卷效度的因素很多,其中题目在信息呈现、问项排列甚至答案设置等方面出现的不合理都会使学生在获取信息、理解题意和准确定位知识等思维方面遇到障碍,这样的测试成绩必然不能真实反映学生的能力和知识掌握情况。而一线教师在命制试题过程中确实存在一些随意性的现象,这些随意性是学生答题时思维遭遇障碍的重要原因。如果试卷是作为终结性评价来评定学业成绩,势必影响到公平性;如果是作为发展性评价,将评价结果作为下一步教学的决策依据,就可能导致决策方向的错误。测量学认为,教育和心理测验是否正确、有效、其有效程度如何,并不能由测验编制者或使用者的主观意愿来确定,也不能简单地仅根据测验所冠以的名称来判明,它只能根据有关这一测验的客观资料来证实[2]。这些客观资料来源于教师对试卷的认真反思和审视。
教师反思审视试题要通过分析试题考查目标、教师试做、收集学生答案、访谈命题者和考生等过程来完成,并对比命题者预设的考查目标和实际试题内容的关联性,对比教师试做答案与学生答案的相似性,对比学生答案和参考答案的一致性等。下面以某校某次考试中一道生物实验探究题为例,利用以上介绍反思审视试题的方法对此展开分析。
试题及参考答案如下:
物质通过细胞膜与膜的流动性有密切关系,为了探究温度对膜的流动性的影响,有人做了下述实验:分别用红色和绿色荧光剂标记人和鼠细胞膜上的蛋白质,然后让两个细胞在37℃条件下融合并培养,40分钟后,融合的细胞膜上红色和绿色均匀相间分布。
①有人认为该实验没有完成,请你继续完成探究实验:__________。
②指出本实验可以从两方面来观察实验结果:_______、________。
③预测该实验可能得出的结论是:_________。
参考答案:①设置高于和低于37℃的实验组,在其他实验条件相同情况下做相应实验;②红色和绿色在细胞膜上均匀分布时所需要的时间的长短、细胞膜在相同时间里的融合情况;③随着温度的升高,细胞膜的流动性会加快加强。
本试题选择人鼠细胞杂交实验为素材,考查学生的实验探究能力,命题教师预测该题为容易题。但测试后发现学生该题得分不高,与预估有很大的差距。归纳学生常见和典型错误时发现:学生除了忽略对照实验的基本原则、语言表达不严谨或马虎粗心等现象以外,还出现了许多出乎老师们意料的回答。笔者对学生开展访谈,了解学生的答题思路,并把视角放低,抛开参考答案,以一个学生的角度,从题干中获取信息、开动脑筋、逻辑推理、组织文字,进行试答后发现:在题目信息引导下,即使学生思维完全合理、正确,回答也可能偏离参考答案。那些匪夷所思的学生回答很大一部分原因上是由于试题在素材选择、情景创设、信息呈现不恰当而引起答题过程中思维不流畅造成的。通过对试题反思审视后,在编制试题避免造成学生思维障碍时应注意以下几个方面:
1)试题的表述应保证足够的信息量,不片面追求简洁
前述例题第③问有相当部分的学生回答是:“温度会影响膜的流动性”这种定性的回答。与参考答案“随着温度的升高,细胞膜的流动性会加快加强”这种定量的回答有区别。
通过与学生交谈,发现学生这样回答是与题干所呈现的实验目的——“探究温度对膜的流动性的影响”这句简洁的语言的理解不同有很大关系。对于高二新学习高中生物的学生来说很难从中判断出,其中蕴涵探究温度对膜的流动性产生影响的规律的涵义。据此分析,可将实验目的的表述修改为“探究温度影响膜流动性的规律”、“探究温度与膜的流动性的关系”等更加明确的表达方式。
此外,有部分的学生对例题①②问的回答是:①设置高于和低于37℃的融合实验组,40分钟后观察。②红色、绿色的分布均匀情况。
例题第①、②问分别考查对照实验组的控制和因变量的获取方法。学生对第①问的回答与命题教师提供的参考答案的区别仅多出了“40分钟后观察”这几个字,似乎这并不影响后面答题。但事实表明,当第①问回答限定在“40分钟后观察”后,直接导致了学生在回答第②问时,不能如教师预期的那样写出两个观察因变量的方法。认真对比这样作答的学生的思路与命题教师的设计思路是完全一致的。但一致的思维为什么不能做出一致的答案呢?这很大程度上是由于题目信息描述不够明晰造成的。就本题而言,题干描述的实验“分别用红色和绿色荧光剂标记人和鼠细胞膜上的蛋白质,然后让两个细胞在37℃条件下融合并培养,40分钟后,融合的细胞膜上红色和绿色均匀相间分布。”很容易让学生把“40分钟”理解成实验时间是一个无关变量,因此,在实验变量控制时将各实验组的实验时间变量都控制在“40分钟”。在试卷评改过程中发现,第②问写出与参考答案基本一致的两个方法的学生答卷,很多在第①问回答有删除“40分钟后”这几个字眼的现象。这一现象进一步证明了学生有根据第②问回答再返回修改第①问回答的情况。
以上分析表明,试题题干呈现的相关信息应该明确而充分,这样才能避免学生产生困惑,无法理顺思路,最终导致不必要的失分。题目表述的简洁,表面上看题目承载的信息容量小、难度可能减低,但一些关键信息可能被删除,不利于学生正确辨析,导致思维不流畅。在试题中保留的信息量,需要根据不同层次的学生类型进行不同处理。一般来说,针对低年级学生的试题应该比高年级学生在考查同一知识点时保留更丰富的信息。
2)信息不超出学生的认知范围,避免知识盲区
前述例题第②问,学生在回答时呈现多样化,有“融合程度的大小”、“融合速度的快慢”、“融合时间的长短”等回答。
对于人鼠细胞融合的相关内容,在必修一模块“细胞膜的流动镶嵌模型”一节和选修三模块“细胞工程单克隆抗体制备”一节中有涉及。但对于现代生物工程技术的知识许多教师和学生都相对陌生,甚至有知识盲区和误读。例如究竟什么现象是“细胞融合”,什么现象是“标记蛋白在细胞膜上的流动”?它们是同一生命现象吗?答案是否定的。“细胞融合”是化学和物理方法造成膜脂分子排列的改变,去掉这些理化作用因素之后,质膜恢复原有的有序结构,在这恢复过程中便可诱导相接触的细胞发生融合,形成多核细胞的过程。而人鼠细胞融合实验则是将被荧光标记的抗体加入到已融合的细胞的不同表面抗原上,观察荧光标记的分布情况来证明细胞膜整合蛋白的侧向扩散运动,即细胞膜有一定的流动性(基本过程如图1)。在这个实验中有一个重要细节是:荧光标记步骤在细胞完成杂交后进行。
图1
因此,对于例题而言,命题教师出现一个重大的失误,题干描述实验过程是“分别用红色和绿色荧光剂标记人和鼠细胞膜上的蛋白质,然后让两个细胞在37℃条件下融合并培养,40分钟后,融合的细胞膜上红色和绿色均匀相间分布。”这是不符合科学事实的。这说明了命题教师对科学史上的经典实验不熟悉,也可以预知这些内容已超出了学生的认知范围,尤其对刚学习必修,还未学习现代生物工程技术相关知识的学生而言这些知识更加的陌生。学生回答中出现大量“融合程度的大小”、“融合速度的快慢”、“融合时间的长短”等回答就是不了解“细胞融合”并非“膜上蛋白质的流动”造成的,他们误以为“融合程度等同于标记蛋白质的分布情况”、“融合速度等同于膜流动的速度”、“融合时间等同于标记蛋白均匀的时间”等。
3)试题问项设置适度开放,关注学生的创造性思维
对照实验是生物科学研究常用的一种实验方法,目的是通过对比实验的结果找到想要研究的因素对实验的影响作用,从而为科学的研究提供事实依据和直接证据。对照实验按对照的内容和形式上的不同,通常有以下对照类型:空白对照、自身对照、条件对照和相互对照四种类型。每种实验方法各有特点,有些情况只适合采取其中一种方法,而有时候多种实验方法均可以采用。命题时要考虑到方法多样性的问题,合理设计实验步骤和问项才能保证在适度开放的前提下,准确考查出预设的考查点,即学生的实验探究能力的某方面能力。
前述例题第①问很多学生的回答是“升高温度,再观察”、“升高温度观察后,再降低温度再观察”、“改变温度继续观察”等。对比学生回答和参考答案之间的差别,可以分析判断出命题教师将“探究温度对膜的流动性的影响”实验预设采用“相互对照”的实验方法。但在实际考查中有很多的学生在根据题干信息思考实验流程时,并没有按命题教师预设的将思维流入“相互对照”,而流入了“自身对照”这一方向。
此外,对第①问的回答是“升高温度观察后,再降低温度再观察”等形式的学生,对第②问的回答是“标记蛋白移动相同距离所消耗时间、相同时间内标记蛋白所运动的距离”。
从考试评价的目的而言,无论终结性评价或发展性评价,学生对实验设计方案呈现的合理性和完善程度都能反映出学生在实验探究能力上的差异性。但是,对实验探究能力的考查并不适合用预设的答案来框定“标准答案”,命题教师要充分考虑到学生思维的丰富性,预设更加全面的参考答案。标准化考试,为了便于统一阅卷等,答案往往是唯一的。而新课程下教师要关注学生个性的发展、创造性思维的开发。科学探究的过程和结果都具有开放性,故对探究能力的评价应加强问题的开放性。开放性可以是内容的开放,也可以是解决问题过程与方法的开放,或者是答案的开放,或者是兼而有之,但是要把握开放的度,因为过于开放会降低测验的信度和效度。
总而言之,在新课程改革形势下,纸笔测验仍是中小学评价教育教学效果的重要方法。保证纸笔测验的有效性的根本基础在于试卷试题的正确有效。一线教师应认真地分析审视考查过的试题,同时也要提高自身命题技能,以编制出符合考生思维特点,并能真实检测出学生能力差异的高效度试卷。
[1]陈玉琨.课程改革与课程评价[M].北京:教育科学出版社.2001.
[2]漆书清.教育统计与测量[M].广州:广东高等教育出版社.1999:139-147.
[3]施问华.对高中生物纸笔测验改革的思考[J].生物学杂志,2006(7).
[4]陈巧.由生物高考阅卷带来的思考[J].福建基础教育研究,2011(8).
An Effectiveness Analysis of Written Tests Focusing on Students’Critical Thinking Skills
XIAO Qiaoling and YU Ruwang
This article argues the importance of written examinations and continuous assessment in the reform of the curriculum at the primary and secondary level.These are the most effective and reliable methods to evaluate teachers’teaching and students’learning in the primary and secondary schools.However a new approach to structuring examination contents should be adopted,where examination questions,examination layout and referencing to examination questions should be designed effectively and feasibly to maximise the effectiveness of examination evaluation.
Reform in Curriculum Evaluation;Written Tests;Techniques for Constructing;Test Questions;College Entrance Examination
G405
A
1005-8427(2012)06-0015-5
本文系教育部社科基金“基于’能力要求’的新课程高考理综卷命题研究”(12YJA880152)项目成果之一。
福建省福鼎市第一中学