喻 平
(南京师范大学数学科学学院 210046)
随着高中课程标准的颁布,一个迫切需要研究的问题显现出来,就是如何在操作层面对学生的学习质量进行监测?通过考试选拔的评价标准如何制定?与之前的课程标准相比较,新的课程标准在指导思想、课程理念、教学评价等方面发生了变革,要使新的课程改革真正落实,评价的研究必须先行.始于2001年至今仍然在义务教育阶段施行的一轮课程改革,为什么阻力重重,课程实施举步维艰?除了课程设计本身有一些问题外,对学生学习质量评价的研究始终没有进展,甚至选拔考试都是沿用传统模式,这是必须直面的事实[1].
事实上,基于对课程改革历史的反思,教育部在推行以发展学生核心素养为主线的新一轮课程改革之前,在课程标准的编制过程中就将评价纳入研究范畴,关于评价,在《普通高中数学课程标准(2017年版)》(下面简称《数学课程标准》)有了详细的阐述.同时,一大批学者出于理论意识的自觉,开展了一系列有意义的研究,有的介绍国外关于核心素养评价的做法[2-3],有的根据我国的具体情况作核心素养评价的探索[4-5],也有研究学者对数学核心素养的测评作了研究[6-7].综观这些研究,可以看到理论层面的思辨比较多,具体到实践中具有可操作性的学习评价探讨较少,而这个问题随着新教材的实施变得更加突出,如何将《数学课程标准》关于学习质量评价的要求落实到位,如何为中学教师提供编制数学核心素养测量工具的思路与方法,需要作细致地探讨.
长期以来,对学生学业质量的评估遵循的是“教知识考知识”的逻辑,这种逻辑以知识的教学作为起点和归宿,其实是有一定问题的.设想一下,学生从小学一年级入学到高中三年级毕业,他们要学多少学科?每个学科有多少知识点?与每个知识点相关的问题解决涉及多少技能技巧?为了应付考试,学生不得不记忆大量的知识和技能,通过数量庞大的练习使习得的基础知识和基本技能巩固下来,形成做题是主要的学习方式、“题海”训练是常规的局面.更重要的是,这种学习方式培养出来的人,在学习结果上偏重模仿、记忆和机械练习,缺乏理解、思考和知识建构,在认识信念上遵从接受而排斥辩解,相信结论的证实性而无视结论的证伪性,以“旁观者”的姿态介入学习,个人的观点和见解被长期的囚禁而日益消解,日积月累,学生的创造性意识和创新能力被磨灭得无影无踪.
《普通高中课程方案(2017年版)》(下面简称《课程方案》)在培养目标中明确指出,学生要具有科学文化素养和终身学习能力,“掌握适应时代发展需要的基础知识和基本技能,丰富人文积淀,发展理性思维,不断提升人文素养和科学素养.敢于批判质疑,探索解决问题,勤于动手,善于反思,具有一定的创新精神和实践能力.”[6]培养目标是学业评价的依据也是学业评价的归宿,显然,《课程方案》培养目标的描述突破了“教知识考知识”的逻辑,学习评价不能只对知识理解情况的考察,还应当考察学生的能力,这种能力主要是指蕴含在学科核心素养中的关键能力.
从知识导向到能力为重的评价转型,可以淡化学生对知识点的死记硬背,强化对知识的综合运用;可以减少学生大量的机械练习,着重提升反思意识和创新能力.这种学业评价的转型,也可望在一定程度消除当下“题海战术”盛行的教育局面.
在《课程方案》中,明确界定了核心素养的三个基本要素:学生应当具备的正确的价值观、必备品格和关键能力. 因此,评价应当围绕这三个方面展开,需要建立一个完整的评价体系.从测量角度来看,由于“品格”与“价值观”很难用测量的方法评价,需要采用定性的方法,因此测量主要针对关键能力.
《数学课程标准》提出了6个数学核心素养:数学抽象、逻辑推理、数学建模、数学运算、直观想象、数据分析,并没有对关键能力作出具体描述.在对数学核心素养的定义中,是把这6个核心素养作为名词来描述的,例如,“数学抽象是指通过对数量关系与空间形式的抽象,得到数学研究对象的素养”,数学抽象是素养,显然是名词.但另一方面,“数学抽象表现为:获得数学概念和规则,提出数学命题和模型,形成数学思想方法,认识数学结构与体系”,这种描述显然又将数学抽象看成是一个过程,即数学的抽象过程.既然是过程就必须有活动,就有活动效率的高低(对核心素养的三级水平划分就是活动效率高低的表现形式),因而数学抽象就表现出了能力的特质.对其他5个数学核心素养可以作同样的分析,可以看出,6个数学核心素养本质上蕴涵了6种关键能力,从能力角度理解,检测学习质量就应当从这6个关键能力来开展.
学科关键能力的生成源于知识[7],数学关键能力的生成源于数学知识,脱离知识谈关键能力是空中楼阁.在6个数学关键能力中,除逻辑推理和直观想象具有一般思维能力的特征外,其余的关键能力完全不能脱离数学知识.另一方面,数学关键能力的测验是对学业成绩的测验.与一般的智力测验不同,数学关键能力的测验用于日常教学评价和升学考试评价,是一种学业质量检测而不是纯粹的智商测验.因此,数学关键能力测验与教学内容密切相关,形式上与以前的考试大同小异,内容上却是淡化单纯对知识点理解和掌握情况的考察而应增加对能力因素的考量.要改变单纯在数学内部情境命题的思路,削弱模式化的收敛性题型,将情境性、开放性、发散性问题渗入测验中;要弱化题目过度追求技能技巧的倾向,增强考察思维深刻性和独创性的元素.
怎样的题目就是考察了学生的能力水平而不是单纯地考察知识理解?其实这是一个相对的概念,因为知识与能力不能截然分开,按照认知心理学的观点,技能和能力包含在程序性知识之中或者说由程序性知识发展而来.掌握了一个知识并能用于解决与知识相关的简单问题,这是一种技能;面对一个复杂问题判断知识该怎么运用,何时运用,哪些知识应该组合运用,这就是能力.
《数学课程标准》给出了学业质量水平与考试评价的基本框架和要求,提出学业水平考试与高考命题的建议.
《数学课程标准》将评价分为三个维度:第一个维度是反映数学学科核心素养的四个方面,它们分别为情境与问题、知识与技能、思维与表达、交流与反思.第二个维度是四条内容主线,它们分别为函数、几何与代数、概率与统计、数学建模活动与数学探究活动.第三个维度是数学学科核心素养的三个水平[8].
这个框架可以用表1来表示:
表1 《数学课程标准》考试评价框架
《数学课程标准》对6个核心素养的三个水平作了详细描述,并指出水平一是高中毕业应当达到的要求,也是高中毕业的数学学业水平考试的命题依据;水平二是高考的要求,也是高考命题的依据;水平三是必修、选择性必修和选修课程的某些内容对数学学科核心素养达成提出的要求,可以作为大学自主招生的参考.
这一评价框架,无疑是对传统评价模式的一种突破,它突出了对学生的能力而非单纯对知识的理解与记忆的考察.但是,我们从学理和操作层面作分析,会看到这个评价框架存在的一些问题.
第一,这个评价框架是将核心素养的水平又作了水平划分,造成实践层面的操作困难.把每一种核心素养分为情境与问题、知识与技能、思维与表达、交流与反思四个方面,然后每一个方面又分别分为三种水平,这样的做法其依据是什么?事实上,它存在的问题是,四个方面不是四个平行的维度而是四种不同的水平.“知识与技能”是学生在数学学习中应当具备的基本水平,只有具备了一定的知识和技能,才可能进入“情境与问题”阶段.《数学课程标准》把“情境与问题”界定为“情境主要是指现实情境、数学情境、科学情境,问题是指在情境中提出的问题.”“知识与技能”指“能够帮助学生形成相应数学学科核心素养的知识与技能.”显然,后者是基础,前者是发展.也就是说,“知识与技能”与“情境与问题”本身就应当是数学学科核心素养的两种水平,对水平再分水平,就会出现学理上的混乱或者是概念的边界不清.例如,对于数学抽象这个核心素养,在“情境与问题”这一维度上三级水平划分,其三个水平的描述几乎相同,差异主要在“熟悉的情境”“关联的情境”和“综合的情境”上,一方面,这三种情境并没有清晰的界定,给实践层面带来了困难;另一方面,这三种情境并不能完全反映问题的难度,在熟悉的情境中解决或提出问题就一定比在关联的情境中解决或提出问题容易吗?在关联的情境中解决或提出问题就一定比在综合情境中解决或提出问题容易吗?显然不一定,前者的难度比后者的难度更大的例子比比皆是.对于“思维与表达”显然比前面两个方面又有了更高的要求,属于更高一级水平.而“交流与反思”,可以作为平时教学评价的一个指标,但在考试命题中是无法实施的,因而在试题命题中可以不考虑这个因素.
第二,三个水平分别对应高中毕业、高考、高校自主招生的要求,会造成教学目标设定的困难.从评价本身来看,三个水平分别对应高中毕业、高考、高校自主招生的要求似乎没有什么问题,但是平时的教学目标应当制定在哪个水平上?因为评价的依据是教学目标,是对教学目标是否达成的评判,没有脱离教学目标的评价;反过来,教学评价又对教学目标的制订起着规约甚至是导向作用.根据《数学课程标准》规定的这种对应关系,在教学中应当如何操作呢?如果教学目标定位在水平一上,那么不能适合要参加高考的学生需求;如果教学目标定位在水平二上,那么对于不参加高考的学生其要求又太高;如果教学目标定位在水平三上,那么对于不参加高考以及参加高考的学生,其要求都太高.因此,将三个水平分别对应高中毕业、高考、高校自主招生的要求,会使教学目标设置的无所适从,造成教学方案设计的困难.
第三,考试命题难以界定核心素养的水平.以表1为例,假定某一道题目考察的是数学抽象,题目在“情境与问题”因素是水平三,在“知识与技能”因素是水平二,在“思维与表达”因素是水平一,在“交流与反思”因素是水平一,那么,这道题目应当算考察了数学抽象这个核心素养的第几水平?一套试题应当全面反映考察6个数学学科核心素养(本质是6种关键能力),同时考察三种水平的试题要有合理分布,如果不能准确分析试题考察水平的分布,就难以对试题的合理性作出评判.
1.布卢姆认知领域的评价理论
布卢姆将认知领域的目标从低到高分为六级:①知识:对先前学习过的材料的记忆.②领会:能把握材料的意义.可借助于三种形式来表征:一是转换,即用自己的话或用与原先表达方式不同的方式表达自己的思想;二是解释,即对一项信息加以说明或概述;三是推断,即估计将来的趋势.③运用:能将习得的材料应用于新的具体情境.④分析:能将整体材料分解成它的构成成分并理解组织结构.⑤综合:能将部分组成新的整体,产生新的模式和结构.⑥评价:对材料作价值判断的能力[9].
布卢姆的学习评价理论,其实就是一个从对基础知识的理解、基本技能的形成到问题解决的上升过程的认知水平划分,并不只是考察学生掌握知识的情况,在比较高的水平阶段,涉及到了对知识学习之后形成的能力的考察.但是,这个框架基本上还是对知识学习不同结果的评价,虽然在“综合”和“评价”两个阶段有能力水平表现的描述,但还是是围绕学生已经学习过的知识展开的,并不涉及由学生“生成新知识”的因素,因而不能体现高水平能力的表现形式.
2.测量数学素养的PISA评价模型
PISA关于数学素养的测评框架包括3个维度:情境维度、内容维度、过程维度.3个数学过程:①表述:数学化(公式化、系统化)地表示情境;②运用:调用数学的概念、事实、程序和原理;③评估:解释、应用和评价数学的结果.7种数学能力为交流,数学化,表征,推理和论证,设计问题解决策略,使用符号、公式、专业语言和运算,使用数学工具.以3个数学过程为经线、7种数学能力为纬线,组成一个3×7的矩阵结构[10].
分析这个测评结构,可以看到“数学过程”并不是对数学能力的水平划分,而是一种分类,即通过测验可以考察各种能力在不同数学过程中的表现.该模型主要是为反馈评估结果提供有价值的信息,为政策制定者、教育工作者提供研究学生数学学习过程的有效资料.我们认为,作为关键能力的测评,更重要的是要考察学生在某种能力上的水平差异,这也是考试选拔功能的需要.事实上,PISA关于能力水平的划分是依据学生的数学成绩来划分的,分为6个等级水平,这6个水平代表了任务的难易程度.学生处于某一个等级,不仅表明掌握了那个等级所需要的知识和技能,而且也说明具备了更低等级的要求.规定具备某个等级水平的学生,需要正确回答那个等级至少一半以上的题目[11].显然,这种划分并不能反映出学生在各个能力要素的不同水平差异.作为数学关键能力的测评,不宜采用这种方式.
3. SOLO评价理论
SOLO分类理论是基于学生对某一具体问题反应的分析,对学生解决问题时所达到的思维水平进行由低到高的5个基本结构层次的等级划分.①前结构:学生无法理解对象或只会重复对象,不能理解要点;②单结构:学生注意到了对象的一个相关特征,但事实和观点之间没有联系;③多元结构:学生找到了许多独立的相关特征,但还无法有机地将它们联系起来;④关联结构:整合各部分内容使其成为一个有机整体;⑤扩展抽象:学生会归纳问题或重新概念化到更高的抽象层次[12].
SOLO模型主要用于问题解决中学生对知识的理解情形,例如,拓展抽象水平的描述:学生在复杂的环境下不仅能够发现隐含的信息,并能够运用自己已有的知识将这些信息进行全面的联系,而且能够提出发展的观点.从SOLO的最高水平可以看出,它并不是真正意义上对学生的能力作评价,主要用于传统意义上的学业成就评价.
综合分析布卢姆认知领域的评价理论、PISA评价模型和SOLO评价的水平划分,参考李艺等提出的学科核心素养水平划分理论,并结合数学学科核心素养的特殊性质,我们提出了一种评价数学关键能力的框架.关于这个框架的结构和理论分析,在文[7]、[13]、[14]中作了详细阐述,这里不再赘述.下面对这一模型作进一步完善.
具体地说,将数学关键能力分为三级水平,一级水平对应知识理解,二级水平对应知识迁移,三级水平对应知识创新.知识理解指的是原课程标准中三维目标的第一维目标,即知识与技能,也就是《数学课程标准》所指的“知识与技能”.理解基础知识、掌握基本技能是数学关键能力形成的基础,将其作为数学关键能力表现的一级水平.知识迁移指将数学知识迁移到情境中去解决问题,情境包括现实情境、其他学科情境、数学学科情境.知识迁移基本上与《数学课程标准》中的“情境与问题”对应,由于需要面临情境采用多种规则或多种方法解决问题,所以将其作为数学关键能力表现的二级水平.知识创新指学习者能够对问题进行推广、变式,能够提出合理的猜想并证伪或证实;能够解决开放性、探究性问题;能够适度生成超越教材范围的新的知识,形成优良的数学学科思维品质.显然,这是数学学科关键能力的高级表现,因此界定为数学关键能力的三级水平.
这个评价模型的基本思路是,将数学的6个关键能力均按知识理解、知识迁移、知识创新三个水平划分,以知识理解、知识迁移、知识创新为“经”,以数学抽象、逻辑推理、数学建模、数学运算、直观想象、数据分析为“纬”,建立一个二维评价结构,在经纬交汇处给出具体的内涵描述,即为某种关键能力在某个水平上的具体表现,这就是考试命题的依据.数学关键能力评价模型由三个维度组成,能力维度(6个关键能力)、水平维度(3级水平)、内容维度(函数、几何与代数、概率与统计、建模与探究).
考察数学关键能力的命题框架见表2.
表2 考察数学关键能力的命题双向细目表
几点说明:
(1)利用这个表,可以分析某道题目考察的是哪些关键能力,分别是什么水平,在相应的关键能力下面的三级水平适当位置画一个勾,同时在考察内容的对应位置画一个勾.最后统计出每个关键能力、各个水平以及考察内容的各自次数,从而可以精准地分析题目分布的合理性.
(2)每一道题目不一定只测量某一种能力,而往往是测量多种能力.例如,数学问题的解决总是存在逻辑推理和数学运算,因此这两种能力几乎渗透到所有的问题解决中.但是,每一道题应当有一种作为主要考察的关键能力.
(3)关于每道题目的分值确定.可以采用如下方案:由各水平的分值确定题目的总分值.将题目中1级、2级、3级水平分别计x分、x+1分、x+2分,x可以取一个恰当的值从而确定各水平的分值.例如,假如有两道题目分别考察了数学抽象、逻辑推理、数学运算、直观想象,其分布如表3.
表3 两道题目考察的关键能力及水平分布示例
从表3可以看到,知识理解水平考察了4次,知识迁移水平考察了2次,知识创新水平考察了1次.取x=2,则知识理解水平分数8分,知识迁移水平分数6分,知识创新水平分数4分,分布是基本合理的.由此可以确定题1的总分是2+3+2=7分,题2的总分是3+2+2+4=11分.
《数学课程标准》指出命题的原则,“考查内容应围绕数学内容主线,聚焦学生对重要数学概念、定理、方法、思想的理解和应用,强调基础性、综合性;注重数学本质、通性通法,淡化解题技巧;融入数学文化.”[8]因此,考试命题应当以此为准则,真正把命题指向学生核心素养的达成而非单纯对知识理解的考察.
传统的考试,题目基本上以验证、证实为主要题型,答案是唯一的,解决问题的过程就是利用相关概念、规则去寻求这一答案.显然,这样的题目主要依托解题者对知识的理解和对各种解题技能技巧的熟练掌握,以考量知识与技能的掌握为主要目的.要改变这种考察模式,以考察关键能力的发展为目标,就应当把探究型问题适当放入考题中,探索答案而不是只有验证答案.
探究型问题的形式可以是,①开放性问题.开放题是指问题的答案不是唯一的,或者问题的条件是不充分的,或者问题的条件是冗余的(即有的条件是多余的).开放性问题也包括只给出条件不给出结论的问题,可以让解题者自由探究结论,不同的解题者得到的结论可能是不一样的.②推广性问题.指在解决的基础上可以把这个问题进行推广,将特殊情形推广为一般情形.③变式性问题.指改变问题的条件或者对图形进行运动变化而产生新的结论.④作文性问题.给出一个题目,围绕这个题目写一篇小作文.
案例1:如图1,我们知道,以Rt△ABC的三边为边长的三个正方形的面积之间有关系:两个小正方形面积之和等于大正方形.请你回答下面的问题:
(1)如图2,以Rt△ABC的三边为边长的三个等边三角形的面积之间有什么关系?请给出证明.
(2)根据上面两个问题的启示,你还能发现哪些结论?请你写发现的一个结论,并给出证明.
图1
图2
第(1)题将问题作了变式,是一种新的情境(数学内部情境),涉及逻辑推理、直观想象、数学运算.第(2)题是开放性问题,考察学生推广命题的能力,涉及数学抽象、逻辑推理、直观想象、数学运算.具体水平见表5.
表5 案例1的关键能力和水平分布
案例2:请你就对“函数”概念的理解,写一篇200字的作文.
学生可以就对函数知识本身的理解、函数在知识体系中的作用、函数在现实中的应用、函数的历史发展、函数的类型及特征、函数的美学特征等等方面选取题材进行描写,从而考察学生的核心素养.
问题情境包括现实生活情境、其他学科情境和数学内部情境.所谓问题情境设置合情化,是指现实生活情境要体现真实性,其他学科情境要满足科学性,数学内部情境要突出探究性.PISA关于数学素养的测试题目,几乎都有真实的现实情境或科学情境,值得在编制考察数学关键能力试题时借鉴.
案例3:现在我们定义两种运算“*”和“⊗”,对于任意两个整数a,b,有
a*b=a2+b2,a⊗b=2ab.
(1)因式分解:(a*b)-(a⊗b);
(2)验证这两种运算满足交换律,即a*b=b*a,a⊗b=b⊗a;
(3)如果要使结合律成立,即(a*b)⊗c=a*(b⊗c),那么a,b,c之间要满足什么条件?
(4)请你自己用代数式定义这两种运算,使得结合律恒成立.
这道题目的情境是数学内部情境,它打破了传统命题思维的束缚.不是在学生已经学习过的概念基础上解决问题,而是利用所学习过的知识去解理一个新的概念,本质上是要求学生抽象出一个新的概念,这是数学抽象过程,同时考察了逻辑推理和数学运算.本题的情境设置较好,体现了数学情境的探究性.
一套试卷的编制,首先要考虑对6个关键能力的综合考察,题目应当覆盖6种关键能力.其次,三级水平的题目都应当出现,根据不同的考试目的,三级水平的题目分值比例可以不同.例如,平时测验试题的水平一、二、三的分值比例可为5∶4∶1,选拔性考试的比例可以为4∶4∶2.
按照《数学课程标准》要求,考题中应当减少选择题和填空题,因为这样的题目难以考察关键能力.一道好的题目,也应当考虑能力及水平布局的合理化.
(第17题)
案例4:江苏省2016年高考题第17题.
现需要设计一个仓库,它由上下两部分组成,上部的形状是正四棱锥P-A1B1C1D1,下部的形状是正四棱柱ABCD-A1B1C1D1(如图所示),并要求正四棱柱的高OO1是正四棱锥的高PO1的4倍.
(1)若AB=6m,PO1=2m,则仓库的容积是多少?
(2)若正四棱锥的侧棱长为6m,当PO为多少时,仓库的容积最大?
本题考察的数学关键能力:直观想象:第(1)题是一级水平;第(2)题需要引入辅助线,是二级水平.数学运算:第(1)题用单一规则计算,属于一级水平;第(2)题用多种规则计算,属于二级水平.逻辑推理:第(1)题用到简单推理,是一级水平;第(2)题进行多步推理,是二级水平.
从考察关键能力角度看,这道题目涉及的能力水平偏低.如果增加一个问题,考察的关键能力会更加全面,水平分布更加合理.
增加问题(3)-1:由这个问题,你能构造一个类似的问题并解决它吗?
或者问题(3)-2:你能否把这个问题作一般化处理?请给出解答.
问题(3)-1是开放性问题,例如,学生可能会想到把求体积问题变化为求表面积问题;可能会把正四棱柱、正四棱锥改为圆台、圆锥等等.问题(3)-2是推广性问题,可以设正四棱柱的高O1O与正四棱锥的高PO1之比为a,设正四棱锥的侧棱长为bm,从而将问题一般化.
增加的问题考察的关键能力为数学抽象:从特殊到一般的抽象或类比得到新的结论,三级水平;逻辑推理:推理过程类似第(2)题,二级水平;数学运算:二级水平;直观想象:类比得到新的结论,需要重新作图,引辅助线,三级水平.
本题通过三道小题的设计,使考察的能力比较全面,三个水平的分布比较合理.