激发兴趣 挖掘潜能 培养创造力①
——评IB数学内部评价的最新演变

2017-12-26 09:05
数学通报 2017年12期
关键词:概率比赛评价

马 峰

(上海市上海中学 200231)

传统意义的数学课程给人的印象是学新的数学知识、技巧与做题练习.一些文科出生的人士会经常调侃自己当年为何“数学不好”.与此同时,中国被公认为是数学基础教育的强国.当传统数学教学遇到了如今的教育反省思潮,老师们纷纷开始寻找课堂教学方式和评价方式的改进策略.本文着重探讨发动学生做课题的一种评价方式——IB课程的内部评价,试图揭示IB数学内部评价最新演变的关键点及其实质,以期对我国的教学课程改革有所借鉴.

IB数学的内部评价在很多IB教师和学生的实践与争议中不断地发展.2006版的内部评价模式自2014年5月起被舍弃,取而代之的是2014版的新内部评价方案.

1 2006版内部评价概要

1.1 布置方式

2006版的内部评价基本上是采用国际文凭组织官方命题的形式,由学生按照给定的命题,一步步按照既设的方案进行解答.IB组织鼓励IB教师自行命题,但由于自行命题的质量并不一定能够保证学生在各项评价指标上都能够达到最高水平,因此,绝大多数老师自然都要求学生去完成官方的命题.请注意,学生对命题的回答不仅仅是给出答案那么简单,而是要用语言文字很好地解说自己的原理、方法和过程,言之有据,形成一篇小型的数学文章.

2006版的内部评价要求学生在“数学探究”(以下简称I型)和“数学建模”(以下简称II型)两个类型中各选择至少一个问题.其中,“数学探究”类似于一个纯数学问题的研究、推导、计算、证明等,而“数学建模”是就一个现实中的问题进行分析、建立数学模型、预测和分析合理性.

1.2 评价标准

评价标准始终是绕不开去的“指挥棒”.2006版的内部评价重视学生语言表达、数学内容及现代技术的使用等.

具体来说,I型要求学生科学地呈现数学过程(包括寻找规律).要求学生展现其采用的数学策略.学生应科学地收集数据、分析数据,并且能够在得到结论后利用其他例子来测试结论.根据所总结的规律或结构,能够正确地给出一般结论;能够指出一般结论的范围和限制;能够给出一般结论的正确性并规范地进行证明.

II型要求学生定义模型的变量、参数和条件并能正确地分析它们.科学地呈现模型的建立过程,建立适合给定的实际情境并达到该课程水平要求的模型.还应考虑模型对于数据的匹配程度,并把该模型推广到其他情形中去.在合适的精度和给定情境下,正确解释所得结果的合理性.在可能的情况下,能够指出模型的局限性并给出改进的模型.

I型和II型内部评价共通的评分标准如下表1、2所示:

表1[1][2][3]

表2[1][2]

I型报告的C项和D项的评分标准如表3所示:

表3[1][2]

II型报告的C项和D项的评分标准如表4所示:

表4[1][2]

1.3 实例

网球比赛的获胜概率建模(I型)[4]

第一部分 俱乐部练习

(1) 假设两名运动员经常互相练习,其中Adam的赢球概率一般是Ben赢球概率的两倍.这两个人决定在所在的俱乐部里玩10分的练习.

(a)定义Adam所赢得的分数记为变量X,那么对于这个变量,应用什么概率分布模型比较合适?考虑它的有效性.它的值有没有局限性?

(b) 使用你所选择的分布模型,计算随机变量X所有可能的值,使用你的数据画一个直方图.把你用于计算或画图的所有技术都记录下来.

(c)找到这个分布的期望值和标准差.在这个背景下,这些10分的比赛通常会发生什么样的情况?

第二部分 不加长的比赛

(2) 当Adam和Ben 在俱乐部比赛时,他们的赢球概率和上述大概一致.在俱乐部比赛中,网球比赛的规则基本上适用(每场比赛至少赢4个点,至少比对手多赢2个点),但是为了节省比赛时间,一场比赛不得超过7分.这就意味着如果“平局”出现(每个选手都有3个点),谁得下一个分数就定谁赢.请解释:这样赛制的比赛一共会有70种可能的情况.为了解释清楚,定义变量Y为赢得的点数.变量Y可以取到哪些值?对于每个可能的Y值,给出这个比赛所有可能的结果,并且找出其概率模型.请确保为这个分布定义一个随机变量.

(3) 使用你在(2)中得到的模型,求解Adam赢得这场比赛的概率.

(4) 总结你的发现.假设选手C和选手D比赛时,选手C得分的概率是c,选手D得分的概率是d.计算选手C赢球的概率.

第三部分 加长的比赛

(6) 假设更一般的情况,选手C得分的概率是c,选手D得分的概率是d.请计算如下概率,结果用c和d表示:选手C不到平局即赢得比赛的概率;平局产生的概率;在平局产生的情况下,选手C赢得比赛的概率.使用这些公式帮助计算选手C赢得比赛的概率:c=0.5,0.55,0.6,0.7,0.9和其它任何你想要测试的数值.鼓励使用电子表格进行计算.

(7) 什么样的表达式可以表示那些概率?如果得分的概率互相接近或者一方几乎必定获胜,情况会是怎样?

(8) 评价那些概率模型的有用性和局限性.

简评这道官方样题激起了很多热爱体育,特别是喜好球类学生的极大兴趣.他们与老师讨论比赛规则的合理性,并利用网络上现成的选手得分情况统计数据.利用这份作业中建立的模型,预测一些重大赛事的结果,以评判自己模型的好坏.不得不感叹的是,这份作业的布置其实也给数学老师提出了要求,那就是老师也需熟悉小球类体育运动及其规则,这样才能更好地与学生交流.

值得注意的是,从这份实例可以清楚地看到,学生不需要规划问题解决的策略和路线,仅需按步就班地执行即可.这是2014新版内部评价彻底进行改变的着手点.

更多官方样题请参见笔者与他人合著的 《高中国际课程的实践与研究——数学卷》一书.

2 2014新版内部评价

2011年4月刊出的IB官方文件显示,IB组织已经举行多次会议,讨论IB内部评价的改革与发展问题.从2014年毕业的IB学生开始,

•设置全新的IB内部评价的评价标准;

•内部评价的名称由“数学探究”(I型)和“数学建模”(II型)两种类型改为单一的“数学探索”;

等等.

通过2014版内部评价,IB课程试图让学生们像数学家一样发现问题、提出问题、思考问题、选择与决策、解决问题,最终通过各种形式展示自己的思考和成果.其中,发现和提出问题、选择与决策的能力培养是对原先2006版内部评价的进一步改良,这可能也是目前国内的数学基础教育实践中强调不够的部分.

2.1 布置方式

高中生做研究需要老师的指导.自行发现值得一探究竟的数学问题,对于绝大多数同学而言,并不是一个简单的事情.选择课题可以不完全地归纳为如下四步:第一步,学生需要有意识地进行积累、头脑风暴、筛选、进一步过滤,最终决定哪些课题适合自己做.第二步,进一步发展这个课题.这个过程中可能会出现一些原先没有预料到的问题,有可能顺利进展到下一步,也可能回退到第一步,也就是说,需要推倒重来.第三步,聚焦自己的课题,使得这个课题目标明确、合适(能做).第四步,要确保这个问题能够用精简的语言完成.由于时间的原因,过长的解释才能说明的问题并不一定适合做数学内部评价.以上过程可以简单地用图1表示:

图1

2.2 评价标准

第一个标准是表达.期望学生能够清楚地表达自己的想法,有明确的目标指向,全文聚焦在这个目标上,并避免不相关内容;用逻辑的方式把各种想法有机地进行整合;在合适的地方使用图像、表格、图形等形式;合理地编辑文章,使其方便阅读;在合适的地方标注索引.

第二个标准是数学呈现.主要考虑是否能够使用合适的数学语言和表达方式,定义关键术语和变量;选择合适的数学工具(包括信息和网络工具);用合适的精度来呈现结果.

第三个标准是融入程度.学生进行研究的独立性如何?是否有提问题、作猜想、探索各种数学想法的可行性?是否进行了数学的广泛阅读,并研究各类有兴趣或相关的领域?是否寻找存在的模型或建立了新的模型?是否考虑所做工作的历史意义或全球视野?是否探究了其所不熟悉的数学内容?

第四个标准是反思.是否讨论了结果的含义?是否考虑了研究的意义?是否审视了可能的局限性或拓展的可能性?是否与其他学科或者数学的其他领域作出联系?

第五个标准是数学的使用.展示作者的知识和理解;在不同情境下正确地使用数学;使用解决问题的技能;在需要的地方,能够发现和解释规律;总结和验证结论.

具体的评分标准如下表5、6所示:

表5[3][5]

表6[3][5]

2.3 实例

(1)作品简要介绍

S同学是一个勤于思考的学生,对研究有一股自发的热情.他从一次上海飞温哥华的航班上看到了日落,开始思考一个问题:上飞机后何时能够看到日落这么美妙的时刻?在学习了平面和参数方程等知识后,他研究了这个问题,并写出了一份内部评价作品.作品的基本思路是通过地球的方程,晨昏线方程以及两点之间的大圆方程求出飞机飞行轨迹与晨昏线的交点,从而得到起飞后多少时间能够见到日落.从这个实例的方法出发,可以在以后的飞行中不再错过日落和日出的美妙场景.他给自己的内部评价取了一个有点诗意的名字——天空何时亮起来?

(2) 涉及知识要点

核心要点包括:通过向量方法推导各类平面方程,球坐标与笛卡儿坐标的互换,使用Wolfram Mathematica求解一个复杂的多变量方程组,数值估算,等等.当然,所有这些,都需要一些地理知识作为前提,包括地球自转与公转、经纬度、晨昏线,等等.

(3) 作品完成过程

在这篇作品的完成过程前,学生自行过滤、筛选自己感兴趣和有能力做的问题,并与老师商量可行性.在得到指导老师的认可和些许指点后,学生继续研究这个问题,并择时与老师进一步探讨计算方法.这个过程中,学生的主动性发挥极大的作用.如果没有一定的时间管理能力和热情、决心,很难完成或做好.

在学生完成作品时,曾就该课题与我进行过三次交流,最长的一次大概为30分钟,主要是内容处理的一些可行性和技术问题.

在学生入读大学本科半年后,笔者再次与该生就该内部评价作品的完成进行了一次20分钟的访谈,涉及到了对这篇作品的反思,哪些部分尚可改进,以及完成这份作品对大学学习的影响等等.学生经过短暂回忆后,就能大概回忆起了这篇其一年多前所写文章的思路和计算的大致方法,他对完成这篇作品的兴奋之情仍然溢于言表,并跟我特别强调了他在这篇文章中的个人参与的深入程度.这点可以看出,他确实用心做了这篇作品,并且为此感到自豪.

(4)教师评述

这篇作品有较高难度,并不是一个典型的内部评价作品,学生的成果是让老师眼前一亮的.首先,作者需要有地理学科知识的储备,才能有自信着手这篇有跨学科背景的作品.其次,学生需要有“抓大放小”的宏观设计能力.比如说,由于地球自转的原因,飞机到底按照什么航线飞行?这需要做一定的基础研究,并排出所有非主要因素的干扰,并做出合理的假设.这名同学的假设是飞机按照起讫地的动态变化确定大圆方程(注意:这是动态的方程,也就决定了前述多变量方程组为何需要通过计算机来进行估算);再比如说,晨昏线方程的确定,需要精确到天、小时还是分?飞行高度是否需要考量?越是精确,对计算要求越高,这就有孰轻孰重的考量.学生还需要有一定的反思精神:在整个过程中,需要对各种干扰模型和结果的因素,根据自己的能力和结果的合理性,不断进行权衡并作出各种决定.第三,学生需要有一定的计算机软件使用能力才能解决复杂的方程,这名学生其实使用了一个四变量的方程组,其计算相当复杂,其中包括了对数值进行假设代入、使用网络计算机求解时间,再进行逼近求解.

3 简评内部评价的最新演变

2006和2014两个不同的IB数学内部评价版本的共性有以下几点:

试图发展学生对数学本质的思考,为学生提供一个在没有严格时间限制的条件下,完成拓展型数学功课的机会;使学生发展个人的技能和技巧,允许他们去经历应用数学知识所带来的满足感;提供给学生一个亲身体验数学的美、力量和有用性的机会;提供给学生一个发现、使用和感受计算器或电脑作为数学工具的机会;使学生发展耐心、坚持等品质,反思获得结果的意义的机会;提供给学生自信地展示他们知道什么、能做什么的机会;在完成内部评价的过程中,写作能力、文献搜索、现代技术的使用等将来继续深造所需要的基本素养得以不断的磨练.

2006版的内部评价模式较之更久远的版本并没有本质的不同,在那个年代发挥了积极的作用,推动学生学习学术写作.在互联网越来越普及、对人的能力要求也逐渐发生变化之际,IBO组织的自我否定和改良机制发挥了极其重要的作用.通过强大的IB教师、考官和教育者、科研人员等网络体系,它预见了教育形势的变化,并通过一轮又一轮的课程纲要修订过程,推翻原先的“大作业”形式,不断地发展新版的内部评价模式.

2006版的内部评价对于学生而言,学生是和做数学练习题一样,被动地接受教师安排的内部评价的任务,自己无需主动寻找合适的命题,也不需要做选择、判断和决策.对于教师而言,可以自行命题或者使用官方样题.但教师自行命题的风险不言而喻,使用官方样题是最便捷、省力和有成效的.对于IBO而言,最头痛的是官方样题出来以后不久,网络上就开始有各式的解答.官方题的答案是唯一或类似的,作品雷同现象也越来越突出,考官的评分也越来越难.因此,2009年在评价模式不作修订的情况下,IB组织发布了新一批的样题,以减少此类问题的发生,作为全新评价模式推出之前的应急之策.

2014新版内部评价较之于以前所有版本的革命性变化在于让学生自己选题.这更能激发学生学习数学的热情,调动学生的积极性,并培养了他们发现问题的能力.学生在选题、完成的过程中也培养了风险意识和风险评估、控制的本领,这些都是学生将来进一步发展越来越需要的能力.最新的评价标准对于学生的影响可以用激发兴趣、挖掘潜能和培养创造力来进行简单的概括.

就激发兴趣举个实例:在笔者任教的班级里,有名学生平时对数学不大感兴趣,觉得数学学习是个负担,但是对应用数学做课题这件事非常上心,花了很多时间进行思考,最后写出了一篇他平常感到困惑的一个问题:杯子里的水被倾斜至某个角度时,其体积如何计算?

所谓挖掘潜能:有的学生平时数学考试不一定表现很好,但是在不限定时间和没有考试压力、可以查阅资料的情况下,能够比较自如地调动自身所学、所思,完成一篇满意的数学文章,这就挖掘了其本身的数学的潜能,增强了学好数学的自信.

培养创造力更是不言而喻:学生们的课题作品五花八门,所使用的各类方法有时也极具创意.比如,上述“天空何时亮起来”的学生使用Wolfram Mathematica运行他的方程;有学生使用微积分知识计算鸟巢的表面积——这些问题的发现和解决过程都培养了学生的创造力.

诚然,数学内部评价在给学生创造机会的同时,也无疑是对学生的较大考验,包括时间管理、与课业其它部分的平衡、思维的活跃度等等.平时只会做题、懒于思考的学生面对内部评价,可能会没有头绪,陷入不知从何入手的尴尬境地.

此外,2014新版内部评价的标准对于老师和考官来讲,给分指令更加清晰.就老版内部评价的评分标准而言,从文中的表3和表4可以看到,在标准C和D中,制定思路中出现了按“点”给分的环节,即达到这个点可以给到多少分.而学生作品完成时“点”的组合可能并不是完全按评分标准设定的情景.举个简单的例子:表4的标准C的4分标准是“考虑模型对于数据的适切性”;5分标准是“在其它情况下使用模型”.思考一下,如果出现作者满足了“在其它情况下使用模型”,但没有“考虑模型对于数据的适切性”,这种情况下如何给分呢?这成为教师和考官比较头疼的问题.尽管IB对此类问题有比较详尽的解释,仍然避免不了教师们实际操作时的两难局面.2014新版内部评价标准的各项指标均依循老版中评价指标A,B,E,F的评分办法,赋分的递增都是采用“增量型”、“描述性”语言,即“分数越高,要求越多”.这就保证了低分的标准成为高分标准的绝对“子集”,使得标准更明确、操作更公平.当然,使用宽泛的描述性语言而避免使用学科专门术语也带来一些其它潜在的问题,但总体来说,对评分的操作性而言是一个大的进步.

在教育改革中,课程改革是核心,而评价方式又直接影响课程改革的成果.当前国内数学教育界一直在讨论课程改革和评价改革的问题,既希望避免学生成为做题机器,又希望以评价方式的变化带动课堂教学新风气的出现与繁荣.考虑到教育资源的分配与公平性,尚未有合适的新政策能够在全国范围内推行.学生评价是一个复杂、综合、动态、系统的过程,传统的笔试方式有其优势——它的实施简单、高效、分辨率强.然而,笔试也有其劣势的一面,它和参试者当日的状态也有很高的关联,单纯以笔试为目标的导向值得关注.现如今对人才的坚韧、好奇、热情、自律、主动等个人情绪进一步关注的背景下,那些应试能力有所欠缺,但其他方面有其亮点的学生也获得了展示自己才华的机会.评价是一个过程,并不是教学的最终目标.评价也应该有自己的目标,它的目标应该是育人.在争议声中不断实践和反思的IB数学内部评价还在一步步发展,这样的内部评价的标准和实施方式对于育人的积极影响也值得我们深思和借鉴.

猜你喜欢
概率比赛评价
第6讲 “统计与概率”复习精讲
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
中药治疗室性早搏系统评价再评价
选美比赛
比赛
最疯狂的比赛
基于Moodle的学习评价
保加利亚转轨20年评价