史加祥
【摘 要】国际数学测评聚焦数学学科核心素养发展,强化测评对教学的反馈、促进与改进作用。对于数学学科核心素养的理解差异会导致评价上的差别,而通过对小学数学测评卷的比较与分析,能够透析其中的差异。以中国、新加坡、英国和美国五年级数学测评卷为比较对象,利用“SEC”为主要研究工具,建立了“内容”和“认知”两个维度的比较框架,对测评卷的整体一致性和具体分布进行了比较,发现其中存在的相似与不同,对我国小学数学课程改革提供一定的借鉴与方向指引。
【关键词】小学数学;学科核心素养;测评比较框架;评价分析
“中英数学交流”使得我国的数学教育成为世界关注的焦点。我国的数学教育水平到底如何?我國的数学评价与其他国家之间的差别在哪里?是否可以从测评卷的比较上判断不同国家之间数学教育的一致性程度及具体差异表现?
一、基于测评卷的一致性研究概述
(一)研究对象
选择中国(以上海为代表)、新加坡、英国和美国(以俄亥俄州为代表)小学五年级的数学测评卷为研究对象。
(二)研究工具
本文采用由美国学者安德鲁·帕特(Andrew Porter)和约翰·史密森(John Smithson)共同开发的“SEC”(Surveys of Enacted Curriculum)一致性分析范式为主要研究工具,Porter一致性系数公式如下:
P=1- [i=1nXi-Yi2]
公式中的P值是介于 0 到 1 之间的数,一致性系数P和一致性程度成正比,P值越大说明两者的一致性程度越高。当P=1 时,表示两者完全一致;当 0.8≤ P<1 时,表示两者强一致;当P=0 时,表示两者完全不一致。[1]很多专家和学者利用“SEC”一致性来分析试卷与试卷间的一致性,“SEC”具有很强的灵活性和实用性,可以作为本文的研究工具。
二、二维矩阵建构一致性分析编码框架
二维矩阵建构首先需要对“内容”和“认知”两个维度进行梳理与确定,两个维度主要参照数学课程标准和数学教学与评价的要求等。
(一)二维矩阵“内容维度”的确定
《上海市中小学数学课程标准(试行稿)》中将课程内容划分为“数与代数”“图形与几何”“数据处理”“专题研究与实践”四个主要部分;《义务教育数学课程标准(2011年版)》中的四个部分内容为“数与代数”“图形与几何”“数据处理”“综合与实践”,两者之间有很大的相似性。在对上述课程内容统一分析与整理之后发现,它们的内容基本相似,只是表述和呈现方式存在一定的差异。本文的内容维度划分采用上海市《小学数学学科基于课程标准评价指南(征求意见稿)》中的主题模块划分方法,分为“数与运算”“方程与代数”“图形与几何”“数据整理与概率统计”,该划分方式更为科学与合理,比较符合本文的研究方向。
(二)二维矩阵“认知维度”的确定
在对文献进行梳理之后,研究使用课程标准中的认知维度划分方法,将学生的学习结果目标分为“了解、理解、掌握、运用”四个层次,四个层次包括记忆与理解水平。上述认知水平划分与布鲁姆教育目标、新目标分类学都有着相似之处,目标从简单到复杂,有一定的层次性和区分度,可以作为二维矩阵“认知维度”的具体认知水平,编码具有很强的可操作性。以上所述,形成了“SEC”一致性分析的二维矩阵,如表1所示,包括“内容”和“认知”两个维度。
三、二维矩阵编码框架的试卷分析
为了使得编码相对客观与科学,邀请了6名区域小学数学骨干教师参与分析与编码,在对“内容”和“认知”两个维度的划分与编码有着统一的认识之后,对比较的试卷分别分析与编码,判读每道题目的考点及所属的内容知识维度和认知水平维度。在对所有教师的编码汇总统计之后,对编码差异较大的进行了讨论和适当的调整与修正,在对数据进行处理与分析之后,形成中国、新加坡、英国、美国四国最终比较的比率值数据,如表2所示。
四、基于“SEC”一致性的测评卷分析
(一)“内容维度”的分布分析
在对中国、新加坡、英国和美国小学数学测评卷进行比较之后,对测评卷中的内容差异有了比较清晰的认识,为了直观显示差异,根据表1中的数据制作了内容权重情况分布图,如图1所示。
从图中可以看出,新加坡和中国测评卷中的内容分布整体比较相似,而英国与美国测评卷中的内容分布则比较相似。在“数与运算”主题上,英国最高(为0.55),美国其次(为0.47),新加坡最低(为0.14),英国是新加坡的3倍多。在“方程与代数”主题上,中国与新加坡都为0.53,并列第一,英国最低(为0.21),美国为0.32。由上可见,中国与新加坡相对比较重视“方程与代数”,而英国和美国则比较关注“数与运算”。中国与新加坡在“图形与几何”主题上的占比也较高,分别为0.19和0.25,美国为0.16,高于英国(为0.1)。在“数据整理与概率统计”主题上,英国与美国的占比高于中国和新加坡,可以看出,英美相对重视数据分析与数学应用表现。
(二)“认知维度”的分布分析
在对中国、新加坡、英国和美国小学数学测评卷进行比较的基础上,对测评卷中的认知维度进行统计并根据比率值占比权重绘制成折线图,如图2 所示。
从图2可以看出,四份测评卷中,中国与新加坡的认知分布比较相似,近乎一致,而在内容维度上比较相似的英国和美国在认知维度上却存在一定的差异。在“了解”的认知层级上,英国最高(为0.19),最低的则是中国(为0.02),新加坡与美国差异不大,分别为0.06和0.08。由此可见,英国测评卷相对重视对数学知识的了解。在“理解”的认知层级上,英国也最高(为0.3),美国紧随其后(为0.27),中国与新加坡分为0.13和0.1,占比相差不大。中国、新加坡和美国测评卷在“掌握”的认知层级上相差不多,都在0.4以上,英国最低(为0.32),是所有认知层级中占比最高的。在“运用”认知层级上,新加坡与中国分别为0.43和0.42,美国为0.36,高于英国(为0.19)。
(三)总体一致性系数统计与分析
使用Porter一致性系数公式对中国、新加坡、英国和美国四份测评卷的比率值进行两两计算比较,得出一致性系数P值,如表3所示。在比较之后发现,中国与新加坡测评卷的P值最高,为0.905,属于强一致。英国与美国测评卷的一致性排在第二,为0.665,属于一定程度上一致。新加坡与英国和美国测评卷的一致性分别为0.5和0.525,属于一定程度上一致,但一致性低于英国与美国测评卷的P值。中国与美国测评卷的P值为0.625,高于与英国测评卷的0.52,属于一定程度上一致。
除了比较整体一致性,还针对各个主题内容进行了比较。图3就是“数与运算”“方程与代数”两个主题的雷达图。在“数与运算”主题中,中国、英国和新加坡的认知水平考查力度基本一致,都以“理解”水平为评价重点。而在“方程与代数”主题中,四份测评卷在认知水平考查上的要求基本一致,着重在“理解”的认知水平,而在“运用”层级上,中国和新加坡都远高于英国和美国。由图4可见,在“图形与几何”主题上,中国与新加坡的考查重点是第四层级的认知水平,美国侧重在第三层级的考查。在“数据整理与概率统计”主题上,新加坡与英国的考查水平主要为“掌握”,而中国与美国考查的主要层级为第四层级。在比较之后可以看出,四份测评卷在认知水平的考查上既有相似与一致,又有着各自的侧重水平,体现出评价的差异。
(四)其他方面的比较分析
1.试题题型的比较分析
除了“内容”和“认知”维度的差异之外,四份测评卷中的试题类型和所占的比重也有着比较大的差异。按照中国小学数学试卷中常见的情况将题型分为是非判断题、选择题、填空题、计算题、操作题、应用题和附加题七种题型,将四份测评卷进行分析汇总之后形成占比数据,绘制成折线图如图5。
从图5中可以看出,中国测评卷的题型最为丰富,七种题型都有分布,英国测评卷中没有判断题和附加题,其他题目的占比与中国较为相似,占比最多的都是计算题,均超过40%。新加坡测评卷中以选择题和计算题为主,总占比接近70%。美国测评卷中各种题型分布相对较平均,没有超过30%的题型,但操作题占比高于其他三份测评卷。在所有题型中,是非判断题、选择题和填空题被认定为客观题,其他的为主观题,只有新加坡测评卷中的客观题占比超过主观题,其他三份测评卷中主观题的数量都大于客观题。
2.具体试题的比较分析
在上述比较的基础上,我们针对测评卷中的试题内容进行了进一步的比较。首先是测评卷的表达方式与测评方式存在差别。其次在试题情境的创设上,除了数学计算题之外,数学应用题是考查学生“掌握”和“运用”的认知水平,将数学知识和技能进行实际应用。从四份测评卷的应用题的例题可以看出,中国、新加坡和美国应用题的情境都以创设为主,很少与生活实际相结合,而英国测评卷中的情境绝大部分来自生活中的实际问题,将学到的数学知识用于解决真实问题。 如:
[中国:两个城市相距255千米,甲乙两辆汽车同時从两个城市出发,相向而行。甲车每小时行42千米,3小时后两车相遇后又相距了15千米。求乙车的速度。
新加坡:莎拉和约翰有一些邮票,莎拉的邮票是约翰的5倍,当莎拉给了约翰24张之后,他们的邮票数量一样多。莎拉和约翰的邮票数量加起来一共是多少?
美国:薇拉有6码的布料, 她想用[13]的布料做一件衬衫。然后,她还想使用剩下的[38]的布料来给妹妹做一件衬衫。在制作两件衬衫后,薇拉的布料还剩下几码?
英国:杰克购买了[112]千克的土豆和[12]千克的胡萝卜。杰克用5镑来购买,请问他还能余下多少钱?(英国)
五、基于数学课程标准的测评改进建议
对四份测评卷一致性的比较的目的是发现各自的特点并能互相借鉴与学习,从而改进和完善我国的小学数学教育,科学建构测评框架和方法等。
(一)借鉴比较优缺点,促进情境中数学实际问题的解决
数学测评框架的建构需要将数学教育与现实生活进行紧密的联系,现实数学教育强调解决情境性问题,情境性问题是学生数学学习的兴趣源泉,真实生活情境中的问题更有助于学生应用和建构数学概念。只有在真实的情境性问题的解决中,学生才能够发展他们的数学工具理解,也是学生再创数学的基础。[2]国际大型测评PISA、TIMSS、NAEP等都已经趋向 “情境化”,从上面的测评卷比较中也可以看出英国在小学数学测评卷的命题中情境化程度要高于其他国家,当然对于“情境化”也要进行充分的研究,对试题情境有一个明确的界定,对情境的分类和分配要视不同的学科、不同的测试形式以及参加测试的学生的年龄而定,还要将情境的要素进行分解,将抽象的情境操作化,更好地指导命题。[3]
因此在课程改革深入的时候,我们要把解决情境性问题作为小学数学教学的重要目标,教师在课程教学中就要对情境性问题进行开发,更好地达到课程标准的要求。在学生日常数学学习、常规的测评和学业成果评价中,也应该多创设源自真实生活的情境性问题,对于提升学生数学思维、发展学生数学素养将会起到正向促进作用。
(二)细化一致性评价,强化课程标准转化落实
围绕核心素养开展测评的基点就是要将对课程标准的理解进行转化,基于课程标准建构学生的学习评价体系。由于课程标准的规定是整体性的,是分阶段进行系统设计的,是对学生的累积期望,因此不可能面面俱到,不可能直接成为评价标准,需要进行进一步的解读与转化。美国在出台教育改革案之后,每个州都开始对评价与课程标准的一致性进行研究与检视,形成了在理念上建构“金字塔”形课程内容目标、在内容上确定了四维度(知识种类、广度、深度、样本平衡)一致性具体标准的科学、实用经验。[4]
国内很多学者针对课程标准与评价体系的一致性,课程标准与评价体系之间的转化,以及试题编制开展了理论和实践研究。有教师在理论研究和实践基础上形成了课程标准解读—教材比较分析—评价标准建立—命题双向细目表制订—试题编制—抽样实验的路径。[5]可见,针对此方面的研究已经非常丰富,我国上海的小学数学教育正在有针对性地进行课程标准与评价体系的建设,开展基于课程标准的教学与评价研究,但在数学课程标准转化为评价标准,建立更为科学的测评体系上可以进行持续的思考与研究。
(三)测评聚焦发展,围绕学生数学核心素养
一直以来,数学测评以“知识”为主线,对学生的“能力”重视不够,随着课程改革的深入和对数学素养研究的推进,对学生应该学习什么样的数学知识有了更清晰的认识,同时也明确了学生在数学学习过程中必需和养成的能力。[6]数学测试的一个重要特点是测试内容越来越向数学核心知识集中,关注数学核心知识的测试设计思路也成为各国数学测评的共同取向。测评需要抓住数学核心知识,核心知识是数学课程的核心内容,是学生数学技能的基本体现,是学生进行数学思考的基本载体。[7]
《普通高中数学课程标准(2017年版)》将高中数学学科核心素养分为数学抽象、逻辑推理、数学建模、直观想象、数学运算和数据分析6个部分。[8]国际大规模测评中对数学素养的定义虽然有着各自的侧重,但都展现出越来越重视在数学核心知识的基础上,强化学生数学认知能力发展的特点,形成对数学素养双向多维度的测评框架[9],如PCAP对学生数学学习测评的框架清晰,标准统一明确,不仅测评学生在数学学习过程中对数学知识的掌握,也重视解决实际情境中数学问题的能力及学生高认知水平的发展[10]。可见,数学学科核心素养不仅是教学的重要指向,更是建立测评体系的基准与标尺。
对测评卷进行比较能够了解彼此的优势,在比较中互相借鉴,在借鉴中改进课堂教学与评价,更好地提升测评的科学性和导向性,更好地增强测评的信度与效度,更好地了解学生的数学学业成果,了解学生的学习情况,发挥评价的导向与激励作用,改善教师的“教”和学生的“学”,持续有效地发展学生的数学素养。
参考文献:
[1]张定强,裴阳. 新高考改革背景下数学试卷与课标一致性研究:以2017—2018年全国Ⅱ卷与浙江卷为例[J]. 数学教育学报,2019(4):55-60.
[2]徐斌艳. “現实数学教育”中基于情境性问题的教学模式分析[J]. 全球教育展望,2000(4):28-33.
[3]王湖滨. PISA测试的“情境”及其带来的启示:大型国际教育评价项目对“情境”的述评[J]. 外国中小学教育,2014(1):8-14.
[4]刘学智.论评价与课程标准一致性的建构:美国的经验[J].全球教育展望,2006,35(9):35-39.
[5]沈南山,杨豫晖,宋乃庆.数学学业成就评价测查试题编制研究[J].教育研究,2009(9):59-65.
[6]苏洪雨,徐斌艳.中德两国标准中的“数学能力”比较研究[J].数学教育学报,2008,17(2):52-54.
[7]NEIDORF T S, BINKLEY M. Comparing Mathematics Content in the National Assessment of Educational Progress (NAEP), Trends in International Mathematics and Science Study (TIMSS), and Program for International Student Assessment (PISA) 2003 Assessments[J]. National Center for Education Statistics, 2006(18):174.
[8]中华人民共和国教育部. 普通高中数学课程标准(2017 年版)[M]. 北京:人民教育出版社,2018:4.
[9]万川. 小学生数学素养的文献综述[J]. 西部素质教育,2016(17):89-90.
[10]唐恒钧, 高敏. PCAP数学素养评估框架及启示[J]. 当代教育与文化,2018(3):74-80.
(上海市金山区第一实验小学 201599)