徐 帆,张胜元,孙庆括
初中数学学业评价与课程标准的一致性研究——以福建省五套中考数学试卷为例
徐 帆1,张胜元2,孙庆括3
(1.江西省赣州市第三中学,江西 赣州 341000;2.福建师范大学 数学与信息学院,福建 福州 350117;3.南昌师范学院 数学与计算机科学系,江西 南昌 330032)
学业评价与课程标准的一致性问题不容忽视.福建省5套中考数学试卷与课程标准的一致性水平侧重不一:各维度一致性结果整体较好,各领域一致性水平不尽相同.产生的原因可能是:与国家课程标准中存在的不足有关,与命题专家关注度不够有关,与教师一致性素养不高有关,以及研究工具自身的不足有关.提高试卷与课程标准吻合程度的途径有:进一步完善课程标准,命题基于一致性视角,教学实践融入一致性,研制本土一致性工具.
课程标准;学业评价;一致性;韦伯分析模式
中国于21世纪初进行了新一轮国家基础教育课程改革,颁布了《基础教育课程改革纲要(试行)》(简称《纲要》),2001年颁布了国家课程标准,这为国内一致性研究提供了孕育的土壤.需要指出的是,此次“新课改”的本质就是基于课程标准的改革.《纲要》明确规定:“国家课程标准是教材编写、教学、评估和考试命题的依据,是国家管理和评价课程的基础.”[1]进一步,初中学业评价(简称中考)作为义务教育阶段的终结性测验,兼具“毕业性”和“选拔性”双重性质,对促进中等教育发展、人才培养和选拔至关重要.2011年颁布的《义务教育数学课程标准》[2](简称《课程标准》)作为一个纲领性文件,也是中考试卷命制的根本依据.因此,确保学业评价与课程标准的一致性,才能有效检测学生应有的认知水平和应具备的技能水准,才能有效发挥学业评价所承载的选拔功能,所以学业评价与课程标准的一致性问题不容忽视.
回顾国内外学业评价的一致性研究现状,美国在其中担任重要角色.一致性研究始于美国,成熟于美国.20世纪60年代中期,美国各州应联邦教育部要求,陆续使用国家常模测试,但由于测试之初经验匮乏,忽视了测试与美国州立课程标准之间的匹配度,因而导致测试不足以体现学生应有的认知水平和技能水准.基于此,学业评价与课程标准是否具有一致性才进入人们的视野.1980年代初,美国掀起了一场“基于标准的教育改革运动”,此次改革制订了一项检测州立学校是否有效落实课程标准的关键性指标.此时研制一致性分析模式成为美国基础教育课程研究领域的重要课题[3].至90年代,美国教育部颁布了多个改革文件,进一步使课程标准在学业评价中占据核心地位.进入21世纪,美国教育部2001年《不让一个孩子掉队》法案的成功实施,把一致性研究推向了新的高度,它进一步确定了评价对于学科学习内容的重要性,并规定用一致性分析来检测课程标准的实施情况.
国内一致性研究起步较晚,新课改时期颁布的课程标准可视为孕育阶段.通过中国知网(CNKI)检索已有相关文献,通过梳理可分为两个阶段.
第一阶段为2011年以前,主要是国内学者对美国一致性研究的缘由、模式探索、研究范式进行归纳总结,并思考将其引入中国的可行性及需要面对的挑战,最后得出结论研究模式需要本土化改造用于国内研究.这一阶段较早的研究者有刘学智[4-6]、崔允漷[7]、范立双[8]、张雷[9]、杨玉琴[10]、岳喜腾[11]等.其中刘学智是国内最早进行一致性研究的学者之一,他发表的多篇文章对国内一致性研究提供了很好的理论支撑,也对国内一致性研究起到很好的推动和传播作用.
第二阶段为2011—2018年,主要是国内学者借鉴美国一致性研究模式在国内进行各科定量分析.通过中国知网检索,其中以“课程标准一致性”为主题词的文章涉及944篇,以“课程标准+一致性+数学”为主题词的文章共有144篇文章,特别是以“中考+数学+一致性”的文章甚少,仅有7篇,研究模式多是SEC模式,专门针对韦伯模式的中考试题研究仅有3篇相关论文,可见目前中考数学学科在这方面的研究还有待进一步加强.
综上所述,尽管目前中国在一致性领域研究取得长足进步,但还存在一致性量化研究不足、对中考的一致性关注度不够等现象.基于此,研究者以福建省中考数学试题为例探析试卷的一致性,以期检测试卷与课程标准的吻合程度,更好地帮助教师理解课程标准、学业评价和课堂教学3者之间的联系,最大程度地利用课程标准来指导教学实践.
2011年颁布的课程标准;2017年福建省统一中考数学卷(编码“A”);2016年福州市中考数学卷(编码“B”);2016年厦门市中考数学卷(编码“C”);2016年龙岩市中考数学卷(编码“D”);2016年南平市中考数学卷(编码“E”).
通过比较目前主流的一致性研究工具韦伯分析模式、SEC分析模式、Achieve分析模式,最后采用韦伯分析模式,它具有研究维度更全面、程度更精细、操作更简便、临界值更明确等优势.它是1993年诺曼·韦伯(Norman L. Webb)博士在美国国家科学发展基金会(NSF)和美国州的合作项目(SCASS)的资助下,开发的学业评价与课程标准的一致性工具,作为一致性研究面世的第一个研究工具,它在美国各州得到广泛运用并得到美国多个行政部门的高度评价,在国内也有较好的适应性.
韦伯认为要进行一致性分析,首先要对课程标准中的内容目标进行描述,即构建“金字塔”式课程内容目标体系,顶端为“学习领域”,中部为学习领域下设的“学习主题”,最下层为学习领域的“具体目标”[12].进一步,韦伯认为在教育领域,一致性研究主要表现为5个维度,即情感态度维度、知识技能维度、认知要求维度、教育公平维度和教学维度,而“韦伯分析模式”主要是从“知识技能”和“认知要求”两个维度考量试卷与课程标准的一致性,又分为“知识种类”“知识深度”“知识广度”“知识分布平衡性”4个子维度判断一致性[3].具体的韦伯一致性判断标准如表1.
表1 韦伯一致性可接受水平判断标准[13]
3.3.1 本土化改造
目前中国大部分一致性研究都直接采纳和编译国外一致性工具,自编工具较少.很显然,国外现有工具由于文化差异、教育理念的不同以及课程重点等因素会导致直接编译的工具不能很好地反映中国实情[14].因此,研究者在借鉴美国韦伯分析模式进行一致性研究时,不能按部就班地直接套用于中国,而应该基于此模式进行适度本土化改造.
第一,知识深度水平本土化.韦伯分析模式的知识深度水平划分为4个等级,分别是“回忆”“技能(概念)”“策略性思维”“拓展性思维”,考虑到两国课程标准的差异性,按中国课程标准中的结果性目标进行编码,对应的知识深度水平划分为“了解”“理解”“掌握”“运用”.
第二,课程标准目标层次本土化.按照中国课程标准内容编排的特点,把韦伯“金字塔”式目标体系划分的3个层次本土化改造为4个层次目标,即学习模块、学习领域、学习主题、具体目标,如图1所示.另外,4个学习模块“数与代数”“图形与几何”“统计与概率”“综合与实践”共分为9个学习领域[2].其中“统计与概率”模块具体分为“抽样与数据分析”“事件的概率”两个学习主题,且内容不多,因此研究者把它合并为“统计与概率”学习领域.此外“综合与实践”是在其它3个模块中加以具体落实.所以从“数与式”“方程与不等式”“函数”“图形的性质”“图形的变换”“图形与坐标”“统计与概率”这7个领域分析一致性.
图1 课程标准内容目标体系
3.3.2 编码标准的确定
对课程标准进行编码.首先,对学习模块数与代数、图形与几何、统计与概率分别编码1、2、3.其次,对模块下设7个领域,分别编码1.1、1.2、1.3、2.1……最后,对主题和具体目标依次编码.例如,“图形与几何”模块的学习领域有“图形的性质”“图形的变换”“图形与坐标”,分别编码2.1、2.2、2.3,图形的性质领域下又分为“点、线、面、角”“相交线与平行线”等多个主题,依次编码2.1.1、2.1.2……进而具体目标编码为2.1.1.1、2.1.1.2……此外,对于课程内容中的单独一条目标,有不同的行为动词,要进一步拆分进行编码.例如,“三角形”主题下的一条具体目标“理解三角形及其内角、外角、中线、高线、角平分线等概念,了解三角形的稳定性”,理解和了解是两个不同的行为动词,所以编码时把它拆为“2.1.3.1理解三角形及其内角、外角、中线、高线、角平分线等概念”和“2.1.3.2了解三角形的稳定性”.最后,按照上述课程标准的编码原则,把课程标准中的具体目标共编码为219个.
对中考试题进行拆分编码,然后按照课程标准的具体目标编码表比对查找对应的编码数据.例如,2017年福建省中考数学卷第11题计算,按照编码标准分析,本题涉及3个知识点,分别为有理数的绝对值、零指数幂、有理数的混合计算,对应的课程标准具体目标编码分别为1.1.1.5、1.1.1.8、1.1.4.1,最后把试题编码数据填入试卷多项目表中,统计编码数据后以表1的判断标准确定是否符合课程标准的一致性.
按照上述编码原则,结合韦伯模式判断标准,把编码数据整理后得到表2.可见,在维度划分上,5套试卷整体在知识分布平衡性维度的匹配程度最好,除了南平卷的“图形与坐标”领域一致性稍差,5套试卷的其它领域都表现出一致性.其次,在领域划分上,方程与不等式与课程标准的吻合程度最好,数与式、图形的性质和统计与概率等3个领域的一致性结果也较好,但图形与坐标领域一致性较差,它在“知识种类”和“知识广度”两个维度均不具有一致性.整体上,5套试卷与课程标准在“知识种类”“知识深度”“知识分布平衡性”3个维度与课程标准的一致性较好,而“知识广度”一致性不尽人意,这也说明5套试卷所考查的知识面较窄,这与课程标准要求学生掌握的知识范围出现严重偏差.
表2 福建省5套中考试卷与课程标准的一致性结果统计
注:根据编码标准,编码1.1表示“数与式”,1.2“方程与不等式”,1.3“函数”,2.1“图形的性质”,2.2“图形的变化”,2.3“图形与坐标”,3“统计与概率”.A为2017福建统一卷,B为2016年福州卷,C为2016年厦门卷,D为2016年龙岩卷,E为2016年南平卷.
4.2.1 知识种类一致性
5套试卷在图形的性质领域与课程标准的一致性最好(如图2),其最低击中16个具体目标数,远大于6个临界水平.其次,数与式、方程与不等式、函数、图形的变化4个领域结果也较好,而统计与概率则有两套试卷击中少于6个,这与课程标准的一致性表现稍差.特别地,图形与坐标领域击中量均小于6个,其最多击中也仅为3道,特别是2016年南平卷在此领域击中量为0.值得强调的是,5套试卷在函数领域击中题量出入较大,其中厦门卷、南平卷和龙岩卷击中较多,福州卷仅击中3个目标,这与课程标准不具备知识种类一致性,但是函数在初中教学中的地位不言而喻,其本质、内涵和外延也是学生应掌握的内容,现阶段中国提倡发展学生的核心素养,而函数在培养学生“数学抽象”“逻辑推理”“数学建模”等素养上占有举足轻重的地位,理应得到重视.
图2 5套试卷知识种类一致性分析
4.2.2 知识深度一致性
图3是5套试卷在知识深度维度的一致性结果分布情况.若具有一致性用“1”表示,反之则用“-1”表示.5套试卷大部分领域都符合课程标准对知识的认知要求,表现出较好的知识深度一致性,也说明福建省内各试卷对学生应掌握知识的深度水平把控较好.但不容忽视的是,函数和图形的变化领域均有2套试题不符合课程标准的认知要求.研究者通过对试题认知水平分析得知,造成结果的原因是多方面的.一方面,这两个领域内容一般在试卷压轴题出现,难度较大,从而导致考查高于课程标准的认知要求.另一方面,这两个领域在各自模块都是较为核心的内容,能够较好融入其它知识点考查,以凸显试卷的综合性,但考虑到中考也应具有一定的选拔性,因此这两个领域考查高于课程标准的认知要求也在情理之中,这样有利于实现中考的选拔功能.
图3 5套试卷知识深度一致性分析
4.2.3 知识广度一致性
图4是5套试卷的知识广度一致性比值.按韦伯模式的判断标准比值不低于50%定义可接受水平时,这5套试卷的一致性结果都不尽人意,但考虑到中考受考试形式与答题时间的限制,试卷对知识的考查不可能面面俱到,故知识广度很难达到较高的百分比,于是研究者在考虑实际教育状况的基础上,以知识广度比值不低于40%定义为可接受水平.但即使以此标准统计数据,也仅有部分试卷在“方程与不等式”和“统计与概率”领域达到一致性可接受水平.
进一步,研究者在对课程标准编码过程中也发现其中存在诸多不足,这或许也是造成知识广度一致性较差的原因.第一,课程标准中确实存在某些不合时宜的目标,例如“会用计算器求平方根和立方根”“能用计算器处理较为复杂的数据”等,但现在大部分地市中考已经明文规定不能使用计算器,所以这类目标也就得不到应有考查.第二,有些目标属于学习过程中的阶段性目标,但中考考查的知识较综合,例如“能画出反比例函数的图像”“会用描点法画出二次函数的图像”等.第三,有些目标表达较模糊,这导致在试卷中难以体现,例如“经历估计方程解的过程”“体会抽样的必要性”等.
图4 5套试卷知识广度一致性分析
4.2.4 知识分布平衡性一致性
5套试卷除了在南平卷的图形与坐标领域分布平衡指数为0外,在其它领域的分布平衡指数均大于0.7(如图5),即在该维度与课程标准的一致性结果都很好,这也说明5套试卷在击中目标的分布上是较均匀的,不存在明显的目标集中堆积现象,可以有效地测验学生对知识的整体把握情况.另外,知识分布平衡指数受该领域击中具体目标试题数量影响,击中试题越多则平衡指数信度就越高,研究也就更具价值.进一步,在采用韦伯模式验证知识分布平衡一致性时,以试题击中的“学习主题”进行分布平衡性分析,得到的结果与上文又有所差异.如对2017年福建卷按照试题击中的“学习主题”进行分布平衡性分析,得到7个领域击中的具体目标在主题下的平衡指数依次为0.680、0.875、1.000、0.690、0.875、1.000、0.700,可见,虽然2017年福建卷在各个领域下击中的具体目标分布较为均匀,但在“数与式”“图形的性质”领域主题下知识点的分布情况都不太好,当然这也说明试卷对各个主题的考查侧重不一.
图5 5套试卷知识分布平衡一致性分析
研究结果表明,5套试卷与课程标准的一致性水平侧重不一.首先,各维度一致性结果整体较好.知识种类、知识深度和知识分布平衡性这3个维度与课程标准的一致性要求基本吻合,但在知识广度维度一致性不约而同地让人失望,这与课程标准要求学生应掌握的知识范围存在较大偏差.其次,各领域一致性水平不尽相同.“方程与不等式”“数与式”“图形的性质”“统计与概率”4个领域一致性结果较好,其它3个领域一致性相对较差.
5套试卷与课程标准的匹配程度并非十全十美,其中还存在一些知识偏离现象,或遗漏课程标准的一些核心内容,或高于课程标准的知识水平,可能导致学业评价无法实现其反馈功能,进而影响下一步的教学实施及高一级学校选拔优秀人才.究其原因是多方面的.
第一,可能与国家课程标准中存在的不足有关.表现型评价缺失,虽然课程标准内容中存在对学生学业评价的宏观建议,但对学生学习后的表现评价还是缺乏具体的标准.中国课程标准还只是“看似一个缺少学习成果评价标准的课程内容框架”.另外,有些具体目标不合时宜、表达欠清晰、属于学习过程中的阶段性目标等,这些都会影响学业评价的一致性水平.
第二,可能与命题专家关注度不够有关,目前“一致性”还没得到命题专家应有的重视,也未过多考虑试卷的知识种类、广度和分布情况,进而可能导致试卷的一致性水平不高.
第三,可能与教师一致性素养不高有关.当前教师的一致性理论还不足,开展一致性研究的积极性还不够,但一致性研究对于提升教学能力又是必要的,它有助于提升教师的专业素养.
第四,研究工具存在自身不足.现阶段国内一致性研究都直接采纳和编译国外一致性工具,自编工具较少.值得探讨的是,中国与国外教育水平的存在差异,国外理论的适用性还有待进一步考证,因此以国外研究模式按部就班、一字不落地“照搬”在国内研究是不太明智的.为提高试卷与课程标准的吻合程度,可从4个方面改进.
(1)进一步完善课程标准.
课程标准中存在表现型评价缺失和一些不合时宜的具体目标.建议后续课标修订时,适当加入表现型评价标准,规范学业水平考试,使考试内容、评价体系更为规范、严谨.课程标准中的课程内容应与时俱进.只有保证课程标准的科学性和有效性,才能为新一轮“数学核心素养”导向下的人才培养机制相契合,才能为教师的课堂教学和评价保驾护航.
(2)命题基于一致性视角.
试卷命题者在试卷命制的过程中应尽量贴近课程标准,结合一致性研究方法改善命题技术、借鉴命题方法,通过研究相关因素的一致性,借鉴科学的量化比较方法,对存在显著差异的中考数学试卷进行纠偏和改进,使得中考是基于课程标准的考查,以更好地保证课程标准的全面有效落实.因此,建议命题专家基于一致性视角进行命题.对知识种类而言,需要尽量保持同一领域击中量不低于6道.对知识深度而言,应准确把握内容标准中的要求.对知识广度而言,应尽量不重复考查同一目标,对一些较容易忽略的目标可酌情加入,使试卷更具有系统性、综合性等.
(3)教学实践融入一致性.
“教师是决定教改成功与否的重要人力资源之一”[18],一线教师教学应该是基于“课程标准”的实施,而一致性分析是有效检测教学是否按照标准进行的有力工具,如对期中期末考试试题做一致性检验.一方面,可以检测试题的科学性,进而有效反馈学生应有的水平.另一方面,可以探析课标的实施现状,也有助于教师更好地理解课标、学业评价和课堂教学3者之间的联系,进而做到教学实践立足“双基”、渗透“数学思想”,帮助学生积累“数学活动经验”、“领悟”数学核心素养.
(4)研制本土一致性工具.
研制本土一致性工具刻不容缓.目前,开展一致性研究的主流工具并非十全十美,工具在国内的适应性也有待加强.因此,亟需建立一套符合中国国情,完整、系统的研究工具,不仅可以有效检测学生掌握知识的情况及水平的高低,也可为教育发展、人才培养和选拔发挥重要作用.
[1] 中华人民共和国教育部.基础教育课程改革纲要(试行)[M].北京:人民教育出版社,2001:2.
[2] 中华人民共和国教育部.义务教育数学课程标准(2011版)[M].北京:人民教育出版社,2011:1.
[3] NORMAN L WEBB. Alignment of science and mathematics standards [M]. National Institute for Science Education University of Wisconsin-Madison, 1999: 11-18.
[4] 刘学智.论评价与课程标准一致性的建构:美国的经验[J].全球教育展望,2006(9):35-39.
[5] 刘学智,马云鹏.美国“SEC”一致性分析范式的诊释与启示——基础教育中评价与课程标准一致性的视角[J].比较教育研究,2007,29(5):64-67.
[6] 刘学智.小学数学学业评价与课程标准的一致性研究[D].长春:东北师范大学,2008:1-6.
[7] 崔允漷,王少非,夏雪梅.基于标准的学生学业成就评价[M].上海:华东师范大学出版社,2008:1-10.
[8] 范立双,刘学智.美国“成功分析模式”的诠释与启示——学业评价与课程标准一致性的视角[J].比较教育研究,2010,32(8):77-80.
[9] 张雷.学业评价和课程标准一致性分析模式与个案研究[D].长春:东北师范大学,2011:1-55.
[10] 杨玉琴,王祖浩,张新宇.美国课程一致性研究的演进与启示[J].外国教育研究,2012,39(1):113-121.
[11] 岳喜腾,张雨强.基于课程标准的学业成就评价:韦伯模式之研究[J].全球教育展望,2011(10):79-85.
[12] PAUL M, DORIS R, PHOEBE W. State standards and state assessment systems: A guide to alignment council of chief states school officers [M]. Wisconsin: National Institute for Science Education University of Wisconsin-Madison, 1999: 1-43.
[13] 陈娴,郏璨璨,陈宁.物理内容标准与考试之间的一致性研究[J].课程·教材·教法,2010,30(7):67-71.
[14] 周淑红,王玉文.小学数学核心素养的特质与建构[J].数学教育学报,2017,26(3):57-61.
[15] 徐帆,黄莉,张胜元.2017年福建省中考数学卷与课程标准的一致性研究[J].福建中学数学,2017(7):1-5.
[16] 胡军.学生学习成果评价标准不能在课程标准中缺失——澳大利亚科学课程内容与标准给我们的启示[J].课程·教材·教法,2005,25(9):10-14.
[17] 缪琳,陈清华,苏圣奎.义务教育课程标准与中考试卷一致性分析——以2013—2016年厦门市中考数学试卷为例[J].数学教育学报,2017,26(5):44-48.
[18] 骆洪才,昌国良,范凌.义务教育数学课程改革研究阶段性评述[J].数学教育学报,2008,17(3):23-26.
Study on the Consistency between Mathematics Academic Evaluation and Curriculum Standard in Junior Middle School——Take 5 Sets of Mathematics Examination Papers in Fujian Province as an Example
XU Fan1, ZHANG Sheng-yuan2, SUN Qing-kuo3
(1. No.3 Middle School of Ganzhou, Jiangxi Ganzhou 341000, China;2. College of Mathematics and Informatics, Fujian Normal University, Fujian Fuzhou 350117, China;3. Department of Computer and Mathematics, Nanchang Normal College, Jiangxi Nanchang 330032, China)
The consistency between academic evaluation and curriculum standards couldn’t be ignored. Using Webb analysis model, literature research method, content analysis method and other research methods, the consistency and matching degree between the 5 sets of middle examination papers and curriculum standards were analyzed. The results showed that the matching degree between the 5 sets of examination papers and curriculum standards was not perfect, which may lead to the failure of the feedback function of academic evaluation. Furthermore, in order to improve the conformity between the examination paper and the curriculum standard, suggestions were put forward from the perspectives of curriculum standard revision group, propositions, teachers and researchers. Propositions were based on a consistent perspective, consistency of teaching practice integration, develop local consistency tool.
curriculum standards; academic evaluation; consistency; Webbanalysismodel
2019–01–28
2017年江西省教育科学“十三五”规划课题——江西城乡义务教育数学教师有效教学行为对比研究(17YB261)
徐帆(1993—),男,江西南昌人,硕士,主要从事数学课程与教学论研究.
徐帆,张胜元,孙庆括.初中数学学业评价与课程标准的一致性研究——以福建省五套中考数学试卷为例[J].数学教育学报,2019,28(3):98-102.
G423.04
A
1004–9894(2019)03–0098–05
[责任编校:陈汉君、张楠]