新课标背景下中学生数学建模素养的测评研究*

2024-02-27 04:59:20李沐慧徐斌艳
全球教育展望 2024年1期
关键词:编码建模维度

黄 健 李沐慧 徐斌艳

一、 引言

数学建模是联结现实世界与数学世界的桥梁,也是应用数学解决实际问题的关键。自20世纪60年代末以来,许多国家都将“数学建模”相关要求纳入课程标准中。[1]数学建模教学不仅有利于学生更好地运用数学于不同领域,提升应用能力,还有助于学生更好地理解数学本身,促进知识学习。[2]我国的《普通高中数学课程标准(2017年版2020年修订)》(以下简称为“《高中课标》”)将“数学建模”列为六大数学核心素养之一并归入必修课程内容。[3]2022年4月,教育部正式颁布的《义务教育数学课程标准(2022年版)》(以下简称为“《义务课标》”)延续了数学建模核心素养导向,并在小学和初中阶段分别提出“模型意识”与“模型观念”的关键词,为数学建模素养培育指明路径。[4]可见,基础教育阶段的数学建模教学势在必行,如何贯通义务教育阶段与高中阶段的数学建模学习与评价是刻不容缓的问题。

“数学建模”一词首次出现于我国1996年的基础教育阶段数学教学大纲中,由数学教学长期强调的“解决实际问题”演化而来,二者是一脉相承的。[5]当然,数学建模并不完全等同于解决实际问题或应用题,因此,学生已有的能力基础必然与当下期待培养的“数学建模素养”目标之间存在差距。正所谓“七次量衣一次裁”,明晰学生基础与教学目标之间的差距,才能更好地开展教学,更好地连接不同学段的建模素养培育。为此,研究基于《高中课标》和《义务课标》对数学建模素养的界定与要求,构建相应的评价指标体系,在全国范围开展测试,通过实证调查分析我国初中生数学建模素养水平的现状,剖析学生数学建模素养发展的优势与不足,为各个学段数学建模教学提供证据参考,也为未来数学建模的评价贡献思路。

二、 研究方法

(一) 测评工具的生成

目前,国际上就“数学建模”内涵与周期的描述大致相同。[6]以往研究大多引用布卢姆(Blum)在2007年提出的七阶段数学建模周期来解释与定义数学建模,《高中课标》对数学建模的定义也符合该框架但更加强调数学建模的完整性,关注最终能否解决实际问题[7]。因此,本研究主要参考我国两版课标中的要求,将数学建模素养定义为:“面对某个综合性的现实情境,能够提出合理的数学问题,构建数学模型后进行分析求解,结合现实情境解释结果并检验、优化模型,最终解决问题的能力。”

徐斌艳等基于国内课标与国际研究基础构建了一套评估我国中学生数学建模素养的工具,包括一份测试量表与相应的编码框架,该工具信效度已得到实证数据检验。[8]以该研究工具为基础,结合最新两版课标的要求和研究问题的需求,对测试工具和编码框架进行优化:

测试工具方面,参考原测试量表中设计的三道难度递增的数学建模问题(见附录“题目一:拉面有多长”“题目二:巨人有多高”“题目三:去哪里加油”),优化了题目的表征形式,增强了问题的真实背景,呼应《高中课标》所强调的“现实问题”。测试题目通过一次专家论证和两轮实证研究的检验与修改,保障了内容效度。

编码框架方面,根据数学建模的定义,参考国际数学与科学研究趋势测评研究(Trends in International Mathematics and Science Study,简称TIMSS)的双重计分制,构建了三重编码体系(见表1)。

表1 数学建模测试的三重编码体系

第一重编码是对学生解答问题的过程性评价,关注学生能否顺利完成建模的各个环节,共5级编码。第二重编码是结果性评价,关注学生数学建模的能力水平,即能够正确解答到哪一环节,共6级编码。过程性编码有助于研究学生数学建模过程中的认知障碍,而结果性编码可以更加准确地测评学生的数学建模能力。第三重编码是诊断性编码,与结果性编码绑定,用来确定学生数学建模过程中独特的表征方式、模型选择、错误或误解等。因此,每个学生对每道数学建模问题的解答都会有3位数字编码,如编码M1-42.1,表示第一道数学建模问题解答过程维度达到水平四,能力维度达到水平二,并且属于能力水平二中的第一种表现类型。

(二) 数据收集与处理

本研究旨在分析我国基础教育阶段中学生的数学建模素养基础。初中作为承上启下的时期,具有重要的研究价值,既有利于对初中生建模学习开展针对性查漏补缺,也有助于为高中阶段数学建模教学提供指导意见,为小学阶段“模型意识”培养指明目标方向。参考国际学生评估项目(The Program for International Student Assessment,简称PISA)与TIMSS等国际大型数学学业成就测评项目中样本的选取标准,研究以八年级学生作为研究主体,选取全国5个城市共15所中学进行调查,采用分层抽样方法最终得到有效测试卷共1428份(见表2)。

表2 有效问卷数据分布

三名经过编码培训的研究者对20%的测试卷进行了双盲编码,编码一致性达88.20%,评分者信度良好。研究使用SPSS软件对数据进行储存,基于经典测量理论(Classical Test Theory,简称CTT)对数据进行初步分析与信度检验。具体而言,对1428份测试量表的6个有序编码(过程性编码与结果性编码)进行克隆巴赫α系数(Cronbach’s α)的检验,得到α系数为0.842,说明各编码具有良好的内部一致性(指向数学建模素养),测试量表整体样本信度较高。

为了更加综合地反映学生的数学建模素养表现,克服CTT带来的工具依赖和样本依赖问题,本研究使用jMetrik软件进一步分析数据,结合项目反应理论(Item Response Theory,简称IRT)将测试对象与试题放在同一尺度上比较,探究学生整体的数学建模素养水平。研究选择使用Rasch模型作为拟合标准。选择该模型是考虑到其本身的简洁性,更重要的是该方法是模型驱动的而非数据驱动的。将数学建模素养作为一个心理构念进行测量是一项相对较新的工作,在还无法明确洞悉其本质属性之前,用基于Rasch模型的理论构建进行数据拟合更加严谨,得到的结论也更具说服力。

三、 研究结果

(一) 学生数学建模素养水平分析

1. 总体分析

过程性编码结果如图1所示。由图1可见,学生在三道数学建模题目上的数据分布趋势基本一致。水平零的学生人数占比随题目难度的增加而递增,达到水平三的学生人数却随题目难度的增加而递减,几乎没有学生达到水平四。由此推测,数学建模任务的难度对学生推进建模过程造成明显阻碍,而且几乎所有学生都没有检验模型的意识与行为。

能力编码的结果如图2所示。可以发现,不同于过程性编码的分布,学生能力维度编码在不同题目上的表现差异明显。题目一的能力水平分布出现双峰现象,有大约一半的学生停留在水平二或以下,另外一半的学生基本可以到达水平四,很少学生会停留在水平三。可见,对于相对简单的题目一,只要学生能顺利构建正确的数学模型达到水平三,那么基本都可以成功求解模型进入水平四。题目二的能力编码与过程性编码分布较为相似,大部分学生停留在次高水平。对于难度最大的题目三,大部分学生的能力表现仅停留水平二上,只有不到3%的学生能成功构建正确模型达到水平三,这其中也只有约二十分之一的学生能顺利求解出模型。

图1 三个建模任务的过程性编码百分比

图2 三个建模任务的结果性编码百分比

为综合分析学生表现,更加系统地了解学生的能力水平,研究基于IRT,以分部评分模型对三道建模问题的能力维度编码进行Rasch模型拟合,结果显示拟合度良好(Outfit=0.86)。计算得到题目一到题目三的难度分别为-1.73、0.17、1.55,难度递增与预设相符。

基于Rasch模型算得1428名学生的能力估计值θ如图3所示。图中横轴的0表示平均水平,不难发现超过半数学生的数学建模能力较低。总体而言,学生数学建模能力估计值的分布与题目难度的分布是大致匹配的,但由于数学建模题目的数量较少,无法较好地覆盖所有学生,这也是使用完整数学建模问题进行测量难以避免的局限性。由于数学建模问题的复杂性,在有限的测试时间内,问题的数量通常无法达到较大量。不过,本研究采用了分部评分模型分析数据,使每道题目所体现的信息量更大,有效地改善了上述局限性。相较而言,0—1评分模型中每道题目在怀特图中都被表征为一个“点”,而本研究中每道题目都是一条“线段”,可以更加全面地覆盖学生水平,因此模型的匹配度有一定的保障。

图3 基于Rasch模型的数学建模能力估计值分布

此外,从图3可见高能力水平学生的建模能力分布出现断层现象。对此,一种解释是测试的建模问题数量较少,难以较好地区分出高能力水平的学生群体;另一种解释是学生本身的数学建模能力水平存在断层,因为绝大多数学生没有验证模型的意识,导致高建模能力水平学生的差异性较难被区分。考虑到局部独立性的基本假设,本研究没有将过程维度的编码混合到能力维度编码的IRT处理中。若结合过程维度的编码数据分析,便可以增加高能力水平学生的区分度。例如,从能力估计值相同(θ=1.6059)的300名学生的过程性编码数据(见表3)中可以发现,虽然他们具有同样的θ值,但过程维度上的表现却不尽相同。题目三的区别最为明显,大部分学生都停留在无法构建正确模型的能力水平上,但过程维度却出现了约为1:10:19的差距,这样便可以进一步区分出这批学生的数学建模素养水平。

表3 能力估计值为1.6059的学生过程性编码分布

2. 性别差异

基于数学建模能力估计值θ,对性别进行独立样本t检验,发现男女生数学建模能力水平存在显著性差异(p<0.01),男生能力估计值均值(-0.911)高于女生(-1.341)。但男生能力估计值标准差为2.232,大于女生的1.876,说明女生群体能力分布较为集中,而男生群体差异性相对更大。

为了深入分析性别差异的具体表现,研究对三道测试题目的过程性编码和结果性编码分别进行了性别的差异性检验。由于编码类型属于等级变量,而非连续变量(等距),因此采用非参数的Mann-Whitney检验(4人无性别信息),结果显示:在过程维度上题目二(p=0.005<0.01)与题目三(p=0.000<0.01)均有显著性差异,而能力维度上仅题目二(p=0.001<0.01)出现了统计意义上的差异。结合算得的秩均值可以发现,在解决简单数学建模问题(题目一)时,男女生在过程和能力两个维度上的表现基本一致;在解决复杂数学建模问题(题目三)时,男女生的能力水平虽无显著性差异,但过程维度数据显示,男生似乎更能向前推进自己的建模步骤(秩均值更高);在解决中等难度建模问题(题目二)时,男女生在两个维度上都具有显著性差异,且男生整体水平略高于女生。

(二) 学生数学建模具体表现分析

从诊断性编码可以发现学生解决同一题目的表现形式非常丰富。以题目二为例,6个能力水平共出现了19种不同的解答表现,其中达到能力维度水平四的46.92%的学生中便出现了5种不同的表现形式(见表4)。

表4 诊断性编码及典型实例

虽然诊断性编码种类丰富,但大部分学生的解答表现还是集中在个别类型上,所建模型与求解方案的一致性较高。如题目二中编码M2-4.1约占总数的44%,其他编码占比均小于总数的15%。题目一也有类似现象,有33.5%的被试解答为编码M1-4.1,其余编码占比较低。题目三的诊断性编码相对分散,但还是主要集中在编码M3-2.2与M3-2.4上。

四、 研究结论与讨论

(一) 学生尚不能适应开放且真实的数学建模问题

从数据分析结果可以看出,我国八年级学生数学建模素养的整体水平不高,符合预期假设。目前,《义务课标》颁布不到两年,初中阶段的数学建模教学在实践中虽有所试验但尚未普及,学生建模基础较为薄弱也情有可原。此外,有研究表明,我国学生数学建模表现与年级呈明显正相关,高中阶段学生的建模素养会有较大提升。[9]

本研究的另一目的是从测评结果中挖掘学生数学建模能力不足的原因,为下一阶段的教学与测评提供有意义的借鉴。过程性编码分析(见图1)显示有9%—30%的学生未能顺利达到过程维度的水平一(识别变量,作出假设),这个占比不容忽视。数学建模的第一个环节是理解并简化问题,识别并确立参数,若该环节出现问题,后续建模活动便寸步难行。研究发现,学生简化、结构化、数学化问题的过程并非线性的,往往先有一个简单的数学化过程,然后在反复验证模型与现实之间关系时修改假设并优化建模。[10]未达到水平一的学生完全没有开始建模的“趋势”,这或许不是因为他们毫无思路,只是在没有绝对“正确”的方案之前不敢作答,这一般是学校常规数学训练所带来的一种负面效应。数学教学需要培养学生勇于尝试的能力,即使面对的现实问题再复杂,也能够通过多种方式简化假设,将其转化为可解的数学问题。从国际上来看,德国学生这方面的能力相对突出,而我国学生的表现与法国学生比较接近,在严格、规范的数学解题训练下,面对模糊的现实问题往往有些“举棋不定”。[11]

(二) 学生缺乏对数学建模过程的完整认知

从数据分析结果中可以发现,能够推进数学建模过程是提升数学建模素养的基础。目前中国学生的主要问题之一便是缺乏对数学建模的完整认知,导致建模过程不完整,从而一定程度上影响数学建模素养水平的体现。

数学建模过程有一个完整的周期循环结构,但从测试数据中可以察觉,学生偏向于将三道数学建模问题视为一般的应用题进行单向线性求解。其实,数学建模问题与传统应用题存在很多差异[12],应用题更多是对具体数学知识的巩固练习与运用,答案往往比较唯一;数学建模问题恰恰相反,它是从某一现实问题出发去寻找思维体系中可以解决的数学方法与模型,方案与结论都是开放的。因为学生很少接触这类问题,所以在解题过程中几乎都忽视了验证环节,这与其他一些国家的发现相吻合,学生大多不喜欢反思与验证自己的解答。[13]这种对反思和验证的忽视与大多数学生不清楚数学建模的完整过程有莫大关系。

(三) 学生建模能力的性别差异受建模过程的推进影响

在分析性别差异时,研究发现男女生建模能力的性别差异受建模过程推进的影响,由此推测信念(或自信心)可能是影响男女生数学建模素养表现的原因之一。从Mann-Whitney差异性检验结果可以看出,男生在遇到难题时依旧表现自信,愿意进一步推进建模过程,而女生更容易停留在某些环节上,顿足不前。

具体来看,面对难度最大的题目三,男女生的实际建模能力没有显著差异,但男生推进建模的进程显著多于女生。可见,男生在解决具有不确定因素的难题时更敢于尝试推进建模,不管解答是否会出现一些错误。在面对难度中等的题目二时,数据显示男生不论在推进建模过程还是建模能力方面都显著优于女生。由此推测,男女生建模能力水平所呈现的差异一定程度上与自信心相关,即男生在过程维度上更优的表现一定程度上促成了其建模能力水平的高分。综上,研究得出自信心或许通过影响数学建模过程的推进,进而造成男女生建模能力的差异。

以往研究发现我国男生的学业效能感显著高于女生[14],在数学学科上往往更加自信,这与本研究结果相似。当然,也有研究得出初中生数学建模能力没有性别差异[15],因此本研究男女生数学建模素养所表现出来的统计差异原因不可一概而论,具体影响因素还需要更多实证数据的支持。

(四) 学生具备创造性解决数学建模问题的潜力

诊断性编码分析发现,大部分学生的解答过程比较相近,构造的数学模型和使用的数学方法较为一致。这一方面是因为学生较为熟悉题目一与题目二的问题情境,能从中较快地识别出学过的数学模型(如指数模型等);另一方面,也反映出了学生对建模问题的求解思维相对固化,这大多是常规应用题训练引起的一种应试表现。

中国学生并不缺乏创造力,从诊断性编码中可以发现许多别出心裁的数学模型与解题思路。如学生解答题目二时大多利用自身鞋底的长或宽与身高的比值来估计巨人身高,这样的模型虽然合理,但仅使用鞋底的一个数据(长或宽),势必造成信息缺失。有学生便巧用面积(或几何平均数)构建比例模型解决问题,最大限度地利用了数据,这样的模型构建具有新颖性和灵活性,实在精彩(见表4的M2-4.3)。还有学生不满足于静态数据,也不满足于使用基础的比例算术方法求解问题,于是构建函数模型去表征巨人的身高,使模型更具普适性(见表4的M2-4.5)。以上学生的方法虽然只占极少的比例,但却充分展现出他们具有独特性的创造性思维。本研究的诊断性编码能够体现出学生创造性地解决建模问题的具体表现,创新思维在数学建模过程中发挥着重要作用,是数学建模能力表现中不可或缺的部分,研究者与教学者应该给予高度重视和关注。[16]

五、 研究启示

(一) 对数学建模测评的反思

数学建模作为数学基础教育阶段的一个新窗口,如何对其进行有效测评是亟需解决的研究问题。

1. 过程性评价不容忽视

数学建模评价是多维度的,对一个复杂现实问题的解决不应该只探讨其结果的合理性而忽视过程性评价。研究结果发现,在能力维度表现水平相同的情况下,数学建模的过程维度在一定程度上能够看出学生对数学建模的理解深度,即过程性评价能进一步区分学生的数学建模素养水平。《高中课标》同样强调数学建模素养培养需要关注建模过程,提出学生要“知道数学建模的过程包括:提出问题、建立模型、求解模型、检验结果、完善模型”。[17]此外,如表3所示,过程维度亦是区分高水平建模素养学生的有力证据。因此,数学建模的过程性评价不容忽视。

2. 测试题难度应恰到好处

编制难度适宜的题目对数学建模评价至关重要,难度适中的问题能更好地测试出学生的真实能力水平。就本研究的测试题目而言,题目一对于中国八年级学生而言较为简单,模型求解的难度过低。题目三难度较大,只有少数的学生能构建正确模型,其功能主要表现在区分高能力水平学生。题目二最适合八年级学生:一方面,有一半左右的学生能够达到过程维度的水平三,说明其对学生建模过程的顺利推进具有合适的阻力;另一方面,学生在该题上的能力维度编码分布与过程维度相似,即建模环节难度分配较为均匀且适中,具有良好的区分度。未来的初中生数学建模能力测试可以沿用以上三题,尤其是题目二。若要进一步基于IRT分析建模能力,可以开发更多难度系数略大于题目二的建模问题。题目三具有复杂且真实的情境,可以考虑作为高中生数学建模测试的问题之一。

3. 子能力与完整能力评价相结合

未来测试除了考虑完整的建模任务测试,还可以结合数学建模子能力的测试框架,开发相应的数学建模各项子能力测试。譬如开发聚焦学生简化问题或验证模型子能力的题目等,这也是国际数学建模测试研究的另一重要方向。[18]需要强调的是,数学建模是一个完整的过程与能力,测试各子能力水平有助于研究学生的数学建模能力构成,但不能仅仅以各子能力的简单求和来判断学生的数学建模能力。

(二) 对数学建模教学的反思

测评不是最终目的,评价应为教学提供启迪,真正做到新课标要求的“以评促学,以评促教”。未来各学段的数学建模教学可以从以下几个方面入手。

1. 自信心是数学建模素养发展的敲门砖

各学段数学建模教学都应该重视培养学生解决现实问题的自信心,这一点应该从义务教育阶段便开始培养,无论是“模型意识”还是“模型观念”,都不应该从现实背景中抽象出来,而要让学生体会数学模型对现实的描述意义,学会用数学的眼光看待世界。因此,教学中应当多为学生提供解决现实问题的机会。此外,教学还要让学生明白数学建模问题没有标准答案,要勇于推进自己的建模过程,从而发现不足并不断循环以求优化。从测评数据中也可以看出过程维度对能力维度的促进作用,尤其是对女生而言,应该更加重视其数学建模自信心的培养。

2. 认识数学建模的整体性是建模教学的首要目标

高中的教学要明确数学建模的内涵,让学生了解数学建模的基本环节与目的意义。从中学阶段开始,教学便可以让学生逐步接触完整的数学建模问题,深刻理解数学建模的整体性。这有助于学生区分建模问题与常规应用题,也有助于让学生更好地开展建模活动。教学尤其需要让学生通晓数学建模的循环过程,知道建模结果需要不断回归现实以优化方案,而不是采用简单的直线型思维,这也将有助于学生未来步入社会更好地解决复杂现实问题。

3. 创造力的培养应与数学建模素养的发展相结合

数学建模教学应该更加关注和鼓励学生发挥创造力,利用数学建模活动促进创新思维的培养。[19]创造力是数学建模的必备要素,已有研究表明具有较高创造力水平的学生数学建模能力也较强。[20]从测评数据中可以看出,有不少学生能发掘具有创新性的模型,这正是数学建模活动所希望培养的。教学需要让学生们知道,寻找更加合适、简洁、高效的模型去解决问题才是数学建模更高的追求。测试结果显示,中国学生并不缺乏创新思维,只是这些零星点点的创新表现需要教师发现并更好地引导。因此,未来各学段的数学建模评价体系的构建中,创造性是重要的指标之一。

4. 在数学核心素养的高观点下提升数学建模素养

教学除了聚焦建模内容本身的突破外,还应该关注数学素养的全面提升。新课标所强调的核心素养导向是整体且统一的,纵向上小学、初中、高中的核心素养表现是贯通的,横向上不同核心素养之间亦相互联通。[21]从本研究中亦能看出,学生所出现的错误不仅受数学建模本身技能的影响,也受到数学运算、逻辑推理、数据分析等素养的影响。因此,数学教学不能厚此薄彼,各项能力的提高、创新意识和应用意识的培养、数学建模素养的发展都是相辅相成的。

六、 附录:测试工具

题目一:拉面有多长拉面,是中国西北地方风味名吃。拉面师傅将一团和好的面揉搓成一根长条后,手握两端用力拉长,然后将长条对折,再拉长(每次拉的长度几乎一样),再对折,每次对折称为一扣,如此反复操作,连续拉扣7、8次后便成了许多细细的面条。图中的师傅拉了7扣,请你估计此时这些拉面加起来共有多长?

题目二:巨人有多高图片展示的是菲律宾一个体育运动中心的一双大鞋,吉尼斯世界纪录称这双鞋是世界上最大的鞋,每只鞋长5.29米,宽2.37米。大概多高的巨人适合穿这双鞋?请说明理由(写出解题思路或过程)。

题目三:去哪里加油林先生住在上海,他家距离上海最近的加油站10公理,而距离苏州界内最近的加油站80公里,他开着大众CC1.8T车到苏州那个加油站去加油,因为那段时间苏州汽油的价格是7.61元/升,而在上海汽油是8.04元/升。下表是大众CC1.8T车的参数。请问,他是否值得前往苏州那个加油站去加油呢?请写出你的思路,论证你的回答。

品牌一汽 大众车长(mm)4799级别中型车车宽(mm)1855发动机1.8L 118kW车高(mm)1417变速箱7档双离合变速箱轴距(mm)2712长×宽×高(mm)4799×1855×1417车重(kg)1535车身结构4门 5座 三厢轿车最小离地间隙(mm)—上市年份2012车身结构三厢轿车最高车速(km/h)215车门数40—100加速时间(s)—座位数5工信部油耗(L/100km)7.8邮箱容积(L)70.00官方综合油耗(L/100km)—行李箱容积(L)532保修政策2年6万公里行李箱最大容积(L)532

猜你喜欢
编码建模维度
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
电子制作(2019年22期)2020-01-14 03:16:24
浅论诗中“史”识的四个维度
中华诗词(2019年7期)2019-11-25 01:43:00
Genome and healthcare
基于PSS/E的风电场建模与动态分析
电子制作(2018年17期)2018-09-28 01:56:44
不对称半桥变换器的建模与仿真
光的维度
灯与照明(2016年4期)2016-06-05 09:01:45
“五个维度”解有机化学推断题