赵芸赫 李春密 马宇翰 黄 敏
(1.首都师范大学附属中学,北京 100048;2.北京师范大学物理学系,北京 100875;3.中国工程物理研究院研究生院,北京 100193;4.四川省成都市新都一中铭章学院,四川 成都 610500)
我国2018年初颁布的《普通高中物理课程标准(2017年版)》从学科的角度要求发展学生的物理学科核心素养,重点是培养学生的必备品格和关键能力.课标指出要通过真实情境的问题解决促进物理学科核心素养的达成,这样才能有效应对未来生活和工作中遇到的复杂的、协作的和动态的问题.[1]从物理学科认知工具的角度,对于这种真实情境类问题,其问题解决过程中所需要的能力其实是科学家们在进行科学研究时所要经历的关键步骤以及他们已经内化成习惯的关键能力,Bybee(2000)用科学能力(scientific abilities)一词来描述这些能力.[2]研究表明,科学教育应使学生具备这样的科学能力以应对21世纪的工作环境.[3-6]
然而,无论是能力还是素养都具有内隐性,是内在的心理品质与特征,相比单纯的知识和技能不易被理解.为了了解中学生在真实情境的问题解决过程中的科学能力表现现状,以及探索如何测量和评价学生在接受相应探究活动后科学能力的发展情况,笔者在此前研究中设计并实施了基于开放性实验问题解决的探究活动:学生在所创设的真实的、无标准答案的问题情境中进行科学实践.学生依次经历观察型实验活动、验证型实验活动、应用型实验活动以及独立实验问题解决活动各两轮.活动过程中需通过实验手段获取证据,并依据证据结果不断改进以及调整探究路径,以完成问题解决.[7]
在上述研究的基础上,本文应用实证研究法,通过PAER科学能力评价量规对两轮各类实验活动中学生的实验报告进行评定;结合差异性检验和Rasch模型得到学生经过活动后的科学能力值的变化以及不同科学能力要素的难度水平分布.进而通过SPSS对各类实验活动中的科学能力要素进行相关性分析,从而确定能力要素间的相关性情况.最后基于上述结果,对如何培养和评价学生在实验问题解决中的科学能力提出建议.
目前针对开放性实验问题解决中的科学能力的测评工具有来自罗格斯大学物理与天文教育研究小组(PAER)所开发的科学能力评分量规.由于该量规是为其开放性实验室活动开发的,与本研究所涉及的探究活动的性质及目的一致,因此本研究采用该量规对学生在探究活动中的科学能力表现进行测评.该测评框架综合考虑了物理发展的历史、认知技能历程的分类与物理及物理教育学者的建议,提出了(A)能够以多重方式表征问题情境;(B)能够建立定性解释或定量关系解释现象;(C)能够修正定性解释或定量关系;(D)能够设计实验;(E)能够收集和分析数据;(F)能够评估模型、方程、解决方案或陈述;(G)能够交流7种解决实验问题时的关键科学能力维度,每种能力维度下面又拆分出了多个能力要素.[8]
同时为评估或帮助学生自我评估其现在所处的水平,其开发的科学能力评分量规以“0-缺失”“1-不足”“2-需要改进”“3-完备”4个水平来描述学生的工作,表1所列出的是“能够收集和分析数据”这个能力维度下的部分能力要素及其表现描述.
表1 PAER“收集和分析数据”科学能力的评分量规
本文基于探究活动中学生各科学能力要素的评分数据,利用SPSS软件对众多的科学能力要素进行了因子分析,得到的科学能力主因子与PAER科学能力维度进行对比如表2所示.
表2 本研究中科学能力主因子与PAER科学能力维度对比
续表
可以看到本研究得到的科学能力主因子与PAER科学能力维度基本一致.可见本研究采用的测评工具是科学且合理有效的.
本研究中,基于开放性实验问题解决的探究活动包含多种类型的实验室活动,如观察型实验活动、验证型实验活动、应用型实验活动等.学生在进行各类探究活动时,根据实验室任务单中的活动指南完成实验报告,而活动指南所设计的实验问题与要考查的学生的科学能力要素相对应.验证型实验活动实验室任务单样例.当一个强磁铁从非铁磁性金属管内下降时,它会受到一个阻滞力,Guillermo Donoso等学者曾对这个现象进行过一些研究.[9]阅读该研究后,你是否质疑该研究中提出的一些假设(包含理论模型的假设以及实验设计的假设),或者该研究推导出的一些理论关系引发了你想要验证的兴趣?请设计实验并验证你质疑或感兴趣的关系.活动指南及所对应的科学能力要素如表3的样例所示.
表3 活动指南及所对应的科学能力要素
因此本研究针对学生所完成的不同类型的探究活动的实验报告,基于上文所述的PAER科学能力评分量规对其进行评分,可以得到各类探究活动中学生在不同科学能力要素上的表现分数.打分者来自高校物理系的教授、副教授、硕士及博士研究生等,他们同时给出评分依据,独立打分后,会通过kappa系数来评判打分者的打分一致性程度,对于一致性较低的题目,打分者会重新商定分数,直到所有能力要素评分的kappa系数均在0.85以上.
表4所示为1组学生的实验报告及其对应评分,其实验报告是在应用型实验活动中完成的,实验问题是基于“超疏水表面”诱导莱顿弗罗斯特效应的实验研究.[10]表4中,“评语”为评分者根据学生的实验报告的内容及PAER科学能力评分量规,针对待考查的科学能力给出的评分依据.
表4 学生实验报告及其评分样例
通过SPSS软件对学生各科学能力要素的分数均值进行差异性检验,将不同类型实验活动中存在显著提升的科学能力要素增益统计如表5所示.可以看出不同类型的探究活动对学生科学能力的提升各有侧重.
表5 不同实验活动对科学能力各维度的增益
以应用型实验活动为例,由于在该类型活动中,学生通常是在已被验证的理论关系的基础上来解决新问题.待解决的新问题可能是解释新现象,也可能是设计制作及优化产品.学生在解决此类实验问题时,通常至少要使用两种方法并对它们的结果进行比较.因此在应用型实验活动中,学生在“问题表征”“寻找可利用的实验仪器及方法完成实验”“误差分析”“解释实验现象”等科学能力上有很大提升.
在各类型实验室活动中,学生会针对实验室任务单中活动指南中的实验问题撰写实验报告,评分者对其进行评定.本研究通过Winsteps软件得到关于实验问题的怀特图,以得到测试不同科学能力要素的实验问题的难度分布.下面以观察型、验证型和应用型实验活动为例进行具体分析.
(1)观察型实验活动.
通过Winsteps软件得到关于观察型实验问题的怀特图如图3所示.图3中左侧显示的是学生的能力分布(O为观察型实验问题的缩写,“E3”等符号为科学能力要素的标记),右侧显示的是观察型实验活动中各科学能力要素对应问题的难度分布.
将处于同一难度的能力要素所对应的实验问题进行平移后,得到测试不同科学能力要素的实验问题的难度分布.由图3可以看到,对于观察型实验活动来说,各科学能力要素所处难度水平大致可以分为3个梯度,如表6所示.
表6 观察型实验活动各科学能力要素所处难度水平
图3 观察型实验问题的怀特图
在观察型实验活动中,对于处于水平1的科学能力要素,由于观察型实验活动是针对指定的观察对象设计实验,基本通过观察与查阅资料可以建立合理的定性解释,因此大部分的学生可以完成得很好.对于处在第二难度梯度的科学能力要素来说,由于学生在建立解释时通常会忽视对假设的检验,在完成实验后也会忽视与理论解释及预测的一致性判断,也就是说学生对于实验问题的解决过程缺乏整体性的把握,活动具有片段性、割裂性.而对于学生最为困难的科学能力维度则反映出学生通常仅能对误差来源提出猜想,而对误差来源的影响方式以及针对其影响而采取有效的方法来减小误差并不会展开过多的研究.
(2)验证型实验活动.
对于验证型实验活动来说,根据怀特图可得各科学能力要素所处难度水平可以分为3个阶梯,如表7所示.
表7 验证型实验活动各科学能力要素所处难度水平
在验证型实验活动中,对于处于水平1的科学能力要素,大部分的学生可以完成得很好.这是因为学生在验证型实验活动中所设计的实验通常是基于已提出的理论预测,因此仅需要学生把握好实验中的自变量及因变量并加以测量即可.对于处在第二难度梯度的科学能力,与观察型实验活动的结果基本一致.而对于学生最为困难的科学能力要素,则是由于验证型实验活动的展开就是基于对已提出理论解释的定性及定量预测,因此“预测现象”是最为重要且困难的一个过程.
(3)应用型实验活动.
对于应用型实验活动来说,根据怀特图可得各科学能力要素所处难度水平可以分为3个阶梯,如表8所示.
表8 应用型实验活动各科学能力要素所处难度水平
在应用型实验活动中,对于处于水平1的科学能力要素,所应用的原理及解释是已经经过验证的,因此建立解释对学生来说较为容易.对于处在第二难度梯度的科学能力,可以看到在其他两类实验活动中对学生来说较为容易的设计实验的过程在应用型实验中对学生来讲难度升级.这是因为待解决的新问题可能是解释新现象,也可能是设计制作及优化产品,总之需要创造性地设计实验方案来解决问题,因此更加困难.而对于学生最为困难的科学能力要素,与前两类实验活动的结果一致.
由于活动评价设置的多个科学能力要素所获得的数据可能指向同一个潜属性,本研究进而利用SPSS软件对众多的科学能力要素进行了因子分析.以独立问题解决活动为例,因子分析的结果主要包括4个主成分,综合考虑这4个成分在各个科学能力要素上的体现,以及相关性检验的结果,可以将各成分的内涵归纳如表9所示.
表9 独立实验问题解决活动科学能力主成分的内涵
表9中,同一成分的科学能力要素的正相关性,意味着在独立实验问题解决活动中,对于同一成分中的某一要素的正向影响,也同样会给对应的其他科学能力要素带来正向影响.同时也表明,要想提高某一成分中的科学能力要素中的一个,可尝试从与之相关的另一个科学能力要素入手.例如,若学生在活动中经常忽视对于实验结果与理论解释的一致性判断,可以在进行实验前,让学生明确实验目的并尝试利用理论模型预测实验现象,从而意识到一致性判断的重要性,达到同时提升两个甚至多个科学能力要素的目的.
本文基于PAER科学能力评分量规的实验室活动评价方式,对中学生在实验问题解决过程中科学能力的表现现状,以及学生在接受相应探究活动后科学能力的发展情况进行了研究,得到的结论总结如下.
(1)基于在此前研究中所获得的学生科学能力评分数据,利用SPSS软件对众多的科学能力要素进行因子分析的结果表明,得到的科学能力主因子与PAER科学能力维度基本一致,验证了PAER科学能力评价量规作为开放性实验问题解决活动的测评工具的有效性.结果表明,笔者此前研究中所设计及实施的探究活动对发展学生科学能力是有效的,各类型探究活动对发展学生科学能力各有侧重.
(2)各类型探究活动中各科学能力要素难度分布不同.总体而言,在4类实验活动中,对于“A1表征问题”“E5记录数据”“G1描述研究过程”等科学能力要素,大部分的学生可以针对相应考查问题完成得很好;对于“F3检验假设的有效性”“F4理论与实验的一致性判断”等处在第二难度梯度的科学能力要素来说,由于学生在建立解释时通常会忽视对假设的检验,在完成实验后也会忽视与理论解释及预测的一致性判断,体现出学生对于实验问题的解决过程缺乏整体性的把握.而对于学生最为困难的科学能力维度,如“E2确定误差来源影响实验数据的方式”“E3采取方式减小误差或提供减小误差的方法”以及“C2基于实验结果与预测的不一致性来判断对于模型、方程或陈述的修正”等,则反映出学生通常仅能对误差来源提出猜想,而对误差来源的影响方式以及针对其影响而采取有效的方法来减小误差并不会展开过多的研究.
最后,针对科学能力评价时实验问题的选择与制定、评价的形式及内容,本文提出如下建议.
(1)科学能力评价的实验问题的选取要满足不同层次的学生,因而应覆盖不同难度梯度.实验问题选取来源应广泛,需尽量与学生日常生活现象联系密切,能够引起学生探究的兴趣以及思考讨论的问题,从而能使学生将学到的科学方法及内化的科学能力应用到生活实际中.
(2)在对学生解决实验问题时的科学能力进行评价时,要结合前人的研究以及学生的实际情况设计切实有效且操作强的评价标准.除此之外,对于实验问题的分数等级,可以利用Rasch模型进行检验,评分者也要客观评判,同时经过多位专家评议以达到一致性,从而对不合适的等级进行调整,直到确定合理的评价标准.