深度学习视角下小学生科学思维测评工具开发与核验

2023-05-30 08:49王定梅陈名瑞
物理教学探讨 2023年5期
关键词:科学思维小学科学深度学习

王定梅 陈名瑞

摘   要:科学思维是义务教育科学学科核心素养之一,关注科学思维的评价对促进小学生科学思维的发展具有重要意义。基于知识深度(Depth of  Knowledge)理论模型构建了深度学习视角下的科学思维测评框架,并以“电磁铁”为背景编制测评工具。经过样本施测和项目反应理论Rasch模型的核验,证明测评工具符合模型预期,能够区分不同科学思维能力水平的学生。

关键词:深度学习;小学科学;科学思维;测评工具

中图分类号:G633.7 文献标识码:A     文章编号:1003-6148(2023)5-0030-5

作为义务教育阶段科学学科核心素养之一,学生科学思维的发展对于全面落实科学学科核心素养具有重要意义。为了解学生科学思维发展情况,为教学改进提出针对性意见,有效评价学生科学思维的价值不言而喻。国内外大量学生科学思维评价研究中,针对中学生和大学生的评价研究居多,而对有效测评小学生科学思维能力的研究较少。大量研究指出,科学思维前身在婴儿时期就已出现[1],而科学思维能力的显著提高大致发生在小学阶段前后[2]。因此,更有必要抓住学生科学思维发展的关键时期。如何挖掘小学阶段学生科学思维发展的聚焦点?如何进行科学有效的科学思维测评?均是亟待解决的重要问题。在深度学习视角下,以知识深度(Depth of Knowledge)模型为理论基础,构建小学生科学思维能力评价模型,并据此开发小学生科学思维测评工具,然后用Rasch模型核验测评工具的科学性和有效性,以期为科学测评小学生的科学思维能力提供方法借鉴,助力小学生科学核心素养的有效发展。

1    理论依据

1.1    深度学习视角下的科学思维

《义务教育科学课程标准(2022年版)》指出,科学思维是从科学的视角对客观事物的本质属性、内在规律及相互关系的认识方式,主要包括模型建构、推理论证、创新思维等[3],且科学思维由低段至高段呈发展性特征。胡卫平指出,学生的科学思维能力是一个相互影响、共同发展的有机整体,它由内容、方法和品质三个方面构成,如图1所示[4],可见学生的科学思维能力与科学知识(即模型中的内容)有着密不可分的重要联系。而科学思维作为一种发展性的核心素养,欲有力推动其发展,必然离不开深度学习的探讨。

教育领域的深度学习是建立在已有学习理论基础上的关于学生认知思维发展的理论。黎加厚认为,深度学习是指在已有知识基础上,学习新知识的过程,是学习者通过批判的眼光和独特的视角,利用知识解决问题的过程[5]。何克抗认为,深度学习是通过相关理念,利用相应的方式、工具、资源等记忆、理解知识,并达到应用、分析、评价及创新能力的培养目标[6]。国内外大量学者就深度学习的定义提出了不同观点和看法,分析已有研究,对深度学习的理解主要从过程和结果两个角度出发。从过程角度出发的深度學习强调在旧知识的基础上对新知识的加工过程,注重知识的衔接与整合,这一过程涉及学生学习动机、学习情境等问题。从结果角度出发的深度学习是基于个人能力而言的,即要求个人对知识的深层次加工以达到对知识的深度理解,聚焦高阶思维、高级认知能力的发展。

本研究中,深度学习视角下的科学思维能力主要从结果角度出发,关注学生对科学知识的深度加工,聚焦推理论证等高阶思维能力。

1.2    深度学习视角下的科学思维能力评价

近年来,随着对学生思维发展的关注不断提升,大量深度学习视角下的能力评价研究应运而生。鉴于科学思维与科学知识间的紧密联系,本研究选取韦伯(Webb)(2013)提出的知识深度(Depth of Knowledge,简称 DOK)作为深度学习视角下科学思维能力评价的理论基础以制订能力测评工具。DOK模型表征的是学生应该理解的知识深度,该模型假设知识加工程度可以根据所达到的认知要求进行分类,通过完成不同的任务反映认知期望或知识理解的不同深度水平。DOK模型分为 4 个层次,依次为 DOK1:回忆/复述(简单识记);DOK2:技能/概念(知识的直接应用或简单推理);DOK3:战略思维(知识的复杂应用);DOK4:扩展思维[7]。当顺利完成DOK3和DOK4层次任务时,则被认为达到了知识的深度理解。基于小学生认知发展特征,本研究主要依据前3个层次设计测评工具。因此,深度学习视角下的科学思维能力评价模型(图2)可从“思维能力”“科学知识”“科学情境”三方面进行建构。其中,科学情境是指编制科学测评工具各项目的背景信息,而非对情境本身进行考查。首先,鉴于问题解决过程中情境对思维过程存在一定的影响[8],因此,该方面旨在考查学生在不同情境下解决问题的能力。其次,相关情境也渗透着对科学知识的考查,即在情境当中如何利用已有知识解决实际问题。再者,丰富的科学知识也能够作用于思维能力,使得思维能力得到提升。综合以上原因,形成“思维能力”“科学知识”“科学情境”三位一体的科学思维能力评价模型。

2    测评工具的开发

为保证测评工具的信度和效度,开发测评工具需严格遵循科学的测评工具开发流程,主要涉及测评框架建构、测评工具编制、测评工具施测、模型检验、工具修订等重要环节。

2.1    测评框架的建构

本研究选取的知识内容——“电磁铁”主要呈现于教科版科学(2017版)六年级上册“能量”单元,包含“电磁铁定义”“电磁铁通电具有磁性和南北极”“电磁铁的南北极变化与电池正负极的连接方式或改变线圈绕线方向有关”“电磁铁的磁力大小与线圈匝数、电流大小等因素有关”四部分内容。基于深度学习视角的科学思维能力结构,形成基于“电磁铁”的科学思维测评框架(表1)。

2.2    测评工具的编制

形成测评工具还需要编制与测评框架相匹配的测评题项。每个题项所属的水平层次要求清晰明确,且同一水平层次还应设有若干题项。例如,首先设计趣味故事情境,然后设问如“小夏直呼太精彩了,想起以前在书上看到的一种装备‘电磁发射器。1901年,挪威人伯克兰造出世界上第一台电磁发射器,首开电磁炮先河。为了认识电磁炮的一些特性,小夏拉着你们赶紧制作了一个电磁炮模型,其原理如图所示。线圈通电后,会产生磁性,在磁力作用下,吸引铁制撞针迅速前移,推动炮弹射出炮管。小夏在电磁炮模型的右端放了一个小磁针,小磁针旋转如上图所示,则电磁炮模型右端是……(改编自2022年春浙江湖州六年级统考期末检测)”(图略),改编题项均来源于各省市期末检测或学业质量检测,本身就具有一定的信度和效度。共编制10个题项,分布于不同水平层次中,试测项目与框架指标的对应情况如表2所示。测评工具初步编制完成后,经过课题组的多次交流讨论和修改删减,确保其内容效度和表面效度,再利用Rasch模型进行工具质量实证核验,最终形成质量合格的测评工具。

2.3    测评工具的核验

為了确保测评工具的质量,使用纸笔测验收集数据,然后利用Winsteps4.3.2软件基于Rasch测量模型对测试数据进行分析,并根据分析结果来决定是否需要对题项进行进一步的修正。此次检测对象为C市某城区小学六年级8个班434名学生,发放测试卷434份,回收434份,回收率为100%。

2.3.1    总体质量分析

分析测试结果,题项信度为0.99(大于0.7),符合诊断性测试的信度要求,说明编制的测评工具题项可信度较高。其中,Infit和Outfit反映了包括MNSQ和ZSTD在内的测试数据与模型的拟合程度。对于本次施测的被试和题项而言,它们的MNSQ趋近于1,ZSTD趋近于0,表明该工具的测试数值可以与Rasch理论的理想模型进行很好的匹配。题项分离度(Separation)较大,为9.08,表明在不同水平层次中,各项目分布较广泛,而被试的分离度为0.92(偏低),说明该工具对学生的区分度不是很好。题项的可信度为0.99(接近于1),但被测试测量的可信度为0.46(偏低),如表3所示。整体而言,基于Rasch模型的分析发现,工具总体质量表现良好。只是被试的分离程度略有不足,分析原因可能在于被试学校为城区较好的小学,被试能力水平较高,可进一步对其进行深入测试和分析。

2.3.2    单维性分析

科学的测评工具要求符合单维性,单维性即假定工具中的每一项都是为了衡量一种能力,本研究则指小学生在深度学习视角下的科学思维能力。Rasch模型进行单维性分析得到标准化的残差对比图(图3),测评工具的几个题项中有6个落在相关系数-0.4~0.4的范围内,有4个在这一范围外,但局部独立性的标准是项目的负荷值不超过0.7,所以绝大多数题项的标准残差系数都达到了要求。总体来说,该测评工具具有单维性,主要测量的是一种能力。

2.3.3    题项-被试对应

Rasch模型首先将原始的分数转换为Logits分数,由此可以将被试的能力和题项的难度置于同一把尺子上(即Logit interval scale),从而形成题项-被试对应怀特图。如图4所示,10个测试题项的难度值分布比较均匀,范围也比较广,在预设的各水平层次中基本都分布了相应难度的题项。被试的能力水平也基本符合正态分布,呈现出中间多两边少的态势。可见,评价工具基本上涵盖被试样本的能力水平,但也存在少部分高能力水平的学生未能和难度值适合的题项相对应,说明被试的能力水平较高,和预测的原因相吻合。总体而言,该测评工具基本能评价出小学生科学思维所处的能力水平。

2.3.4    项目拟合分析

Rasch模型要求测试数据与其模型假设能够拟合匹配,对Infit和Outfit及其包含的MNSQ与ZSTD参数进行分析。先查看较为重要的Outfit,再查看Infit;查看ZSTD是否超出[-2,2]范围,若超出范围表示拟合度不佳,再查看MNSQ是否处于[0.5,1.5]范围内。分析图5可知,ZSTD和MNSQ均在可接受范围内,且工具所包含的所有题项的点—测量相关系数均在(0,1)之间,表示题项的建构效度可以接受。

通过以上分析可知,本研究制订的测评工具总体来说是符合单维性的,满足Rasch模型的基本要求,表明只对一种能力进行了测评,其各题项分布于不同水平层次,各水平的题项分布也比较集中。虽然题项难度没能完全覆盖少部分能力水平较高的学生,但总体而言,每个题项所预设的水平层次与实际难度水平是相匹配的。该测评工具包含10个题项,满分10分(通过二分法赋分),每个水平层次有多个题项相匹配。因此,可以根据各层次所包含的题项难度值的均值为界限,在不同的能力层次上划分出各层次的临界值,以此来判断学生所处的科学思维水平。

3    结  语

基于DOK理论模型,以小学科学六年级“电磁铁”为科学知识内容,开发了基于深度学习的小学科学思维测评工具,并利用Rasch 模型理论进行了工具检验,经过施测检验证明,本研究开发的小学科学思维测评工具能够对不同科学思维程度的学生进行有效区分,测评工具的质量较高,是一套符合科学编制要求的高信效度测评工具。该测评工具的开发和核验为科学制订科学思维测评工具提供了方法参考,并具备多种优势。在评价层面,该方法更具目的性和科学性,能帮助教师在日常教学过程中制订评价工具时避免盲目,依据评价目标科学地优化日常的学习评价方式;在教学层面,该方法更具针对性和深入性,深度学习视角下的科学思维测评有助于教师精确了解学生的思维水平,关注学生内在对知识进行加工的情况,可更具针对性地改进教学策略,以帮助学生思维发展。

参考文献:

[1]Gopnik A,Glymour C, Sobel D, et al. A Theory of Causal Learning in Children: Causal Maps and Bayes Nets[J]. Psychological Review, 2004,111(1):3-32.

[2]Koerber S,Mayer D,Osterhaus C, et al. The Development of Scientific Thinking in Elementary School:A Comprehensive Inventory[J]. Child Development,2015,86(1):327-336.

[3]中华人民共和国教育部.义务教育科学课程标准(2022年版)[S]. 北京:人民教育出版社,2022.

[4]胡卫平,罗来辉.论中学生科学思维能力的结构[J].学科教育,2001,14(2):27-31.

[5]何玲,黎加厚. 促进学生深度学习[J]. 现代教学,2005(5):29-30.

[6]何克抗.深度学习:网络时代学习方式的变革[J].教育研究,2018,39(5):111-115.

[7]Norman Webb and Sara Christopherson. DOK: Categories of Cognitive Engagement for Science. Webbalign[EB/OL].2019. https://www.webbalign.org/dok-definitions-for-science.

[8]胡咏梅,杨素红,卢珂.青少年科学素养测评工具研发及质量分析[J].教育学术月刊,2012,29(3):16-21.

(栏目编辑    邓   磊)

猜你喜欢
科学思维小学科学深度学习
用面向科学思维的教学方法改进计算机图形学课程教学
重视科学实验课教学发展学生科学思维探析
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
加强小学科学实验教学提升学生动手实践能力
谈谈多媒体在小学科学教学中的应用
简谈多媒体在小学科学教学中的运用
关于高中三年级的第二轮复习的思考
深度学习算法应用于岩石图像处理的可行性研究
锐意进取,不断提升小学科学课堂教学效率