基于人工智能的化学实验现象评价与反馈系统开发

2024-07-15 00:00:00高文蓓王新福凌一洲
化学教学 2024年6期

摘要: 基于人工智能技术开发了一款化学实验现象评价与反馈系统,设计理念兼顾部分和整体、性能和效率。主要开发流程包括评价标准制定、数据集构建、系统总体设计、核心算法开发、系统应用、系统评价与升级等步骤。以“酸碱滴定实验”为例介绍系统的使用方法,显示出系统具有评价及时化、结果精准化、反馈

个性化等优势,有助于提高实验教学的效果。

关键词: 人工智能; 实验现象评价与反馈系统; 评价与反馈; 软件开发; 酸碱滴定

文章编号: 1005-6629(2024)06-0063-05 中图分类号: G633.8 文献标识码: B

1 问题的提出

实验教学是化学课程的重要内容。传统的实验教学由一名教师指导全班学生进行分组实验,无法同时顾及每个学生小组的实验过程和结果,难以及时地对每个小组进行评价和指导,导致当堂评价缺失、“以评促教”的机制不够完善。作为补偿,教师大多通过对学生课后撰写的实验报告进行评价,但其真实性、可信度不足,而且学生失去了及时纠正错误、重做实验的学习机会[1]。

为此,许多文献和政策文件都提倡利用现代信息技术改进实验教学,促进“教-学-评”一体化。教育部《关于加强和改进中小学实验教学的意见》指出,要“促进传统实验教学与现代新兴科技的有机融合,提高实验教学的质量和效果”。近些年,人工智能技术的发展正加速教育变革。史加祥认为,基于人工智能可以全方位、全过程地采集学生的学习数据,了解学生建构科学知识、实施科学探究的表现,因此将导致科学课堂评价的变革[2]。吴俊明也指出“人工智能给化学教学论的革新和发展带来了新的机遇,要积极地做一点探索,做一点工作,而不是消极地等待”[3]。

现阶段,有关人工智能的教育应用研究大多停留在理论探讨,仅有少数实践研究案例。例如:谢晖等基于人工智能评价学生在虚拟仿真实验课程中的学习,其评价依据主要是虚拟仿真模块操作时长、使用次数、访问学习网站次数、实验后复习次数等特征指标[4]。孔维梁等利用人工智能建构可信同伴互评模型,促进学生之间的互评[5]。李海峰等探讨了生成式人工智能时代的学生作业设计与评价,倡导开展作业真实性算法评估[6]。这些基于人工智能改进教学的实践又大多是泛学科的,鲜有结合学科特征和特殊应用场景。

因此,本文针对化学学科的特点和实验教学的应用场景,利用人工智能技术,原创开发化学实验现象评价与反馈系统,以期提高实验教学的效果。同时,探讨开发此类系统的一般设计理念、思路和流程,为开发教育应用的技术人员提供参考。

2 系统的设计理念和思路

化学实验现象评价与反馈系统是指通过计算机程序对化学实验现象的数据采集和自动分析,对学生实验效果做出客观评分,并给予存在问题、原因分析、改进建议等反馈的学习辅助工具。本系统的设计理念兼顾部分和整体、性能和效率。

2.1 兼顾部分和整体

本系统的“评价”以实验的部分环节——实验现象为评价对象,但“反馈”是针对整个实验的反馈,不再局限于实验现象这一个环节。例如,对于“氢氧化钠滴定盐酸(以酚酞为指示剂)”实验,评价对象是“滴定终点溶液粉红色的深浅”的现象,然后可以据此对学生在整个滴定操作过程中可能存在的失误做出提示和反馈。

2.1.1 以实验现象为评价对象

化学实验现象是指实验者从化学科学实验中,可以通过感官直接感受到的事物,主要包括视觉现象(光)、听觉现象(声)、触觉现象(热)等。在中学阶段,常见的视觉现象有颜色变化、生成气体、生成沉淀、燃烧发光等;常见的听觉现象有发出尖锐的爆鸣声、轻微“噗”的一声、安静地燃烧等;常见的触觉现象有温度升高、温度降低等。

化学实验现象是实验中的关键环节,获得实验现象不仅是实验操作的主要目的,也是得出实验结论的基础和依据。同时,化学实验现象也反映出了大量的信息,经验丰富的实验者可以根据出现某种现象推测实验中存在的错误。因此,本系统以化学实验现象为评价对象,利用人工智能对现象中的典型特征做出智能分析。

2.1.2 以整个实验为指导范围

本系统的“反馈”是针对整个实验的指导反馈。首先,针对实验现象本身做出反馈,例如在“氢氧化钠滴定稀盐酸(以酚酞为指示剂)”实验中,如果学生正确地达到了浅粉色,则提示学生成功达到了滴定终点;如果学生做出了深粉色,则提示颜色过深;如果溶液仍为无色,则提示溶液未变粉色;其次,针对实验现象所反映出的错误操作或实验误差做出反馈。例如,如果滴定后锥形瓶内变成深粉色,则系统分析可能的错误原因:学生在达到滴定终点后继续滴加了氢氧化钠;如果滴定后溶液仍为无色,则系统分析可能的错误原因:学生滴加的氢氧化钠不够,还未到达滴定终点;最后,系统自动提出改进意见。溶液为深粉色时,建议重做实验,谨慎操作;溶液为无色时,建议在原实验装置的基础上继续滴加氢氧化钠,直到溶液变为浅粉色。

2.2 兼顾性能和效率

2.2.1 利用人工智能实现高性能

本系统需要具有替代或辅助教师评价的智能功能,例如评价“酸碱滴定是否达到滴定终点”“银镜反应生成的银镀层是否美观”“氢气燃烧是否发出爆鸣声”等,对准确度等性能的要求较高。人工智能(Artificial Intelligence)是指构造具有一定智能的人工系统,让计算机完成以往需要人的智力才能胜任的工作。本系统采用人工智能模拟教师“评价实验效果”和“反馈实验学习”的智能行为。具体的实现方法如表1所示。

2.2.2 利用分布式计算实现高效率

利用人工智能虽然能带来优异的性能,但需要消耗大量的算力,如果放在应用端进行计算,容易造成系统卡顿、硬件发热、运算速度慢等问题。因此,本系统采用分布式计算的方法,实现性能和效率的兼顾。

如图1所示,本系统分为总处理器的一个总节点和应用端的多个子节点。总节点使用大量学生实际操作的实验现象进行深度学习,得到训练好的评价模型。子节点直接使用总节点提供的模型进行快速的特征识别和检测,同时把新的数据传输给总节点进行加强训练,改进总节点的模型。通过这样的设计,一方面用高性能的总节点处理器确保评价模型的准确性,另一方面减少子节点的运算压力,实现学生端的快速、实时评价。

3 系统的开发流程

3.1 前期素材准备

首先,制定评价指标。评价指标要反映实验现象中易于被观察、采集和识别的典型特征。例如,“氢氧化钠滴定盐酸(以酚酞为指示剂)”实验以滴定后锥形瓶内溶液的颜色为评价指标,程序可以识别溶液在一定区域内的平均RGB值,然后根据RGB中R值的比重进行0~10赋分。又如,在评价银镜反应生成的银镜是否美观时,以相同光源环境中银镜的反射光强度、黑斑数量、泛白区域面积等作为评价指标,通过人工智能识别瑕疵点。

其次,制定评分标准。对于只有一个评价指标的实验,该指标的得分即为最终得分。对于有p个评价指标X1、 X2、 …Xp的实验,分别赋予各自的权重系数β1、 β2、 …βp,按照计算公式:F=β1X1+β2X2+…+βpXp得到最终的加权得分F。此外,亦可以直接制定定性的赋分标准,例如氢气的制备实验中,可以对检验氢气时发出轻微的“噗”的一声(成功制备了纯净的氢气)赋10分,发出尖锐的爆鸣声(成功制备了氢气但不纯)赋6分,没有发出声音(没有制备出氢气或浓度很低)赋0分。

然后,构建数据集。化学实验现象数据集是用于训练人工智能评价模型的原材料,数据集样本量越大,评价模型的准确度越高。数据集应囊括大量通过实际实验获得的现象数据,可由学生完成实验后,拍摄照片或视频上传。经过数据清洗、数据标注后,才能构建成为数据集。值得一提的是,系统在使用过程中也会收集到大量的实际实验数据,进一步丰富数据集。

3.2 核心功能开发与后期完善升级

涉及软件的核心功能开发和后期完善升级的流程图见图2,主要分为“系统总体设计”“核心算法开发”“系统应用”和“系统评价与升级”四大步骤。

第一步,系统总体设计。制定系统的总体“大框架”,根据评价指标和标准明确设计需求,分配总节点和子节点模块的任务,设计用户界面和交互功能。

第二步,核心算法开发。在总节点建构初始的评价模型,用前期准备好的化学实验现象数据集对初始模型进行深度学习,得到训练好的评价模型。把评价模型导入到子节点中,子节点可以用该模型对实验现象图像或声音中的典型特征作快速的识别分析和评价。同时,子节点的数据会传输回总节点,用于总节点人工智能模型的强化学习,使评价准确度进一步提升。

第三步,系统应用。把初步开发完成的系统应用于化学实验课堂,学生用安装了系统软件的手机或平板电脑拍摄实验图像或视频,由系统自动评分并及时反馈。学生可以根据提示发现实验中的错误,当堂改进实验,重新提交,并获得新的得分。

第四步,系统评价与升级。基于技术接受模型编制问卷,了解学生的感知易用性、感知有用性、对系统的态度、行为意向等信息,针对系统存在的突出问题予以改进。在正式投入使用后也采用类似的方法升级系统。

4 系统的使用案例

笔者在江苏省某重点中学的“酸碱滴定”实验课上使用了本系统。20名学生分为5组进行实验,每组配备一套滴定仪器和一部手机,手机上预先安装了软件系统,并选择本节课的“氢氧化钠滴定稀盐酸(酚酞为指示剂)”实验。

上课时,首先由教师讲解并演示滴定实验的操作要点,然后学生分组完成实验。在学生自认为到达滴定终点后,用系统内的拍摄功能拍摄锥形瓶照片。系统利用人工智能自动识别锥形瓶瓶底的溶液区域,自动排除因锥形瓶玻璃反光带来的光线干扰。

随后,系统利用人工智能自动评分,立刻给出0~10之间的得分(详见表2)。针对粉色过深、未出现粉色的错误情况,给出错误原因的分析和改进建议。学生可以选择直接上传结果,也可以根据反馈意见改进或重做实验后,重新提交新的实验结果,得到新的得分。

5 系统的教学价值

5.1 及时化的评价:提高课堂效率

传统的化学实验课上,一名教师一次只能对一个学生小组的实验结果做出评价和指导,其他学生小组往往需要等待较长时间,造成课堂时间的浪费。本系统可以实时地对学生实验现象给出评价,让学生立刻认识到存在的错误,马上重做或完善实验,实现“以评促学”。同时,教师不必到每个实验桌前依次统计,就可以立刻得到全班实验数据,包括实验完成率、得分率、存在的主要问题等,当堂加强对薄弱点的补偿教学,实现“以评促教”。

5.2 精准化的结果:化抽象为直观

常规的实验现象评价由教师通过肉眼观察实验结果并做出主观判断,精准度不高且表述比较抽象。例如在滴定实验中,教师可能会告知学生“滴定完的溶液颜色太深了,应该要淡一点”,但学生不知道“淡一点”是要淡到何种程度。本系统一方面采用人工智能进行客观评分,可以给出更加精准的定量结果,其公平性、可信度更高;另一方面采用由浅到深的溶液颜色梯度(比色卡)与0~10分相对应,帮助学生更准确、直观地感知滴定终点的正确颜色。

5.3 个性化的反馈:尊重学生差异

本系统的应用改变了传统课堂上教师统一讲解的教学方式。一是实现指导内容的个性化,系统根据学生差异化的实验结果,给予有针对性的反馈:指导不及格(低于6分)的学生重做实验,鼓励得分良好(6~8分)的学生继续改进,给高分(9~10分)的学生增加思考题。二是实现进度安排的个性化,较早完成实验的学生可以提前检查错误、改进或重做实验,而不必等待其他同学把实验做完后再由教师集体讲解。

总之,本研究通过开发一款化学实验现象评价与反馈系统,做出了信息技术与化学教学融合的尝试[7]。未来的研究者可以利用本系统所具备的优势,做出更多智慧实验教学设计,实现化学学习方式的深刻变革。也可以借鉴本研究提出的设计理念、设计思路和开发流程,开发更多实验智能评价与反馈的软件。

参考文献:

[1]王丽丽, 丁邦平, 王萍. 中小学科学实验教学的演变与改革: 国际经验及其启示[J]. 课程·教材·教法, 2022, 42(11): 153~159.

[2]史加祥. 人工智能时代背景下小学科学教育的变革与坚守[J]. 课程·教材·教法, 2020, 40(4): 120~125.

[3]吴俊明. 刍议人工智能化学教学研发的教学论基础[J]. 化学教学, 2017, (11): 3~10.

[4]谢晖, 詹勇华, 曾琦等. 基于人工智能技术的生命科学类虚拟仿真实验课程学习评价研究[J]. 高校生物学教学研究(电子版), 2021, 11(1): 35~41.

[5]孔维梁, 于晓利, 韩淑云等. 人工智能赋能的可信同伴互评模型构建与验证[J]. 现代远程教育研究, 2023, 35(3): 93~101, 112.

[6]李海峰, 王炜. 生成式人工智能时代的学生作业设计与评价[J]. 开放教育研究, 2023, 29(3): 31~39.

[7]项佳敏, 钱华, 马宏佳等. 信息技术与化学学科教学深度融合的案例研究——以数字化实验为例[J]. 化学教学, 2020, (9): 21~27.

江苏省中小学教学研究重点课题“基于人工智能的科学实验现象评价与反馈系统开发应用研究”(编号:2023JY15-ZA47)的研究成果。

通讯联系人,E-mail:jsjylyz@foxmail.com。