沈 晨,王超杰,梁 辰
(1.上海市教育考试院,上海 200433;2.江苏大学,江苏 镇江 212013;3.朗鹰教育科技,上海 200040)
数字化和信息化一直是教育教学改革的重要方向之一。随着社会进入大数据时代,越来越多的中、小学采用互联网智能教学管理平台作为日常课堂教学与管理的配套和补充。相较于传统“一对多”的课堂授课模式,互联网智能教学管理平台可以利用人工智能及专业评价技术在课堂内外和考前、考中、考后等多个阶段对学生的学习效果进行“一对一”的评测,并根据评测结果对学生进行针对式的反馈并辅以个性化训练。这一方面减轻了任课教师在课后进行人工评测的工作负担,使其能够将精力集中于课程内容的准备和课堂教学质量的提升;另一方面,通过大数据技术和信息化平台的综合分析,可以更加精准地评价不同教学班级之间学生学习效果和教师教学质量的差异性,有助于教育管理部门针对性地提出改进方案,从而实现“教、评、管”一体化的目标。因此,引入互联网智能教学管理平台既是目前中、小学教育的主流发展趋势,也是教学数字化和信息化改革的必经之路,也是教育数字化转型中的重要一环。本文将以上海市初中学业水平考试(外语听说测试)为例,介绍互联网智能教学管理平台在“减负增效”大背景下,推动教育改革和教学质量提升方面的积极作用和重要意义。
近十年来,互联网智能教学管理平台得到了快速的发展,其在教学评价中发挥的作用正逐渐被各级教育管理者所认可。江春(2019)[1]对高校教学管理工作中的创新发展需求进行了分析,探讨了信息化平台在相应管理中创造的价值,提出应用信息化平台来实施高校教学管理工作创新和改革;刘畅(2020)[2]也认为互联网智能教学管理平台有助于推动高等院校教学管理创新发展,增进我国高校教学转型的动力;杨鑫(2021)[3]探讨了基于大数据教学管理平台的功能和构成,分析了教学信息化建设的管理现状,并提出了相应的应对措施;居伟(2021)[4]以扬州工业职业技术学院为例,研究了网络教学管理平台在高职院校成人高等教育中的应用。在中学教育的应用中,朱笑利(2021)[5]研究了智能教学管理平台在高中实验教学中的应用,通过实验资产信息化管理模块和实验教学信息化管理模块两部分,更好地实现对实验设备资源的管理,以使其更好地服务于实验教学。
互联网智能教学管理平台可以从课堂教学、课后作业、备考巩固、考试检测、管理评价等多个环节对学生的学习效果进行训练、跟踪、反馈和评价。在考前模拟训练中,平台通过虚拟仿真的方式尽可能地模拟真实考试环境,使学生能够提前熟悉考试流程。这对于外语听说测试等使用机考方式进行的人机交互式考试来说尤为重要,避免考生因不熟悉机考界面、考试流程、答题交互等而紧张,无法在正式考试中发挥出真实水平。另外,根据学生在考前模拟训练中反馈的结果,平台基于长期积累的大数据题库可以对学生进行个性化的针对性训练,帮助学生进一步查漏补缺。在正式考试的过程中,互联网智能教学管理平台可以与教育考试院等当地教育主管部门进行合作,协助考试流程的标准化规范运行。例如,在考试过程中通过软硬件结合的方式对考生状态进行智能化实时监控,避免各种舞弊行为的出现。这既可以减少监考过程中的人力成本,同时增加了考试的公平、公正性。在考试结束后,互联网智能教学管理平台可以采用人工智能技术进行人工智能自主电子阅卷,同时对全部考生的测试结果进行快速高效地系统性分析,从而可以整体评价学生的学习效果,为当地教育主管部门接下来的教育改革措施提供决策依据。可以说,互联网智能教学管理平台的应用对于推动教育改革和教学质量提升具有十分重要的作用。
在互联网智能教学管理平台这一领域,国内已初具规模,已形成若干专业水平高、综合实力强的领军平台,例如上海朗鹰教育科技的“轻松英语”智慧教学管理平台。经过十余年的潜心发展和持续积淀,该平台已成为国内教育考试智能评测及教学智能管理应用领域的先行者和技术服务方,与北京、上海、深圳等省市级教育主管部门进行了深度合作,共同推动教育教学改革的发展。这一类平台的作用和意义在于可提供多种测评和教学管理服务,包括标准化考场建设、模考和训练系统建设等新基建领域,高利害考试、大型模拟考、日常区校考的考场环境检查,试卷制作,试卷AI智能批阅评价等技术支持服务领域,还包括智能课堂教学与互动、作业智能推荐、教学研究与质量监测评价等教育教学领域。
近年来,英语听说训练得到了学生和家长越来越多的重视。为了摆脱过去“哑巴”式英语教学的方式,让英语教学正确地回归语言交流应用的本质,全国各地教育主管部门在新一轮的教学改革中加大了英语听说测试在学生总评成绩中的比重。作为国际化大都市和全国教育改革试点地区,上海市积极响应国务院颁布的《关于深化考试招生制度改革的实施意见》和教育部颁布的《关于进一步推进高中阶段学校考试招生制度改革的指导意见》,在2018年3月出台了《进一步推进高中阶段学校考试招生制度改革实施意见》,并在2019年4月公布了《上海市初中学业水平考试实施办法》和《上海市初中学生综合素质评价实施办法》两个中考改革配套文件,进一步细化落实了中考改革方案。其中,一项最为重大的改革是在外语科目中增设听说测试,并采用人机对话的方式进行考核,具体包括朗读、交际应答、听后复述和话题表达四种题型,满分为10分,测试总时长为10分钟。2021年5月,上海市进行了首次初中学业水平外语听说测试,共计有8万多名学生参加。
对于本次考试的结果,上海朗鹰教育科技与上海市教育考试院共同对数据进行合作梳理与研究。我们从多个维度对其进行数据分析,并提出相应改进方案。数据来源为上海市教育考试院。具体来说,图1展示了本次考试学生在各个题型中的平均得分和标准差情况。可以明显看出,在四个题型模块中,随着对口语表达能力要求的提升,学生的平均得分率也在不断下降,同时刻画学生得分差异性的指标——标准差在不断提升,表明优秀学生和普通学生在得分率上的差距进一步拉大。通过统计学t检验,发现各个题型之间学生的得分情况并非是由随机误差造成的区别,而是存在着显著性的统计学差异性。这说明在今后的外语教学中,应当更加加强对学生口语表达能力以及英语思维能力的教学与训练。
图1 各题型平均得分和得分标准差
图2展示了各分数段考生人数分布情况,可以发现考生成绩呈现明显的偏态分布,大部分学生取得了8分以上的成绩,总体平均分为8.2分。作为改革试点后的第一次外语听说测试,考生展现了一定的适应性。这也为教育主管部门积累了数据和经验,对于未来考试的命题难度选择提供了较高的参考价值。
图2 各分数段人数分布
图3显示了本次考试考生的若干描述性统计情况,包括满分率、优良率、及格率。可以看到,满分率接近6%,这比某些区级一模二模的满分率要高。优良率是取得分率在80%(不含)到100%之间的考生人数,有超过七成的考生达到优良,说明大部分考生经过模拟训练后能表现出良好的听说能力。另外,将近九成考生达到及格线,这也符合学业水平考试的初衷。以上结果既体现了本次考试的选拔作用,又符合了初中毕业学业终结性评价的题中之意。
图3 满分率、优良率、及格率
表1和图4反映了各档位考生数的占比和分布情况。这里按照考生成绩划分为ABCDE五个档位。可以看出,A档考生占比最多,达到44.85%;E档考生超过十分之一,仍然有提升的空间。基于互联网智能教学平台,可通过翔实的数据分析结果有效观测学生使用情况,以客观、精准、智能的方式来进行考试后效观测,让考试起到精准的反拨教学效应(washback effect),而不是让任课老师凭感觉来做出教学决策。教师也可以以此来不断跟踪学生学情,分析比较历次考试结果,观测进步退步情况,用智能多元评价来不断优化教学。
表1 各档位考生数占比
图4 各档位考生数分布
表2显示了本次考试的全距、峰度、偏度。全距反映了最高分和最低分的差距。峰度和偏度是反映数据分布的参考值,峰度指数据分布平峰或尖峰的程度,正态分布其参考值是3,低于3为平峰,在这里可以理解为各分数段的人数较分散,大于3则为尖峰,在这里可理解为某一分数段的人数较集中。本次考试的峰度达到4.38,说明高分考生较多,这和A档考生达到44.85%比较吻合。偏度是反映不对称分布的偏态方向和程度的统计分析指标。当偏度值大于0,表示正偏,这里可理解为低于平均分的考生较多,偏度小于0,则为负偏,这里可理解为高于平均分的人较多。本次考试的偏度达到-2.14,为负偏,同样说明高于平均分的考生比较多。
表2 全距、峰度、偏度
表3反映了本次考试学生成绩的四分位情况,即按照考生成绩降序排列后,分别出现在25%、50%、75%位置的分值,即进行分值切分。该数据也可以和众数在一起看。本次考试分值的众数是9.5,说明得9.5分的考生人数最多。通过以上这些数据,可以从多维度有效观测考试数据,以评促教,以评促学,达到“教、学、管”一体化的目标。
表3 四分位分值
互联网智能教学管理平台的出现极大地推动了教学信息化和数字化改革的进程,特别是对于外语听说测试等机考类型的非标准化测试,其从考前训练、考中监控、考后评价等多个维度为考试提供了综合性解决方案,对于进一步提升教学质量和学生学习效果具有重要意义。通过教学管理平台,教育行政部门、学校管理者、教研员、一线教师等教育教学行政主体可以更精准、更客观、更智能地实施教学、评价和管理,避免凭感觉、拍脑袋进行教学决策和考试后效观测。在人工智能和大数据时代,要切实加强互联网智能教学管理平台的使用。这也符合“双减”政策精神和《义务教育课程标准(2022年版)》的题中之意。