数字化转型中的区域“智慧评价”

2023-12-02 22:36邹良魏宁
中国信息技术教育 2023年20期
关键词:智慧区域评价

教育评价事关教育改革与发展的方向,是教育发展的“指挥棒”。当大数据、人工智能牵手教育评价,教育评价将迈入“智慧评价”的新阶段。

近年来,区域智慧教育建设的兴起,也极大地促进了区域“智慧评价”的发展。以评价为驱动,可以充分发挥人工智能、大数据等新技术的作用,通过“以评促建”,用数据说话,用数据决策,打造区域智慧教育的全新生态。

在一个区域内开展智慧评价,因其样本量的优势,可以较为全面、充分地挖掘数据背后的深层含义,同时,用数据“反哺”学校、教师、学生,以评价引领发展,让智慧评价的效力得以充分发挥。

区域层面的智慧评价可以全面赋能学校教育改革。以多年连续的区域教育大数据为依托,使区域内各学校形成完整的数据链条,学校整体的发展数据将涵盖教育、教学、课程、德育、管理、培训等各个领域,有助于各学校展开横向、纵向的全面比较与分析,客观认识自己,找准发展方向。

区域层面的智慧评价可以有力促进学生全面发展。智慧评价不再仅仅聚焦学生的学业成绩,而是将视角拓展到德智体美劳各个方面,通过完善的评价指标的确立,引导智慧评价关注学生的五育并举、全面发展,在此基础上针对每个学生的个性化数据能够准确描绘出学生成长的“数字画像”,助力形成对应的“一生一策”发展路径。

区域层面的智慧评价还可以有效完善区域教育治理。通过区域大数据的汇聚、分析、统筹,让教育数据成为区域教育决策形成过程中的有力依据,进而推动区域教育管理部门的治理能力现代化进程。同时,智慧评价应用于具体的热点领域,可以进一步探索和挖掘诸如双减、考试、教育公平与均衡等问题背后的深层次因素,对于完善区域教育治理及总结教育治理经验、规律具有重要意义。

当前,越来越多的地区开始尝试以智慧评价为引领,以评价数据为底座,全面打造区域教育的智慧环境与生态,实现区域、学校、教师、学生的全方位发展,教育、教学、管理的整体化提升。在区域智慧评价实践方面,湖南省长沙市历经十年的探索,相关成果荣获2022年基础教育国家级教学成果奖一等奖。本期对话,我们邀请北京市东城区教育科学研究院研修员魏宁与长沙市教育科学研究院教育质量监测与评估中心邹良主任对话,一起探讨有关区域智慧评价的话题。

区域智慧评价如何实施:经验与做法

魏宁:当今的教育评价不论在理论上还是实践上都有了长足的发展,也呈现出了丰富的样态。从评价实施主体看,既有教师在课堂上针对学生表现进行的个体评价,也有以学校为单位对本校教师、学生开展的群体评价,更有从国家到地区由教育评价专业部门主导的教育质量综合评价。而后者对于引导一个地区的学校树立科学的教育质量观,转变不健康的教育倾向,从而营造良好的育人环境,推动区域教育高质量发展具有不可替代的作用。

从另一个角度看,如果把针对学生个体、学校群体的评价和区域总体评价对比来看,显然,区域教育质量综合评价因其样本数量大、具有连续性等特征,尤其能够发挥出大数据、人工智能等新技术的作用,形成某个地区的教育大数据,让评价结论更有说服力、指导实践更具效力。既能为区域内的教育决策科学化提供数据支撑,又能为每所学校、教师、学生的发展提供建设性依据,从而形成真正意义上的区域智慧评价。

邹良:是的,长沙市尝试的区域智慧评价,其目标就是着力构建学生进步、教师成长和学校发展的综合评价体系,积极探索“从入口看出口,从起点看变化”的增值评价方式,努力打造以现代信息技术为支撑的智慧评价平台,为学生成长、教师成长、学校发展数据画像,切实运用基于大数据科学分析评估形成的诊断评价结果。

通过十年的摸索、改进,对于大数据、人工智能等新技术支撑下的区域教育质量评价,也就是人们常说的区域智慧评价,我们在实践中积累了一定的经验,探索了一条实施路径,同时对智慧评价也有了更深入的理解。

魏宁:在区域教育质量综合评价的实践中,要想发挥出技术的重要支撑作用,做好智慧评价,您觉得有哪些重要的、有效的做法?

邹良:区域教育质量综合评价的开展是一个系统工程,根据我们多年来的实践经验,在区域教育质量综合评价的实践中,要想让智慧评价很好地落地,以下七个方面是成功的关键。

以评价为驱动,可以充分发挥人工智能、大数据等新技术的作用,通过“以评促建”,用数据说话、用数据决策,打造区域智慧教育的全新生态。

第一,在具体实践过程中,我们依据《义务教育质量评价指南》《普通高中学校办学质量评价指南》《义务教育课程标准》,结合长沙市实际情况,构建了学生成长、教师成长和学校发展三大维度,包含12项一级指标、37项二级指标、106项三级指标的“结构化”综合评价指标体系。每年基于一级、二级指标不变,三级指标微调的原则,根据当年教育改革需要,聚焦教育领域热点难点,结合教育发展现状设立评价专题。例如,2016年新增家庭教育方式状况专题,2017年新增学生参与课外培训专题,2018年新增学生学习策略、阅读状况专题,2019年新增学生视力、智慧教育推进状况、劳动教育专题,2020年新增学生心理健康、师生信息素养、作业设计专题,2021年新增“双减”、体育素养、家庭教育、心理健康专题,2022年新增智慧体育专题、将增值评价由过去聚焦学业质量增值延展至体质健康增值评价,2023年将聚焦教师评价素养、校长“数智力”专题。通过逐年动态调整的方式,构建起了长沙市立体多元、与时俱进、德智体美劳全覆盖的中小学教育质量综合评价体系。

第二,研制可靠有效的测评工具。我们组建了由高校专家、名校长、骨干教师组成的命题专家库,运用PISA技术自主研制初一入学分班考试、中考、学考试题,并自主研制了初、高中教育质量综合评价测评问卷(包括学生卷、教师卷、家长卷),测评问卷逐年修订完善,年更新率达50%以上。同时,开展了试测检验、筛选及测评工具信度、效度分析。在操作流程上,我们每年都会在专家组命制好测评问卷后,选取有代表性的学校进行监测预试,预试结束后进行信效度分析,形成信效度分析报告,完善问题情境和答案选项,确保问题真实可靠,确保开发的问卷信度、效度达到测量学要求,能够真正考查学生的核心素养和关键能力。

第三,研发数据互联的评价系统。长沙市教科院教育质量综合评价团队依托长沙智慧教育云平台,建设区域大数据决策指挥中心和智慧教育云应用中心,建立多维度、全方位的教育评价数据库,构建起用实证数据进行有效验证和系统挖掘的评价模式。例如,教育质量综合评价测评数据、学生综合素质评价数据、学生体质健康现场监测数据、教育督导调研数据、国家义务教育质量监测数据……通过网络学习空间,将综合素质评价、综合实践活动、教育质量综合评价、体质健康管理、中小学在线学习中心、在线问卷调查等系统融合起来,实行统一用户、统一认证、统一应用、统一权限,以方便区域内学校、教师使用。从而实现市级平台单点登录及教育、教学、管理、评价、服务各类数据的互联互通,打破数据孤岛,实现教育质量综合评价的过程化、信息化和常态化,这对于师生在线全样本测评的可持续性是非常关键的。

第四,建构智能分析的评价模型。按照增值评价理念来建构增值评价模型,通过人工智能和大数据技术的运用,建构K均值聚类法、多层线性模型,综合分析学生进步、教师成长、学校管理及其影响因素,诊断问题、分析原因、指导改进,并按照预先定义好的报告模板系统生成评价报告,实现全流程智能化实施。

第五,开发直观可视的评价地图。在长沙市教育质量综合评价的实践过程中,我们开发了“评价数据地图”,分市、区县(市)两级多方面呈现教育质量综合评价指标的测评结果及综合分析结论,通过图表、文字、动画等多种形式更直观地显示不同区县、不同指标发展的状况及差异,实现了对全市教育质量综合评价数据的在线监控,发挥了教育评价服务教育决策的价值,为学校改进教育教学、为政府教育决策提供了科学、动态的依据。

第六,定期发布精准诊断的评价报告。我们在每年的七八月份,会向社会定期发布评价报告,包括专题报告、区县报告、学校报告和发布版报告。市级报告呈现全市教育质量整体状况;区县报告呈现区县教育质量总体状况,为区教育局、教研室优化教育教学提供决策发布和改进建议;校级报告为学校提供指标发展的微观数据,深挖学校发展优势与短板,为学校找差距、补短板;发布版报告以简明易懂的方式向社会发布评价结果,以实证数据实现了对教育经验的有效验证和挖掘拓展,力求实现报告生成自动化、结果可视化、数据呈现一体化,以充分、直观地揭示长沙教育经验背后的内在规律。

第七,优化教育生态的结果应用。为提高评价报告的使用效力,我们每年会面向各级教研部门、学校、教师分层解读报告,为区县、学校精准把脉,明优势、找差距、补短板、强弱项,形成评价数据驱动教育教学改进、教育决策优化的良性循环圈,以教育质量评价大数据的科学应用助推教育公平发展和质量提升。同时,我们还发布全市“学业增值+能力素质”排名靠前的学校,切实解决因教育起点不同带来的评价不公的难题,激发不同生源、不同类型学校的办学积极性。此外,注重评价对健康的社会舆论的引领,让好学校的定义在老百姓心中发生了变化,让家长逐渐意识到基于孩子的基础、兴趣等选择合适的教育才是最好的教育。最终扭转单纯以学生学业考试成绩和学校升学率评价教育质量的不良倾向,在全市营造出良好的教育发展生态。

除此以外,我们认为,立足本土,打造一支由教育行政人员、科研院所教研人员、校长及一线骨干教师组成的专兼结合的高质量、多层次工作团队,是区域智慧评价有效开展的基础性条件,对于将要开展相关实践的地区是必须未雨绸缪的。

区域教育质量综合评价因其样本数量大、具有连续性等特征,尤其能够发挥出大数据、人工智能等新技术的作用,形成某个地区的教育大数据,让评价结论更有说服力、指导实践更具效力。

魏宁:刚才您提到区域教育评价实践中的七个做法,具有非常强的可操作性,相信对于做好智慧评价有着很好的借鉴作用。其中,您提到了创新性的“评价数据地图”,它能以怎样的方式呈现评价数据呢?

邹良:“评价数据地图”是我们在区域智慧评价中的一项创新性探索,过去几年中已经从1.0版到3.0版,进行了迭代升级。借助评价数据地图,可以突破传统纸质评价报告的信息边界,采用直观图表、动画等形式,动态、可视化地呈现区域内普通中学综合评价情况、典型学校情况,清晰展现出学生成长及学校发展轨迹、闪光点和努力方向,信息量大,可视性强。最新的3.0版“评价数据地图”新增了交互应用功能,动态聚焦学校发展,多维场景展示评价结果,实用性高,实现了线上线下同步监控、分析全市教育质量发展状况,助推了区域教育数字化转型。

教育大数据的有力呈现,推动了教育决策的科学化,让数据服务教育决策成为可能,继而通过教育决策的调整,推进区域教育科学、健康发展。

区域智慧评价如何生效:保障与推动

魏宁:从长沙市开展的上述教育评价实践可以看出,通过技术支持下的智慧评价,为学校提供了丰富的、立体的数据。但评价毕竟是一个相对专业的领域,对评价数据的解读、借助评价所发现的问题设计改进方案,都需要一定的数据分析能力。如何让如此大信息量的数据发挥出应有的作用,切实改进学校教育教学,让数据能为学校所用,长沙市在这方面有哪些有效的举措?

邹良:评价报告的发布并不是区域智慧评价的终点,只有当评价报告中的诊断数据能转化为学校的教育教学改进行为时,评价才真正起到支撑、驱动的作用。为此,在长沙市的教育评价实践中,我们尝试培育“数据分析师”,打造“数智行动”。我们遴选了3个市级评价结果应用实验区、35所实验校,打造市区校三级应用联盟,发挥评价数据效用,落地区域评价数字化转型。主要目的不在于简单地评判某所学校办学质量的高低,而在于帮助学校发现问题、诊断问题、指导改进,针对评价中发现的问题,要高度重视,深入分析研究,拿出有针对性、可行性的解决办法,从办学理念、校园文化、教育教学、现代治理等方面,全面提升学校办学水平。

我们坚持指导、督促各学校用好评价结果,充分发挥评价大数据的价值,聚焦学校管理、教师教学、学生发展,推进结果应用“数智行动”走向深入,以评价改革为牵引,全面深化教育综合改革,形成系统育人、生态育人的新局面。同时,督促各区县(市)教育局切实抓好评价报告的解读,深度挖掘评价大数据,扎实做好横向对比和纵向分析;既要肯定成绩、找出规律、树立典型,也要找准问题症结、分析原因、督促改进,引导学校持续健康发展。

未来,我们将继续强化综合评价报告解读,注重“评价数据分析师”的培育,打破围墙边界,打破区域边界,学习借鉴全国做得好的评价改革经验,联合各地建立高水平的市、区、校三级联动评价队伍,真正发挥评价数据效用,打造一批教育质量综合评价结果应用示范区、示范校,积累一批区县(市)、校评价实施及结果应用的鲜活经验及典型案例,发挥辐射引领作用。

魏宁:一个区域的智慧评价,涉及大量的学校、教师、学生的真实数据,怎样才能做好数据管理,维护数据安全呢?

邹良:因为区域智慧评价涉及的数据量大,隐私性强,所以数据的有效管理、安全维护是在一开始就必须考虑好的顶层设计问题。

在数据管理方面,我们使用智能算法对区域教育质量增值评价大数据仓中的残缺数据、错误数据和重复数据进行检测与清理,确保数据进入分析前是有效的。设置校验规则再次校验清理结果,如果出现清理结果与预期不相符,系统会及时弹窗提醒。综合评价大数据经分类整理、分级储存、分层呈现、分权调取,实现了纵向全过程、横向全要素一体化呈现,奠定评价数据多元化交叉分析及管理溯源的基础。

在数据安全方面,我们不断优化评价系统安全维护,设置数据分类、调取权限、访问控制,并通过数据备份、加密、脱敏等数据库安全手段降低评价数据泄露、损失的风险,有效保障了学生成绩、家庭背景等隐私信息的安全。

深化新时代教育评价改革,就是以教育信息化、数字化为支撑的重要变革。

魏宁:通过十年来借助大数据、人工智能等新技术,开展区域智慧评价方面的探索,您觉得信息技术为区域教育高质量发展起到了怎样的推动作用?

邹良:通过十年的坚持探索,基于大数据、人工智能技术的智慧评价的成效逐渐显现。我认为,智慧评价在以下方面发挥了重要的作用。

首先,通过持续跟踪的大数据分析,使得教育规律得以显现,推动了育人理念的更新。我们从学生进步、教师成长、学校发展三个维度开展的综合观测评价,既关注学业增值,又关注相关因素,同时以体质健康、劳动教育等专题视角,引领社会树立科学全面的教育质量观。而通过年复一年的大数据积累与分析,对教育教学中存在的问题进行诊断,对教育规律展开深入探寻,使得智慧评价结论更具说服力,引导了育人理念的正确方向。例如,近两年通过长沙市的智慧评价,我们发现“参加校内课外活动有助于减轻学习压力,提升课业质量,提高学业成绩”“亲子关系对初中学生学业影响较大,师生关系对高中学生学业影响较大”“家庭作业时间过长可导致学生学习兴趣下降、课业质量降低”“充足的睡眠和锻炼有利于降低学生视力不良检出率”等重要结论,这些经由教育大数据挖掘出来的结论,有着较强的说服力,很好地发挥了评价对新时代教育理念的正向引领作用。与此同时,教育大数据的长年积累,也有利于历年数据的比较分析,能从已有数据中挖掘教育规律,不给学生添加额外负担。

其次,教育大数据的有力呈现,推动了教育决策的科学化,让数据服务教育决策成为可能,继而通过教育决策的调整,推进区域教育科学、健康发展。教育评价的重要功能是诊断,评价的目的在于引领教育教学科学发展,通过对关键性指标的诊断,引导区域、学校关注数据背后的价值,找寻教育发展规律,诊断教育发展问题,为区域教育行政部门和学校教育决策与管理提供科学依据。在我们开展区域教育质量评价的十年中,我们始终坚持服务教育决策,回应社会关切,通过“教育综合评价+专题评价”的方式,充分发挥大数据评价的引导、诊断、改进、激励功能,助推教育决策从“经验判断”走向“数据举证”,实现了教育决策的科学化、精准化。例如,2016年,我们通过教育质量评价,发现区域内学生睡眠时间少的问题,随后将城区小学生每天早上上课时间调整到8:30,让学生能有更充足的睡眠时间;2018年,我们关注到学业负担重的问题,随后区域推出了系列减负举措;2019年,我们对比分析了智慧课堂教学对视力及学业的影响,坚定了区域推进智慧教育的信心;2020年,我们发现学生劳动习惯有待加强,随后发布了劳动教育状况评价指标体系。与此同时,我们还针对学生阅读、体质健康、劳动教育、特色办学等教育改革重点问题开展了专题评价,让数据说话,利用大数据分析为决策服务,教育决策的科学化、精准化激发了长沙市教育改革发展的新动能,助推了区域教育高质量发展。

大数据、人工智能等新技术的出现,较好地解决了传统教育评价模式下难以解决的诸多难题,真正形成了智慧评价的有效途径。

区域智慧评价如何发展:前景与挑战

魏宁:刚才我们谈了区域智慧评价中很多有益的经验,通过十年来的实践探索,面对大数据、人工智能等新技术对教育的冲击,您认为,从技术角度来看,新技术给当前的教育评价带来了怎样的影响?具体到实践层面,又给区域智慧评价带来了哪些变化?

邹良:我们说深化新时代教育评价改革,就是以教育信息化、数字化为支撑的重要变革。大数据、人工智能等新技术的出现,较好地解决了传统教育评价模式下难以解决的诸多难题,真正形成了智慧评价的有效途径。通过对评价工具的积极创新,教育评价的科学性、专业性、客观性得以不断提升。

具体到技术层面,人工智能技术在教育领域曾引发多次浪潮,当前正处于从弱人工智能向通用人工智能迈进的时期。从技术角度讲,教育评价算法模型在过去的十年中进行了四次迭代,我们的评价团队按照增值评价、过程评价等理念,先后探索并运用了K均值聚类、多元回归、多层线性、多水平SGP等增值评价模型,科学的模型保证了算法的数据准确性,使区域智慧评价得以精准量化学生学业成长、教师教学效能、学校发展增量。

例如,优化增值评价模型,当前多水平线性分位数回归模型的应用,契合了新高考选科模式下的评价数据特点,在一定程度上克服了评价中的天花板效应,确保了评价结果更加客观公正。

又如,建立归因分析模型,实现循证诊断。综合运用多元线性回归模型、聚类分析模型、结构方程模型、中介分析模型、调节效应模型、潜在剖面分析模型等统计方法,探讨“增值和相关因素”“相关因素之间”复杂的相互作用关系,寻找现象背后的原因,探索教育背后的规律,为有针对性地改进教育教学提供了参考和依据。

在区域智慧评价实践中,教育评价大数据系统架构历经了从信息化时代到数字化时代再到智能化时代的转型升级,新的架构体系包括基础设施层、能力聚合层、数据采集层、数据分析层和数据展示层。在数据采集和分析的过程中引入了实时计算和机器学习能力,实现了对数据的实时智能化挖掘。评价数据地图3.0版本实现了过程性数据汇聚、学业成绩分析、区县校指标比较分析以及学校画像等功能,为教育评价提供了更全面和精准的数据分析和可视化展示。

由上面这些评价技术的演进可以看出,以大数据、人工智能为代表的新技术给教育评价带来了革命性的变化,以上这些变化也体现了我们十年来的区域智慧评价实践,实实在在推动了区域教育质量评价随时代不断发展、升级。

魏宁:当前,我国已进入教育数字化转型的关键时期,教育评价也面临着数字化转型的重任,您认为,大数据、人工智能等新技术能为教育评价的数字化转型带来哪些新的变革呢?

邹良:教育评价的数字化转型是当前评价研究的热点。我们迫切需要建立能够促进教育健康发展,促进学生全面发展,使学生具有适应未来的综合素养的科学的教育评价体系。大数据、人工智能等新技术为教育评价的数字化转型带来了新的可能,如相对于传统的机器学习算法,多层神经网络就具有很强的非线性表达能力,在训练和测试中的计算并行性非常好,在很多领域都表现出更强的性能。我们也正在探索将多层神经网络等深度学习模型应用于教育评价,通过对学业与相关因素等特征进行建模,完成分类和预测任务。此外,人工智能大模型的运用,可以对智能化测评与诊断、交互式报告生成、研发辅助工具等进行重构。

在实践中,利用人工智能、大数据等技术优势创新评价工具、攻关核心技术、优化评价管理、提升评价质量、拓展结果应用,有效破除评价“指标细化难、数据采集难、多元评价难、结果应用难”等问题,驱动区域教育质量综合评价客观精准、智能高效,智慧赋能治理“五唯”痼疾。

我们坚信,通用大模型的出现,从根本上改变了教育数字化转型这条赛道。可以这么说,数字化转型已成为大模型智能化应用的基础,而以数字化转型为基础、基于大模型的垂直领域行业模型将重构整个教育生态。

魏宁:您能否具体谈谈,人工智能在教育评价领域的应用发展趋势?

邹良:从人工智能在教育评价领域的应用趋势来看,评价导向将由知识转向核心素养,评价的核心素养内涵与维度也在不断发展和深化,对学生的能力要求更加全面,进而呼唤评价工具的多样化。

问答测评可以支持千人N面对话式问答测评,如心理健康评估摆脱了对自陈量表法的依赖,通过问答测评实现无痕式和伴随式评估。多模态支持语音、图片、视频设问及答题,多样化测评形式,改变目前问卷测评题型单一、答题方式单一的问题。

在结果诊断上,基于大数据可视化技术及深度学习技术,可以形成评价结果的智能诊断及预警分析模型。

魏宁:面向未来的区域智慧评价还面临哪些挑战?您和您的团队在区域智慧评价实践中将坚持怎样的方向?

邹良:新技术支持下的区域智慧评价还面临着一些挑战,如数据基础薄弱、算法的可解释性、数据壁垒、模型的公平性、数据的隐私和安全性等难题,需要从理论和实践两方面继续进行研究和探索。

从我们开展的区域教育质量评价的实践来看,未来将以“智慧评价·数据挖掘·创新驱动”为思路,加快教育评价数字化转型,努力构建良好教育生态,服务长沙“品质教育”新品牌。

数字化转型已成为大模型智能化应用的基础。而以数字化转型为基础、基于大模型的垂直领域行业模型将重构整个教育生态。

猜你喜欢
智慧区域评价
中药治疗室性早搏系统评价再评价
分区域
基于严重区域的多PCC点暂降频次估计
基于Moodle的学习评价
有智慧的羊
智慧派
区域
保加利亚转轨20年评价
多维度巧设听课评价表 促进听评课的务实有效
智慧决定成败