因材施教:数字孪生构建个性化学习模型

2023-12-01 03:44娜,葛
软件导刊 2023年11期
关键词:因材施教偏差个性化

吴 娜,葛 敏

(南京邮电大学 教育科学与技术学院,江苏 南京 210003)

0 引言

中共中央及国务院在《国家中长期教育改革和发展规划纲要(2010—2020 年)》中提出:“注重因材施教,关注学生不同特点和个性差异,发展每一个学生的优势潜能。”[1]2019 年在《关于深化教育教学改革全面提高义务教育质量的意见》中,中共中央及国务院再次着重指出要“精准分析学情,重视差异化教学和个别化指导”[2]。作为我国古代教学经验的宝贵结晶,《论语》提出的因材施教思想成为现代教学的重要原则和方法。因材施教是指教师根据不同学生的个性化差异,进行有针对性地教育和培养,以使得每位学生均实现最佳的个人发展。由于因材施教依赖于精准的个性化差异评测以及不同施教效果的预测和反馈,在实践中往往因缺乏具体的可操作性导致难以把握,而随着人工智能等新兴技术的发展并逐步走向成熟,促进了施教方式的变革,也为智能化教学环境的创设提供了技术支撑[3]。

2019 年习近平总书记在首届国际人工智能与教育大会上提出:“充分发挥人工智能优势,加快发展伴随每个人一生的教育、平等面向每个人的教育、适合每个人的教育、更加开放灵活的教育”。在《国家教育事业发展“十三五”规划》中,国务院鼓励使用人工智能、VR 等技术“为推动个性化学习和针对性教学提供支持”[4]。教育部办公厅也在《2019 年教育信息化和网络安全工作要点》中提出要“利用人工智能加快发展面向每个人、适合每个人、更加开放灵活的教育体系”[5]。在2020 年召开的全国教育工作会议上,教育部强调“要推动教育改革开放实现新突破,促进教育信息化与因材施教深度融合”[6]。2020 年国家工信部发布《数字孪生应用白皮书》,标志着数字孪生成为了社会生活及生产活动中数字化转型的支撑力量和技术创新的新引擎[7]。随着国家政策文件的逐步指引及社会对个性化教育的日益重视,数字孪生有望破解因材施教的难题,使因材施教及建构适合每个人的教育成为可能。

1 数字孪生及其在教育中的应用研究现状

1.1 数字孪生概述

作为一种信息建模技术,数字孪生旨在在虚拟世界中为真实的物理实体构建完全一致的数字模型,即数字孪生体。数字孪生体是实体的等价表达,是物理实体在虚拟空间中的四维映射,能根据物理实体的实时运行数据对物理实体进行监控、仿真分析与计算,从而实现精确的分析与决策[7]。

数字孪生以数据整合分析为基础,为物理实体构建一个对应的虚拟模型。该模型既能实时跟踪物理实体的运行状态,又能反映物理实体在外部激励下的演变过程。因此,可以基于虚拟模型的实时更新和动态演化过程来仿真分析物理实体的状态与行为,并通过虚实交互反馈实现对物理世界的预测和控制。数字孪生通过物理世界与虚拟世界的虚实融合(见图1),最终实现虚拟世界对物理实体的赋能。

Fig.1 Virtual-reality fusion process of digital twin图1 数字孪生实现虚实融合过程

数字孪生在智慧医疗、智慧制造、智慧城市等领域已得到广泛应用,这些领域的共同特点是投入成本高、出错代价大,且个性化差异明显,而基于数字孪生的仿真分析能为决策过程提供良好的理论支撑。在教育领域,数字孪生技术应用的合理性和必要性体现在:每个学生均是不同的,可施加的教育方式也千差万别,而任何学生的成长均是单向的,任何形式的外部激励一旦施加,其带来的影响均无法撤销。因此,针对不同学生采用何种施教方式能获得最佳效果,依赖于数字孪生提供的仿真分析功能。数字孪生可提供几乎无成本的理论验证和偏差分析平台,针对不同学生施加不同教育方式的成效均可在实施前进行验证。在数字孪生技术框架下,每个学生均对应一个数字孪生体,其个性化差异均能被较为完整地描述出来;每种施教方式均是可接入的外部激励;学生的终身培养过程均被跟踪;针对不同学生的不同施教方式,其成效均事先可验证、事后可跟踪。数字孪生可为因材施教的大规模实施提供有效的技术支撑。

1.2 相关研究

目前国内对数字孪生在教育上的应用研究主要集中在三大方向:一是侧重于数字孪生应用的教学模式探究。例如,李海峰等[8]针对线上线下不匹配、理论与实践脱离及虚实环境失调等教学问题,提出基于数字孪生的协同探究混合学习模式;张帆等[9]针对工科实践教学改革问题,依据当前教育领域的混合教学理念引入制造工程领域的数字孪生技术方法,构建基于数字孪生环境的混合实践教学平台;黄音等[10]针对当前校企合作的教学问题,以人工智能技术为辅,以数字孪生技术为核心提出一种全新的实践教学模式。二是侧重于数字孪生助力构建智能空间的探究。此部分研究通常从整体化视角来分析数字孪生与整个教育虚拟空间的关系,探究如何建设智能空间。例如,李海峰等[11]提出构建数字孪生智慧学习空间,并致力于实现各类学习空间的一体化;朱珂等[12]提出一种全息课堂,其具有“可视化三维学习空间”的形态特征,以探究学习空间的重构,加强虚实结合智能空间的建设;万力勇[13]提出将数字孪生融入到高校创客空间的构建中,推动高校创客空间从混合空间到数字映射空间的转变。三是侧重于数字孪生相关模型构建的研究,较为典型的有王小根等[14]针对学习者建模问题,分别从学习者特征、模型构建和建模技术3 个维度进行阐述,并指出在未来的教育场景中,学习者孪生体将以多重角色出现,其不仅可以与学习者、教师进行沟通交流,而且能与其他学习者孪生体进行模拟互动,以助推全新的教育生态重构。

通过对国外资料的研究与分析发现,学者关注的焦点在数字孪生如何应用于教学上。一方面尝试将数字孪生用于远程授课,如Sepasgozar[15]提出利用数字孪生以及虚拟现实等5 种新型数字技术开发沉浸式建筑模块,实施数字教学法,以提升教育效果。另一方面多将数字孪生应用于工程教育,如Liljaniemi 等[16]提出在工程教育中,可采用数字孪生等新的数字技术改善学习体验,提高学习效果。另外,Madni 等[17]提出一种创新的教学方法,利用数字孪生技术将传统的课堂授课转变为在课程实验室中“边做边学”的体验。通过将数字孪生体与物理孪生体连接,其具有的即时反馈功能为学生提供了对系统行为的重要见解,同时加速了学习进程,使学生在进入劳动力市场之前即能以一种快速、经济、安全的方式掌握相关的知识和能力。

综上所述,国内外学者针对数字孪生在教育领域中应用的研究已取得了一定成果,但均侧重于应用模式的探索和应用场景的论证,缺乏系统级解决方案的规划和具体落地的实施方式,而且忽视了数字孪生技术中的关键部分,即教学参与者建模、施教方式仿真、全教学周期演化、虚实交互共生反馈等。在教学领域引入数字孪生技术,不应只着眼于教师的虚拟替代,或教学内容的虚拟展示,更应该应用在能深刻改变每个学生的个性化教育中。本文提出数字孪生在个性化学习中的模型构建方案及模型应用方式,力求为数字孪生在因材施教中的应用提供可行的实施路径。

2 因材施教在实施过程中的现实困境

因材施教理念自提出以来,虽然具有大量教学案例,但具体的实现方式依然处于悬而未决的状态,一直无法全面落实。因材施教的前提是因材,如何评价学生的个性化差异是其实施过程中首先需要解决的难题。良好的因材施教,依赖于全面、细致的学生个性化评价。为了获取真正具有实战指导意义的学生个性化评价,至少需要解决以下3 个方面的问题:①明确学生个性化差异评价的实施主体,以获取学生的个性化数据;②定义学生个性化差异的描述方式,以利于学生个性化评价数据的存储和传递;③构建学生个性化差异的演化模型,以描述学生的成长状态和成长过程。

2.1 学生个性化差异评价实施主体

教师是学生教育的直接执行者,也是学生个性化差异评价最重要的参与者。在现代教学环境中,由教师负责学生的个性化差异评价也面临诸多问题,如师资力量不足、评价不全面、缺乏系统化评价和管理机制等。由教师负责学生的个性化差异评价,面临的一大阻碍是学生多而教师少。根据中华人民共和国教育部于2017-2021 年间发布的全国教育事业发展统计公报[18],2017-2021 年我国各教育阶段的生师比位于12~20 之间,即每个教师同时负责12~20 个学生。考虑到同时开设的不同学科,每个教师同时负责的学生数量应是上述数字的数倍。在比较大的生师比下,由教师对学生进行个性化差异评价必然是繁重且难以完成的工作。另一方面,各任课教师可针对学生进行其所教课程相关能力的考查,而难以考查学生在该课程之外的能力。学生的个性化差异不仅体现在学校开设的各课程上,而且体现在课程之外的方方面面,因而导致了任意教师对学生的个性化评价都是片面、零碎的。由少量教师各自为战地作为学生个性化差异评价的实施主体,相当于盲人摸象,既不能保证全面,也不成体系。

2.2 学生个性化差异描述方式

笼统地说,学生的个性化差异可总结为认知水平的差异、学习风格的差异和学习动机的差异,但这种模糊的描述方式难以作为施教的前提。对学生个性化差异的描述要细致、全面,既要可排序,又要可度量。学生的个性化差异体现在智商、情商、行为、兴趣爱好上,也体现在各学科学习水平上。对学生个性化的描述需要包含足够多的维度,由多维数据组成的学生个性化描述向量是需要存储并传递的。

在现代教学环境中,学生的个性化差异由各任课教师负责评价,评价标准各有不同,评价结果也无法在不同教学阶段的教师之间传递。教师对学生个性化差异的掌握程度取决于教师对学生的了解程度,但学生过往的表现和评价结果无法成为新任教师的施教参考。不同教育阶段、不同教师对同一学生的个性化评价数据不能有效存储和流通,成为因材施教落实过程中的一大障碍。

2.3 学生个性化差异演化机制

学生的个性化差异不仅体现在学生目前各方面的能力差异上,而且体现在随时间和受施教影响后学生各方面能力的提升幅度上。如何进行针对性教学既要着眼于学生现有水平,又要关注学生的学习能力。针对相同水平的学生采用相同方式进行教学,其效果也不尽相同,因为不同学生对知识具有不同的响应能力。对学生的个性化评价,不仅需要描述学生各阶段的水平差异,而且需要描述其各方面水平的演化过程。

在现代教学环境中,学生个性化差异数据的度量和传递已是难题,贯穿于求学周期内的个性化差异演化过程更是难以掌握。以学生个性化差异为对象,不同时期施加的不同教学方式相当于外部激励,而学生个性化差异的演化过程即相当于针对外部激励的反馈机制。学生的成长均是单向的,任何外部激励的施加均无法撤销,演化方向作为外部激励的成果直接反映了教学方式与学生水平是否适配。只有充分掌握学生水平、教学方式与演化结果之间的相互关联,才能提供针对性的教学方式,从而更有助于学生的健康成长。

3 数字孪生助力因材施教

3.1 共性——通用数字孪生体构建

因材施教是指针对不同学生施加不同教育方式,从而达到不同的教育效果。对应于数字孪生,即针对不同数字孪生体施加不同的外部激励,从而实现不同的演化成果。学生的个性化差异体现为评测数据的不同,对应于数字孪生体则体现为配置参数的不同,而学生个性化差异数据的度量和存储方式、不同施教方式的作用过程应是相同的。数字孪生实施过程中不需要对每个学生从零开始建模,而是先对所有学生建模通用数字孪生体以描述其共性,再针对不同学生,依据其评价结果设置参数,实例化出不同的数字孪生体。

通用数字孪生体的构建应分为数据采集、数据清洗、特征处理和模型构建4个步骤,如图2所示。

Fig.2 Construction process of generic digital twin图2 通用数字孪生体构建过程

数据采集过程用于获取学生个性化差异评价的原始数据,包括但不限于学科评测、智力评测、行为评测、性格评测等。同一年龄段的评测数据应既能反映学生当前的认知水平和接受新知识的能力,又兼顾个性特点和差异。不同年龄段的评测数据用于反映学生的成长过程,同时反映不同学生的成长曲线差异。数据采集需要教师、学校、家长和第三方机构的共同参与,并由教育部门统筹数据的汇总、共享和使用。数据采集过程获取的原始数据一般是不规整的,不能直接用于构建学生的个性化差异模型。

数据清洗过程用于提升采集数据的质量以利于数据挖掘,包括但不限于数据一致化处理、数据重复值处理、数据缺失值处理、数据异常值处理等。数据一致化处理用于解决数据一致性问题,包括度量方式的一致、数据单位的一致、采集频度的一致、描述维度的一致等;数据重复值处理用于解决数据唯一性问题,主要是根据预定义的规则去除重复记录、冗余字段和无关信息;数据缺失值处理用于解决数据完整性问题,主要方式有通过其他信息推断出缺失数据、通过前后数据均值或平滑值补全数据等;数据异常值处理用于解决数据合法性问题,根据强制合法规则剔除无效数据,根据警告规则修正偏差数据,以及通过离群点检测对某些奇异数据进行特别处理等。清洗后的数据一般具有比较高的维度,直接用于模型的构建需要依赖大量的计算和存储资源。

特征处理过程用于将采集数据转化为能反映学生个性化差异的最优描述方式,包括但不限于主成分分析、特征选择、特征提取等。主成分分析基于降维思想将多个指标转化为几个综合指标,转化后的指标是原始数据的线性组合,且各指标之间互不相关,使得其比原始数据具有更优越的描述性能,从而提高分析效率。特征选择的目的在于从高维的特征集合中寻找最优特征子集,原始获取的高维特征往往包含大量与目标不相关或相互之间冗余的特征,通过剔除这些特征来降低数据集维度,从而达到提高模型精度、节省计算资源等目的。特征提取用于将原始数据的维度重新进行组合,从而构建出更具资讯性且不冗余的数据表示,以提高后续模型构建过程中的计算性能[19]。使用经预处理后的学生特征数据,可构建用于描述学生个性化差异的数字孪生模型。

模型构建过程将使用学生特征数据构建学生通用数字孪生体,包括但不限于物理模型设计、虚实交互层设计、仿真分析决策算法设计等。物理模型设计基于学生数据最优特征子集构建学生的通用描述模型,该模型既能反映学生各方面的评测情况,又能根据不同的外部激励进行相应的演化;虚实交互层设计用于使数字孪生体接收学生的评测数据、成长数据以及不同施教方式对应的外部激励,输出不同外部激励下模型的演化结果;仿真分析决策算法设计用于使数字孪生体自我成长,以及在不同外部激励下被动成长。仿真分析决策库中包含各种施教方式和不同的响应机制,可用于针对不同学生采用不同施教方式的仿真实验,获取不同学生在不同施教方式下的施教效果。

通用数字孪生体作为学生个性化差异的基本模型,其本身并不反映学生的个性化差异。通用数字孪生体至少包含3 方面的内容:学生个性化差异的描述方式、学生个人发展的演化过程、不同外部激励下不同学生的响应机制。在同一时刻不同学生之间评测数据的差异表现为通用数字孪生体中描述参数的不同,在学习周期内不同学生之间才能发展的差异表现为通用数字孪生体中成长曲线的不同,不同施教方式针对不同学生之间施教成效的差异表现为通用数字孪生体中响应机制的不同。

3.2 异化——个体模型实例化与演进过程

每个学生对应数字孪生体的异化过程如图3 所示。针对每个学生,需要从通用数字孪生体为其实例化一个对应的数字孪生体,各个数字孪生体的描述参数、成长曲线和响应机制取决于对应的学生。数字孪生体可类似于学生档案或电子学籍,与学生之间是一一对应的关系,并在学生的全部学习过程中进行实时跟踪、实时更新。针对每个学生,均可在其对应的数字孪生体上进行教学实验,经仿真分析后获取最优的施教方式。根据仿真分析结果确定针对每个学生的施教方式并付诸实施,之后将施教结果反馈到数字孪生体并纠正偏差。

Fig.3 Instantiation and evolution of the individual model图3 个体模型实例化与演进过程

实例化是指为每个学龄儿童从通用数字孪生模型派生出可反映该学生个性的个体数字孪生模型的过程。适龄儿童入学时,需要对其进行个性化评测,包括智力、行为、兴趣爱好、认知能力等。学生个性化评测数据用于初始化其对应的个体数字孪生模型。个体初始数字孪生模型描述了施教前各学生之间的个性化差异,随着不同教学方式的实施,各学生逐渐发展、成长为不同的个体。

学生与其对应的个体模型之间进行虚实交互,个体模型的演进用于指导如何选取合适、有针对性的施教方式,学生施教效果用于修正个体模型的偏差。在一个教学周期内,个体模型的演进过程主要包括4 个环节:①个体模型模拟不同施教方式,并根据仿真结果确定最优施教方式;②个体模型的仿真分析结果为学生施教提供决策支持;③根据个体模型提供的理论支撑,为学生提供具有针对性的施教方式和内容;④将学生施教效果反馈给个体模型。

在个体模型施教模拟阶段,需要对每个个体模型施加不同的教学方式,并观测其教学成果。与真实学生不同,施加于数字孪生体的各种施教均是可撤销的,数字孪生的状态是可逆的。因此,个体数字孪生模型可以作为对学生施教的实验平台。在施加给学生之前,所有可能的施教方式均可以提前验证其教学效果。验证过程可以自动实施,也可以人为介入控制。

不同的教学实验可获得不同的教学成果,根据不同的教学成果可评价各教学方式的优劣。在理想情况下,模型施教过程能提前证明可采用的最优施教方式,并提前预测学生的成长结果。在个体数字孪生模型上进行的模拟教学实验,能为每个学生选择最优施教方式提供决策依据。基于个体模型模拟教学实验提供的理论依据,大范围进行因材施教将成为可能。教师可根据模拟实验结果对每个学生进行因材施教,也可根据自己的教学经验选取合适的教学方式。

在针对每个学生进行因材施教之后,尤其是在教学阶段结束时,需要对学生进行评测,以反映当前阶段的教学成果。学生的评测数据与其对应孪生体的状态可能存在偏差,因此需要将评测数据反馈给其对应的个体数字孪生模型。个体数字孪生模型根据学生的评测数据校正其内部偏差,以保证孪生体与学生之间的同步,便于指导下一阶段的教学。学生与孪生体在每个教学阶段结束时的偏差均被记录在个体孪生模型中,用来指导个体模型的自学习过程。个体模型通过不断学习每个教学阶段与学生之间的偏差,从而更精准地拟合学生的成长曲线,更能反映学生的个体特性,也能在后续教学中更好地模拟教学实验,并提供最优施教方式。

3.3 反馈——不同阶段不同施教方式评价机制

作为来自控制论的基本概念,反馈的含义是将目标系统的输出结果返回到输入端,并通过某种形式与原始输入进行融合而改变系统的输入,从而影响系统的功能[20]。在实际教学过程中,每个学生均类似于前馈网络,每个阶段的教学效果均只能向下一阶段传播,无法反馈也无法撤销。在每个教学阶段,每种施教方式针对每个学生产生的效果与教学预期之间总可能存在偏差。由于整个教学过程是无反馈的,每个阶段产生的教学偏差逐渐累积,最终可能产生不可逆、非预期的结果。

通用数字孪生模型可使用反向传播学习算法为教学过程提供反馈机制[21]。在模拟教学环节,每个教学阶段产生的偏差均可被反向传播到该教学阶段的起始位置,用于修正该教学阶段的教学方式。在个体数字孪生模型的教学模拟过程中,前向传播和反向传播交替进行:前向传播计算施加的教学方式对该模型产生的输出效果,反向传播基于输出效果与预期效果的偏差对施加的教学方式进行调优。

在个体数字孪生模型中,假设使用X标记学生状态,其是由m个最优特征组成的向量,则第i教学阶段起始与结束时学生的状态Xi-1和Xi分别如式(1)、式(2)所示。

第i教学阶段结束时,学生的预期状态如式(3)所示,其前向传播过程如式(4)所示。

其中,Δ可使用线性函数,也可以采用核函数,以便于对学生状态进行偏差分析。学生状态偏差分析的目的在于指导对施教过程的调优,因此学生状态偏差函数应满足以下条件:计算量可控、学生状态偏差显著。

在实际应用时,学生状态偏差分析的输出不一定是学生状态偏差,也可以是学生状态偏差对应的损失,即采用学生状态偏差损失函数。在构建通用数字孪生模型时,学生对施教方式的响应函数和学生自我成长函数一般采用最大期望算法拟合得出,适用于所有学生,但并不保证贴合每个学生的真实曲线,因此导致学生状态偏差可能是有益的,也可能是不足的。在此种情况下,使用学生状态偏差损失作为教学效果优劣的评价方式,可能更便于指导施教方式的调优过程。在模拟教学阶段,基于反馈机制的施教方式选取与调优过程如图4所示。

Fig.4 Selection and tuning process of teaching modes in the simulation phase图4 模拟教学阶段施教方式选取与调优过程

施教方式的调优过程为:首先,针对每个个体数字孪生模型施加指定教学方式;其次,根据学生输出状态和学生期望状态进行学生状态偏差分析;再次,将学生状态偏差分析结果反馈到输入端,指导更换或调优施教方式。如此往复,经此过程选取的最优施教方式可作为实际施教过程中的参考。

4 总结与展望

为更好地协助学校教育实现因材施教,本文以数字孪生技术为基础,提出了构建个性化学习模型的实施策略,为后期基于数字孪生技术的模型设计、构建和应用提供借鉴与参考。目前,如何基于数字孪生构建个性化学习模型仍是尚待解决的问题,相关的理论研究与技术实现仍处于探索阶段,在前期的数据采集和后期的推广应用方面仍面临着巨大挑战。在未来的模型搭建中,应更注重突出标准化的个性差异度量与评测、通用全面的模型构建、精准化的仿真模拟预测、实时准确的效果反馈,以及全生命周期的状态监控、跟随与演化等功能,并探索以个性化学习模型为基础的独特施教模式和针对性的终身培养方案。为了使整体方案效果更好,可以积极结合其他人工智能相关技术。例如,在个性化评测阶段可引入自然语言处理技术用于处理非结构化的描述性评语,使个性化评价的实施更便捷,且结果能更准确地描述学生状态;在模拟教学阶段引入增强学习技术,使该阶段探索出的施教方式尽可能具有最优的施教效果;在学生状态偏差分析阶段可引入知识图谱技术,发掘学生学习的欠缺之处,使反馈结果既包含施教方式的择优,又包含教学内容的侧重推荐。

猜你喜欢
因材施教偏差个性化
如何走出文章立意偏差的误区
两矩形上的全偏差
小学作文如何实施“因材施教”的策略
明确“因材施教” 促进个体发展
从《论语》看因材施教
新闻的个性化写作
上汽大通:C2B个性化定制未来
关于均数与偏差
满足群众的个性化需求
中高职衔接的关键在于因材施教