学习绩效预测模型的应用：运动与课堂行为关系研究

2021-11-05 00:44胡航李雅馨

中国远程教育 2021年10期

胡航李雅馨

【摘要】学习行为诊断、监控与评价一直是教育数据挖掘的研究重点。学习绩效预测研究已将数据模型的理论转化为教学的应用实践，而融合多种行为数据对学习绩效进行预警与评价的研究较少。采集1，053名大学生12周的运动日志和课堂视频，构建运动与课堂行为预测指标，利用决策树和规则集方法构建预警阈值区间和行为预警策略，并利用机器深度神经网络分类模型，结合主成分法和熵值法，得到两种行为的权重和得分区间，构建行为组合评价策略。研究表明：学习绩效模型能有效预测运动与课堂行为对学习绩效的影响，学习行为预警策略也能有效发现学生行为变化规律，学习行为组合评价策略可量化行为特征值与学习绩效的关系，提升教学管理能力与教育治理水平。

【关键词】学习绩效;预测模型;决策树;深度学习;运动行为;课堂行为;策略研究;关系研究

【中图分类号】 G40-057 【文献标识码】 A 【文章编号】 1009-458x（2021）10-0019-10

学习行为诊断、学习过程智能化监控和学习绩效自动化分类等问题一直是学习分析和数据挖掘的研究方向之一。现有的学习系统一直努力创设一种动态、精准的自适应学习路径，解析学习的发生过程（胡航，等， 2020）。学习分析已从理论研究转向学习行为可视化、预测评估等综合研究，将数据模型的理论研判转化为教学实践的应用价值，同时学习预测从关注教育大数据本身转为探索有意义的教学行为评价和学习结果预测，呈现出研究方法多样性、样本数据多元性等特点（武法提，等， 2019）。随着大数据技术的不断发展，学习分析数据不再限于某一单项具体情境开展，研究手段在多元回归、结构方程模型为主的统计学分析方法基础上，逐渐采用决策树、神经网络等机器学习方法进行学习分析与预测（牟智佳，等， 2017）。基于多场景数据和多种预测模型的融合分析方法能更全面地反映学习绩效与不同学习行为之间的重要性，提升预测模型的泛化能力（胡航，等， 2021）。但学习者和教育管理者如何利用预测结果进行学习效果评价，充分发挥大数据关联性的优势和价值，提高教育管理能力和科学决策能力（宋宇，等， 2020），成为亟待解决的问题。本研究力图融合多种行为数据，应用机器学习方法建立学习行为预警与评价策略，以期对学习行为监控与评测提供指导和参考。

一、研究基础与研究问题

（一）体育运动对学习绩效影响研究

20世纪90年代，已有学者发现体育锻炼与学生的学业成绩具有相关性。Shephard（1996）在加拿大魁北克地区研究发现参加体育锻炼的女生比男生对学业成绩有更大的促进作用;Sallis（1999）在美国加州地区研究发现，参加体育锻炼可以提高学生的学业成绩，但对不同地区学生的影响存在差异。近期研究发现，有氧能力与数学成绩和阅读成绩成正相关（Castelli， Hillman， Buck， & Erwin， 2007），增加体育锻炼的时间和强度有益于学生认知能力和学习成绩提升（Ardoy， et al.， 2014）。Tajik（2017）等从脑科学角度解释了体育锻炼对学业成绩影响的内在机理，发现体育锻炼可以激活前额叶等主要脑区，增强脑区之间的连接以及改善相关脑区内灰质与白质体积，进而提升认知灵活性，培养专注能力的习得，而且适当的有氧训练可以优化大脑结构，改善大脑功能，增强学生的专注力和执行能力，促进大脑学习能力的发展（Guo， 2018）。同时，一些学者还探究了运动对学业成绩之间的量化关系。傅建等（2016）发现每天进行45分钟中等运动强度体育锻炼的学生语文、数学和英语的学业成绩均有提高;董艳梅等（2020）研究中国教育追踪调查数据发现，每天运动1個小时的学生成绩最好，超过1个小时对成绩的促进开始减弱，超过2个小时对成绩产生副作用。已有研究较好地验证了体育运动与学习绩效之间的正向关系，但研究方法多采用问卷调查或自我报告数据进行后期分析，研究内容主要探究体育锻炼在运动时间、运动强度等方面对学业成绩的影响，对学生学业成绩的影响研究因素较为单一（李凌姝，等， 2016）。

（二）课堂行为对学习绩效影响研究

课堂行为研究早期通常手动记录教室中师生的课堂活动过程，如弗兰德斯（Flanders）互动分析系统、S-T分析方法等（傅德荣，等， 2011），这些分析方式自动化程度较低，处理效率不高。随着卷积神经网络为代表的计算机视觉识别技术的革新，一些采用监控设备录制的低分辨率视频也能进行很好的识别和分类（Herrmann， Willersinn， & Beyerer， 2016），课堂环境中面部表情识别精度和可靠性也得到极大提升（孙波，等， 2015）。Whitehill等（2014）采集学生课程中的面部表情图像，使用机器学习自动识别学生的专注度，发现自动检测器性能与人工判断相当 ;Nigel等（2016）使用卷积神经网络识别学生互动时的表情和行为，证明了在现实环境中使用视频行为检测技术的可行性和精准性。在此基础上，一些学者结合人脸检测和面部表情识别技术，分析学生在学习过程中的情绪变化（韩丽，等， 2017）和对课堂的关注度（唐康，等， 2019），建立课堂行为指标建立与课程成绩之间的关系（Ashwin & Ram， 2018）。随着智能技术的发展和课堂教学环境的更新，基于人脸识别的课堂行为分析手段逐渐成熟，可以自动采集和编码教学活动中产生的视频数据，对课堂教学和学习行为进行可视化呈现（刘清堂，等， 2019）。同时，基于视频分析技术逐渐建立起课堂行为评价体系，从学生的情绪特征、行为特征等维度分析教学过程中课堂的整体状态，为研究课堂教学评价、学习行为与学习绩效的关系奠定了坚实的基础。

（三）研究问题

通过相关文献分析可以发现，学者关于运动与课堂行为对学习绩效的影响因素做了大量研究，但同时也发现，研究通常基于单一学习场景进行学习效果预测，研究维度和数据量不够丰富，其应用推广受到限制;采用多种行为数据融合方法进行预警与组合评价的研究较少。可以应用多类型、高维度数据的融合、降维和优化方法提高预测模型性能。

研究团队前期对大学生“早起”与“借阅”行为与学习绩效的关系进行了探究（杜爽，等， 2020），并通过五种机器学习预测模型和两种神经网络模型分析了生活和学习场景中学习行为对学习绩效的影响，构建了包括三个知识引擎的学习行为诊断模型（胡航，等， 2021）。本文基于学习行为诊断模型建立学习绩效预测组合模型应用框架，实现基于行为数据的应用策略。主要聚焦三个问题：一是应用决策树与规则方法构建运动与课堂行为预警策略;二是应用深度神经网络方法构建运动与课堂行为特征融合的组合评价策略;三是探究应用策略对提升教学管理能力和教育治理水平的现实意义。

二、研究设计

（一）数据来源与数据处理

1. 数据来源

研究采集以C市S高校2019级大一学生2019年9月至2020年1月期间三个来源的数据：一是学习绩效数据，来自于教务系统中该门必修课程23个班级的期末成绩;二是通过智慧教室监控系统采集大学生上课过程中录制一学期（12周）一门人文社科类必修课程的课堂视频，共有23个班级，每周录制两节课90分钟视频，共采集到约420小时的课堂视频;三是S高校体育部开展的课后跑步活动数据，为了保证大学生的锻炼效果，采用校园跑步趣味打卡模式，鼓励学生清晨和傍晚在校园各运动场进行跑步训练，学生每次运动使用移动端应用程序记录跑步的时段、时长、里程信息。运动数据来源于程序后台导出的10月开始连续12周37，626条运动日志记录，作为构建运动行为预测指标的基础数据。

2. 数据处理

数据处理过程分为预处理和数据对齐阶段，如图1所示。

①数据预处理阶段。一是提取视频中学生行为特征，对视频进行图像切割、轮廓提取、特征识别处理，形成结构化的课堂行为数据;二是处理不完整的行为数据，如学生缺课、无效跑步时间等情况，需对缺失数据采用期望最大化法进行替补。

②数据对齐阶段。一是进行数据关联，将行为结构化数据与学生基本信息进行联结，构建行为特征矩阵空间;二是对数据进行多种抽样方式，解决数据不均衡问题。由于一些男女性别比例、学习绩效等数据分布是有偏的，如在学习绩效的分布中有85.6%的学生大于80;为了缓解非平衡数据问题，对学习绩效大于80的学生进行随机样本抽取以减少样本量，对小于等于80的学生采用了SMOTE方法进行抽样以增加样本量。SMOTE方法中选取学习绩效小于80的学生样本点与其他的距离其最近的少数样本点结合产生新样本，从而避免随机采样简单复制少数样本策略产生模型过拟合的问题发生。抽样后的数据样本学习绩效两种类别各占比接近50%，可保证数据样本基本无偏性。最终经过数据预处理和对齐后，有1，053名学生处理后的数据作为本次研究的样本，用于绩效预测指标的构建和运动与课堂行为特征指标数据。

（二）研究方法与研究工具

1. 研究方法

预测模型的目标是依据学习绩效是否大于、等于或小于80分的二分类预测问题，因此按照学习成绩将学生分为A类（大于等于80）和B类（小于80），通过两个策略在这个二分类问题中的应用来综合分析运动与课堂行为和学习绩效之间的关系，主要从两条路径构建学习绩效模型的应用策略。在行为预警策略构建中，首先通过机器学习建立决策树（C & R）和规则（JRip）模型，分别用于行为指标分类的可视化和学习行为规则集的生成;其次将行为规则集中的关键分类阈值进行合并和转换，确定用于行为预警判断的阈值区间;最后生成运动与课堂行为预警策略。在行为组合评价策略构建中，通过对机器深度神经网络分类模型与决策树和规则预测模型进行预测效果的比较，确定最优预测模型的预测结果，得到预测指标的重要性先导经验λ;然后使用主成分法计算运动与课堂行为类型的权重系数，同时使用熵值法，结合λ计算两个行为类型中行为指标的权重系数;最终得到调整后的运动与课堂行为权重系数，同时计算行为特征、行为类型和组合评价的得分区间，为分析和量化运动与课堂行为对学习绩效之间的关系提供评价支撑（如图2所示）。

2. 研究工具

研究使用Weka和SPSS Modeler18工具，结合Python语言中数据分析工具包作为主要研究工具。Weka提供多种机器学习分类器和深度神经网络模型组件（Lang， Bravo-Marquez， Beckham， Hall， & Frank， 2019），可用于进行各种分类预测模型的構建;SPSS Modeler18用于构建决策树和规则模型;Python开发平台实现主成分分析、熵值计算和图形可视化操作。

（三）运动与课堂行为预测指标的构建

1. 运动行为预测指标的构建

运动行为预测指标参照梁德清（1994）体育活动等级量表（PAR-3）中关键指标进行构建，该量表的信度和效度得到一致认可。量表中将运动分为强度、时间和频率三个维度，每个维度5分，按照“频率*时间*强度=运动量”计算调查个体的运动量。依据体育活动等级量表评测项构建本研究基于跑步日志数据的运动指标，采用X表示，指标包括运动次数（VX）、平均跑步用时（TX）、平均跑步里程数（DX）、运动规律（HX）。其中，运动次数（VX）体现运动频率，指在一学期12周学生参与跑步的次数累加的平均值;平均跑步用时（TX）体现运动时间，指学生每次跑步用时（秒）累加的平均值;平均跑步里程数（DX）体现运动强度，指学生每次跑步距离（米）累加的平均值。

为了反映学生的运动规律（HX），根据运动次数分布的熵值，可以判断运动行为的随机性与无序程度，运动规律值反映每周学生参加运动的连续规律。其中，[fmj]为第m个学生第j周运动次数在n个周内运动总次数中的比重（如公式1所示）：

[HX]=[1ln（n）][i=1nfmjln]（[fmj]）（公式1）

运动规律指标的取值范围为0～1之间，取值越高说明学生每周的运动越有规律，如一学生n个周内都没有运动，运动规律值为0。

2. 课堂行为预测指标的构建

行为检测是智能教育界面中响应学生学习状态的关键组成部分。在课堂环境中，采集课堂中连续的视频序列，对动态视频进行图像分割、面部轮廓提取和面部特征识别。在课堂行为指标建立中，韩丽（2017）构建了课堂环境中基于面部表情特征与心理状态的关系;Ashwin等（2018）通过面部、手势和身体姿势特征将学生划分为非常投入至非常不投入4个层级;唐康等（2019）根据学习个体和课堂整体抬头率来计算课堂整体关注度。本研究以韩丽（2017）与唐康等（2019）两者的研究为基础，通过识别学生上课中的面部特征判断学生对课堂的整体专注情况。利用人脸识别系统实时测量学生头部的垂直方向上仰头和低头角度、水平方向上左右摇头角度来判断学生的听课状态：仰头或直视（头部角度变化在0～60度之间）为倾听状态;略有倾斜或低头动作（头部角度变化在0～60度之间）为理解或疑惑状态;低头或扭头（头部角度大于60度或检测失败）为抗拒或不屑状态。将前两种头部角度均在0～60度之间对应为专注状态，用于构建课堂行为预测指标的判断依据。三个课堂行为预测指标用Y表示，包括专注次数（VY）、专注度（PY）和专注时间（TY）。

①专注次数（VY）指标依据陈子健等（2019）提出的主动外观模型（AAM）对学生面部进行识别，通过头部角度的变化程度，统计在一个完整课堂教学时间内，学生处于倾听状态的次数统计。首先将视频以45分钟为一个周期每隔2.5秒进行关键帧提取，一节课中共有1，080次识别;然后识别每个关键帧中学生头部的变化角度，如果头部角度垂直区间在0～60度且水平区间在0～60度，说明学生是在直视或仰头，可统计为有1次专注数。

②专注度（PY）指标在统计专注次数（VY）基础上，统计在单位时间总识别次数（Sn）中，如果头部角度在垂直或水平区间大于60度，说明学生是在低头或扭头，识别出学生处于非倾听状态次数（Sf），同时统计教学时间内无法识别的次数（Se），运用公式2得到学生的课堂参与度指标。

PY=1-[（Sf+Se）Sn] （公式2）

③专注时间（TY）是学生头部角度的变化时间统计。以分钟为单位，主要反映学生在課堂中将面部识别为专注状态的持续时间，同样以学生的头部角度区间作为识别依据。若在关键帧识别整个班级的专注率高于75%，则关键帧之间的时间间隔统计为专注时间段。专注时间主要反映大学生在课堂中的参与情况，对评价课堂学习的整体效果具有重要的参考价值。

三、数据分析

（一）依据决策树与规则模型关联研判，构建行为预警策略

1. 决策树模型可视化分类

决策树是一种常用的直观快速分类方法。研究采用Modeler决策树中C & R（分类和回归）对两种行为特征值生成树节点，使用递归分区将预测变量分割为具有相似输出字段值来查找最佳分割值进行分组。相较于决策树常用的C4.5算法，C & R既能处理学习绩效连续变量（回归），也能处理成绩等级分类变量（分类），且在数据缺失、指标较多等情况下有较好的稳健性。决策树生成器生成运动与课堂两种行为的预测分类结构图如图3和图4所示。

根据运动行为生成的决策树分类结构图，可以直观地分析出运动行为指标与学习绩效之间的关系。例如，经过节点0、1、3、11到达节点14，可以得出如果一个学生平均跑步里程（DX）小于2，928米、运动次数（VX）小于15次、平均跑步时间（TX）小于1，093秒，但运动规律（HX）大于0.819，则模型能预测该生的学习成绩属于A类。同时，决策树能反映出预测指标重要程度，在图中从左到右依次递减，预测指标重要性值分别为：平均跑步里程（DX）0.523，运动次数（VX）0.471，平均跑步时间（TX）0.438，运动规律（HX）0.380。这说明学生每次跑步里程和时间越长、运动次数越多，对学习绩效的提升作用越积极，运动规律的影响要弱于前三个指标。

同样，在课堂行为分类中发现三个预测变量的重要性依次是专注时间（TY）0.882、专注度（PY）0.763和专注次数（VY）0.721。这反映出在课堂教学中，学生在教室专心听课的时间长短对学生的学习绩效关系最为密切，对学习绩效的影响最大;从节点0、2、6和节点0、2、5、11中可以发现，专注次数（VY）更多的学生更有可能成为A类学生。

2. 规则模型生成行为规则集

在决策树的可视化模型基础上，利用规则模型生成运动与课堂行为规则集，用于构建学习行为判断的阈值区间。RIPPER采用贪婪算法构造规则集，能进一步简化规则集规模，生成的规则集按照分类比例进行排序，比例越高说明代表的规则信度越高（如运动行为规则集中规则1中表示该规则可对354名学生中70.4%也就是249人进行分类），选取两类规则集中的第1条（如表1所示）。

3. 依据上述关联结果生成预警阈值

根据规则集中所有规则的分类阈值进行排序和整理，结合决策树对两种行为得到用于运动与课堂行为预警的阈值。每种行为类型分别有两个阈值点，分为三个阈值区间。同时可将三个区间对应于三种行为等级，如运动次数小于9.1次对应“未达标”、9.2～15.5次对应“良好”、大于15.5次对应“优秀”。通过确定行为阈值等级，使得对行为判断的依据更加明确和易于操作，为构建行为预警策略提供了依据（如表2所示）。

4. 基于预警阈值构建行为预警策略

为了更加直观地发现行为的内在变化规律，将运动与课堂行为的行为特征值按每周的平均数进行绩效统计，并按照预警阈值区间分别构建12周A、B类学生的行为预警图（如图5和图6所示），图中所在区域的颜色越浅行为等级越低，颜色最深的区域代表行为等级为“优秀”。

从图5和图6可以看出，A类学生无论是运动还是课堂行为特征值均有较高的等级，说明成绩好的学生在课堂中更加专注听课，而且运动越好的学生可能会有更好的学习绩效。两种行为的分布情况：

①在课堂行为中可以发现，专注度（PY）12周中始终保持在“良好”和“优秀”的等级，专注次数（VY）较高的集中在第4～5周中期阶段，专注时间（TY）较高的主要集中在第9周以后;B类学生专注度（PY）较高的主要集中在第4周和第12周，专注次数（VY）最高的在第4和第11周，专注时间（TY）最高的在第8和第11周。这可能与学生中期考试和期末考试的重视程度有关，学生为了能在一学期中的考试中获得比较好的分数，在考试前的课堂学习中更加愿意倾听教师讲课。

②在运动行为中，A类学生在跑步时间（TX）、运动次数（VX）和跑步里程（DX）上基本处于“良好”和“优秀”的等级，运动规律（HX）较高的出现在第2周和第9周，且基本保持在“良好”等级;B类学生的运动规律（HX）出现4周一次的周期性变化，跑步次数（VX）、运动时间（TX）和跑步里程（DX）基本“未达标”，在第10周以后出现上升的趋势，这可能是因为第10周后由于体育课程考试的逼近，学生需要进行体能准备，或学校开始了冬季长跑运动。

（二）依据深度神经网络分类模型权重研判，构建行为组合评价策略

1. 深度神经网络分类模型生成先导经验权重

决策树与规则分类模型能直观解释各预测指标与学习绩效之间的关系，但深度神经网络的预测准确率一般情况下优于机器学习模型，且在Kappa值、召回率等指标上均较好，深度神经网络模型可用于对学生学习行为的精准预测，相较于其他机器学习模型，其优异的预测性能可用于学习行为诊断和学习干预方式的界定（胡航，等， 2021）。因此，为获得更优的预测结果，在构建行为预警策略后采用深度神经网络预测模型对运动与课堂预测指标进行建模。使用Weka中的Dl4jMlpClassifer深度神经网络分类器，设置网络类型、监听器为Epoch Listener类型、Epoch个数为10，采用十折交叉验证法对分类模型进行训练和测试。同时，此分类器与建立行为预测策略中使用的决策树和规则预测模型进行预测结果比较，预测结果如表3所示。

从表中我们可以发现深度神经网络分类模型在准确率、真正率、召回率等指标上相较于后两种预测模型性能有所提升，预测准确率提升到了79.8%。三种模型的Kappa值分别为0.704、0.634和0.615，模型分类结果均达到较高一致性。

同时，将分类模型建立过程中预测指标的重要性值（贡献程度）作为后期组合评价机制中计算权重的影响因素，选用准确率较高的深度神经网络分类模型作为组合评价机制的基础，将模型中预测指标的重要性值进行归一化操作，生成指标权重值λj，作为建立行为组合评价策略的先导经验（如表4所示）。

2. 利用主成分融合法、熵值法生成行为特征权重

为了构建分层组合的行为评价机制，运动与课堂两种行为类型量化得分的计算，需要将行为特征指标中的信息通过降维进行浓缩，运用降维、因子提取等操作将多维组合特征值投射成机器学习能够处理的低维向量空间（张琪，等， 2020）。在Python3.7环境中调用主成分法（PCA）分析工具进行因子分析。KMO=0.6372，巴特利特值=0.00<0.05，說明当前数据可以进行主成分法融合。因子方差得分矩阵解释程度为88.69%，权重系数wk如表4所示。

行为类型和行为特征的权重，熵值法确定的权重反映各个因素或指标在综合评价过程中的重要程度。通过计算运动与课堂的行为特征的信息熵值，得到每个行为特征指标的权重系数wj（如表4所示）。从结果可以发现，运动行为特征中权重系数最高的是跑步时间TX（20.3%），运动规律HX最低（8.8%）;课堂行为特征中权重系数最高的是专注时间TY（24.4%），专注次数VY最低（9.3%）。

为了充分发挥预测模型和融合策略的优势，在预测模型的基础上建立加权平均组合评价模型，可以提高评价效果的一致性（权轶，等，2006）。将熵值权重系数与深度神经网络分类模型中的学习经验（重要性）进行分级权重组合评价，对行为特征的权重值进行调整，计算方法如公式3所示：

[W0j]=[λjwjj=1nλjwj] （公式3）

其中，λj为深度神经网络分类模型根据七个行为特征预测重要性计算的预测贡献率，作为组合预测模型的先导经验与行为特征的熵值权重wj共同计算的平均权值，最终得到修正后的加权平均组合权重[w0j]，经过调整后的权重值如图7所示，专注时间（TY）权重比例提高幅度最大，系数值达到34.6%，运动规律（HX）、运动次数（VX）和跑步里程（DX）权重值降低，其他行为特征权重值介于熵值权重wj与先导经验λj值之间，权重系数得到平衡和优化。

3. 基于行为得分判断，构建行为组合评价策略

组合评价策略采用两级指标分级计算的方式，二级指标为行为特征的熵值组合权重和得分，一级指标为运动与课堂行为类型的主成分权重和得分，最后可依据两级各自的权重系数得到两个行为类型的组合评价得分（如图7所示）。

从图7可以发现，组合评价得分区间在-2.78至4.77之间。得分区间是该研究样本通过分级组合评价策略计算出运动与课堂行为的评价范围，分值越高说明行为特征对学习绩效的综合影响越大。如果分值呈现负值，说明行为特征对学习绩效产生相反的作用。

图8反映了A、B类学生群体的组合评价得分情况。从运动行为得分分布看，A类学生有39%集中在-1.7附近（平均分-1.741，中位数-1.397），B类学生有35%集中在-1.7附近（平均分-1.713，中位数-1.042）。从课堂行为得分分布看，A类学生有25%集中在零值附近（平均分0.118，中位数0.069），B类学生有24%集中在-1.3附近（平均分-1.465，中位数-1.455）。从以上分析中发现，A、B类学生在运动行为得分相差不大的情况下，课堂行为得分对组合评价得分的影响较大。

四、研究讨论与结论

（一）学习绩效模型能有效预测运动与课堂行为对学习绩效的影响

学习绩效模型充分发挥两个行为策略各自的优势，从不同的需求进行运动与课堂行为的判别，通过预警与评价策略发现运动、课堂行为与学习绩效的关系。

一是行为预警策略。采用决策树和规则算法生成具体阈值区间，作为行为预警可视化的判别依据，预测结果易读性强，便于理解，能对行为判断进行等级分类。如一名学生课堂行为中平均专注时间（TY）大于829分钟且平均专注次数（VY）大于215次，那么模型可预测该学生学习绩效有70.1%～71.4%的可能性达到A类。同时，教师可通过预警图发现学生在12周每周课堂中各行为特征在预警区间的行为等级，依据此行为等级对学生进行有针对性的及时的课堂行为预判和干预。

二是在深度神经网络方法运算前，为了提升预测性能，需要将预测指标进行无量纲化，便于不同单位或量级的指标能够进行比较和加权。行为评价策略虽然采用深度神经网络模型可以提供较为准确的预测结果，但在行为的判别、行为与学习绩效之间量化关系上解释和评估的程度不够。因此，利用深度神经网络分类模型，对行为特征重要性作为先导经验来调整权重，结合主成分法和熵值法的融合和權值计算结果，可以得到较为准确的评价依据，得分结果可作为行为量化的依据。如在运动行为组合评价中，如果学生跑步时间（TX）得分多1分，则对运动行为多贡献0.143分（跑步时间TX特征权重为14.3%），那么有79.8%的准确性（预测模型准确率）预测该生学习绩效为A类的可能性提高1.77个百分点（0.143分在组合综合得分区间7.55中的占比）。教师能根据行为得分与学习绩效之间变化的映射关系，量化运动和课堂行为中具体操作和实施细节，实现对学生的综合研判和评价。

（二）学习行为预警策略能提高教学管理能力

学习预警的主要工作是预测某一课程最终的分数和等级，或者根据某一课程是否及格或优异对学生进行分类（肖巍，等， 2018）。研究发现，无论是从运动的频率、时间、强度、规律，还是课堂行为中专注次数、比例、时间，都会对学生的学习绩效产生影响。预警策略结合多类运动与课堂行为指标共同预警，结果可应用于对学生具体行为的指导和干预，增强学校整体教学管理能力。

行为预警策略应用于课堂行为既能及时发现学生学习行为的共同问题，也能针对不同类型的学生发现个性化的问题。如A、B类学生在行为预警模型中第6周均出现了等级下降的趋势，或B类学生专注度和专注时间前3周均处于“未达标”等情况，教师均可通过及时提醒进行干预。预警策略在一学期开始两周后就可对运动行为进行预判。如B类学生的运动规律呈现4周一次的周期性变化，教师可以以1个月为期限进行检测，从热力图中发现隐藏的运动行为变化规律，不断优化和更新不同层次的运动预警阀值，帮助学生养成长期运动习惯，也为教学管理和教师基于证据的个性化教学决策者与分析者转变（赵磊磊，等， 2021），促进传统教学管理到数据驱动教学决策的发展变革，提供可靠的技术支撑（刘妍，等， 2021）。

（三）学习行为组合评价策略提升教育治理水平

建立学习行为组合评价策略多层次、多维度数据的有效集成和评价机制，以客观数据为依据，充分利用已知信息，按照指标信息的多少和质量决定各评价指标的权重，使评价结果更加科学、精度更高（Zhi-Hong， Yi， & Jing-Nan， 2006）。利用行为特征的量化分布与行为预警策略中的热力图分布进行综合行为判断和分析，让细微的行为过程在平时的教学活动中发现和量化（许正兴，等， 2020），揭示行为特征值与学习绩效预测之间的内在关系。A类学生课堂行为得分整体上显著大于B类学生（相差1.347），运动行为得分整体上约大于B类学生，分值差距较小（0.028），反映出学生的课堂表现对学习绩效的影响更大。教师在课堂教学过程中通过对学生课堂关注的各个维度进行评价，教师行为因素、教学准备、对推理和问题解决的重视、电脑的使用等都有可能进一步影响学生表现（黄慧静，等， 2007），进而影响学生自身心理对教师的情感态度，改变自我意识，调节努力程度，最终影响学习成绩（杨心德， 1990）。

组合评价策略在行为预警策略的基础上，计算运动与课堂行为在不同行为特征的得分，实现行为数据的有效集成和融合。A、B类学生群体的分值呈现不同程度的偏态分布（A类峰度2.146，偏度0.955;B类峰度-0.165，偏度-0.70），得分主要集中在零值附近（A类平均分0.117，中位数0.530;B类平均分-0.092，中位数-0.069），A类学生的组合评价得分区间更加集中，平均分值大于B类学生。教师和教学管理人员可依据运动行为、课堂行为的综合得分分布，发现不同类型学生的行为特征，促进集成性智慧学习组织与文化实践场域的创设（邓磊，等， 2020），增强教育决策、调控、执行、创新发展的活力，促进教育治理模式由“静态化”治理向“动态化”治理转变（宋宇，等， 2020），为数据驱动下教育治理沿着“技术—治理”的创新方式变革（张培，等， 2021），提供可行的实践方案。

（四）学习绩效预测模型的应用前景

学习行为与学习绩效关系的揭示是一个涉及脑科学、认知科学、教育学等的交叉研究，需要更多实证和理论探索，从生理、认知和心理三个层面达到相互印证的统合关系，才能说明学习的发生有深度、有意义（胡航，等， 2019）。通过学生行为数据的分析，构建行为预警与组合评价策略能较好地对课堂行为进行分析和评测，学习绩效预测模型也能较准确地预测运动与课堂行为特征对学习绩效的影响。但基于现有的数据与方法仅能呈现行为与学习绩效的关系，还未能得出运动和课堂行为之间的联系，特别是运动对课堂行为或是运动对学习绩效产生影响的其他中介效应未能从模型中反映出来。因此，需要更多模态和场景的学习数据来检测模型对数据变化的容忍度，减小模型对不同应用场景、学习行为类型中数据噪声的干扰（Herrmann， et al.， 2016），通过不断调优预测算法与应用策略来提高整体学习绩效预测模型的鲁棒性，实现高效课堂管理与视频分析技术的融合，构建学生的综合数字画像，研判学生的学习与认知水平。

五、結语

本文采用运动与课堂行为数据，基于学习绩效预测模型中决策树、规则算法、深度神经网络方法构建了学习行为预警和组合评价策略，采用数据融合、分层计算权重方法提高了应用策略的可用性和推广性，分析了两种应用策略在教学管理和教育治理上的作用，为学习活动的组织与实施和阐释学习行为对学习绩效预测与评价奠定了坚实的实践基础。研究也存在数据干扰、模型不够健壮等问题。在后期研究中，将进一步优化预测模型，探究行为数据表征问题所反映出的内隐原因，并与学习理念与要素进行融合，从学习行为与心理认知、学与教的评价等多个维度出发，构建多模态行为数据关系的学与教评价改革路径。

[参考文献]

陈子健，朱晓亮. 2019. 基于面部表情的学习者情绪自动识别研究——适切性、现状、现存问题和提升路径[J]. 远程教育杂志，37（4）：64-72.

邓磊，钟颖. 2020. 智能化时代教师教育生态的反思与重构[J]. 教师教育学报，7（5）：1-10.

董艳梅，朱传. 2020. 青少年课外体育运动对学业成绩的影响研究——兼论非认知能力的中介效应[J]. 体育学研究，34（06）：52-62.

杜爽，飞云倩，何牧，胡航. 2020. 大学生“早起”和“借阅”行为与学习绩效的关系研究[J]. 中国远程教育（11）：47-58，77.

傅德荣，章慧敏，等. 2011. 教育信息处理[M]. 北京：北京师范大学出版社.

傅建，范亚荣. 2016. 不同时间中等强度体育锻炼对初中生执行功能和学业成绩影响的实验研究[J]. 体育与科学（6）：110-116.

韩丽，李洋，周子佳，宋沛轩. 2017. 课堂环境中基于面部表情的教学效果分析[J]. 现代远程教育研究（4）：97-103，112.

胡航，李雅馨，曹一凡，赵秋华，郎启娥. 2019. 脑机交互促进学习有效发生的路径及实验研究——基于在线学习系统中的注意力干预分析[J]. 远程教育杂志（4）：54-63.

胡航，李雅馨，郎启娥，杨海茹，赵秋华，曹一凡. 2020. 深度学习的发生过程、设计模型与机理阐释[J]. 中国远程教育（1）：54-61，77.

黄慧静，辛涛. 2007. 教师课堂教学行为对学生学业成绩的影响：一个跨文化研究[J]. 心理发展与教育（4）：57-62.

李凌姝，季浏. 2016. 体育锻炼对于学生学业成绩影响的研究进展[J]. 北京体育大学学报（9）：82-90.

梁德清. 1994. 高校学生应激水平及其与体育锻炼的关系[J]. 中国心理卫生杂志（1）：5-6.

刘清堂，何皓怡，吴林静，邓伟，陈越，王洋，张妮. 2019. 基于人工智能的课堂教学行为分析方法及其应用[J]. 中国电化教育（9）：13-21.

刘妍，胡碧皓，顾小清. 2021. 人工智能将带来怎样的学习未来——基于国际教育核心期刊和发展报告的质性元分析研究[J]. 中国远程教育（6）：25-34，59.

牟智佳，武法提. 2017. 教育大数据背景下学习结果预测研究的内容解析与设计取向[J]. 中国电化教育（7）：26-32.

权轶，张勇传. 2006. 组合预测方法中的权重算法及应用[J]. 科技创业月刊（5）：171-172.

宋宇，卢晓中. 2020. 大数据驱动下区域教育治理探析[J]. 教育研究与实验（1）：36-39.

孙波，刘永娜，陈玖冰，罗继鸿，张迪. 2015. 智慧学习环境中基于面部表情的情感分析[J]. 现代远程教育研究（2）：96-103.

唐康，先强，李明勇. 2019. 基于人脸检测的大学课堂关注度研究[J]. 重庆师范大学学报（自然科学版）（5）：123-129.

武法提，田浩. 2019. 挖掘有意义学习行为特征：学习结果预测框架[J]. 开放教育研究（6）：75-82.

肖巍，倪传斌，李锐. 2018. 国外基于数据挖掘的学习预警研究：回顾与展望[J]. 中国远程教育（2）：70-78.

许正兴，高海燕，王慧. 2020. 创新教育导向下的智慧学习模式建构与实践路径[J]. 教师教育学报（3）：23-28.

杨心德. 1990. 学生对教师课堂行为的认知及其对学习的影响[J]. 心理科学通讯（4）：20-23.

张培，夏海鹰. 2021. 数据赋能教育治理创新：内涵、机制与实践[J]. 中国远程教育（7）：10-17，76.

张琪，李福华，孙基男. 2020. 多模态学习分析：走向计算教育时代的学习分析学[J]. 中国电化教育（9）：7-14，39.

赵磊磊，马玉菲，代蕊华. 2021. 教育人工智能场域下教师角色与行动取向[J]. 中国远程教育（7）：58-66.

Ardoy， D. N.， Fernández-Rodríguez， J. M.， Jiménez-Pavón， D.， Castillo， R.， Ruiz， J. R.， & Ortega， F. B. （2014）. A physical education trial improves adolescents cognitive performance and academic achievement： the EDUFIT study. Scandinavian journal of medicine & science in sports， 24（1）， e52-e61.

Ashwin. T. S.， & Ram. M. R. G. （2018）. Unobtrusive Students Engagement Analysis in Computer Science Laboratory Using Deep Learning Techniques. 2018 IEEE 18th International Conference on Advanced Learning Technologies （ICALT）（pp. 436-440）， Mumbai.

Herrmann， C.， Willersinn， D.， & Beyerer， J.. （2016）. Low-Quality Video Face Recognition with Deep Networks and Polygonal Chain Distance. 2016 International Conference on Digital Image Computing： Techniques and Applications （DICTA）（pp. 1-7）， Gold Coast， QLD.

Castelli， D. M.， Hillman， C. H.， Buck， S. M.， & Erwin， H. E. （2007）. Physical fitness and academic achievement in third- and fifth-grade students. Journal of sport & exercise psychology， 29（2）， 239-252.

Guo， W. （2018）. Brain science and physical education-to promote harmonious development of students with combination of left and right brain in physical education. NeuroQuantology， 16（5）.

Whitehill， J.， Serpell， Z.， Lin， Y.， Foster， A.， & Movellan， J. R. （2014）. The Faces of Engagement： Automatic Recognition of Student Engagementfrom Facial Expressions. IEEE Transactions on Affective Computing， 5（1）， 86-98.

Lang， S.， Bravo-Marquez， F.， Beckham， C. J.， Hall， M. A.， & Frank， E. （2019）. WekaDeeplearning4j： A deep learning package for weka based on Deeplearning4j. Knowledge Based Systems， 178， 48-50.

Bosch， N.， Dmello， S. K.， Ocumpaugh， J.， Baker， R. S.， Shute.， V. （2016）. Using Video to Automatically Detect Learner Affect in Computer-Enabled Classrooms. ACM Trans. Interact. Intell. Syst. 6， 2， Article 17 （August 2016）， 26 pages.

Sallis， J. F.， McKenzie， T. L.， Kolody， B.， Lewis， M.， Marshall， S.， & Rosengard， P. （1999）. Effects of health-related physical education on academic achievement： project SPARK. Research quarterly for exercise and sport， 70（2）， 127-134.

Shephard， R. J. （1996）. Habitual physical activity and academic performance. Nutrition reviews， 54（4 Pt 2）， S32-S36.

Tajik， E.， Abd Latiff， L.， Adznam， S. N.， Awang， H.， Yit Siew， C.， & Abu Bakar， A. S. （2017）. A study on level of physical activity， depression， anxiety and stress symptoms among adolescents. The Journal of sports medicine and physical fitness， 57（10）， 1382–1387.

Zhi-Hong， Z.， Yi， Y.， & Jing-Nan， S. （2006）. Entropy method for determination of weight of evaluating indicators in fuzzy synthetic evaluation for water quality assessment. 環境科学学报：英文版， 18（005）， 1020-1023.

收稿日期：2021-02-19

定稿日期：2021-07-09

作者简介：胡航，博士，副教授，硕士生导师，西南大学教师教育学院卓越教学中心主任，学习教学与智能化研究中心副主任（400715）。

李雅馨，硕士研究生，西南大学教育学部（4000715）。

责任编辑韩世梅