丁 鹏 飞
(1. 上海旅游高等专科学校 公共教学部, 上海 201418; 2. 上海师范大学 旅游学院, 上海 200234)
在传统的课堂教学中,由于难以及时获取学生个体学习兴趣、学习能力、学习进度、面临困难等方面的动态数据,教师通常主观地参照以往经验和学生群体的平均接受能力来制定教学目标、内容和进度计划等,存在一定程度的偏差,忽视了学生个体的差异性和具体特点。随着教育信息化的不断深入,运用学习分析技术帮助教师进行教学评估和预测成为必然趋势。学习分析是通过各种信息化手段监测和收集学生学习环境和过程数据,运用不同模型和方法,动态评估和预测学生的课程学习状态和效果,使教师根据不同学生的能力水平和实际需求,探究最优化的教学方式,为实施有针对性的分类教学提供支持和指导[1]。在学习分析技术支持下,教师可以充分关注学生个体特征,了解学生的实际需求,动态追踪每个学生的学习进度,不断实时调整自己的教学进度和方法,使得学生在同一个学习环境中可以有不同的学习方法、步骤和进度[2]。
国内很多学者在学习分析领域已经做了探索和尝试。属于学习分析理论综述的研究有:李青等[3]对学习分析的基本概念、组成要素、应用模型、分析方法和工具进行了系统归纳。顾小清等[4]提出学习分析技术应注重监测和预测学生的学习成绩,最重要是及时发现潜在问题,对评估和预测结果进行反馈,为教学过程提出有针对性的改进策略和教育决策。郭炯等[5]对国内外2010年以来关于学习分析的期刊论文进行梳理,根据研究重点不同分为理论框架、模型研究、学习分析技术基础、学习分析工具、应用研究、面临挑战等6大类。胡艺龄等[6]分析了网络在线学习行为的建模机制,构建为数据、机制、结果3层次。李爽[7]将“参与、坚持、专注、交互、学术挑战、学习自我监控”6类投入作为分析在线学习行为投入的主要维度。利用数据挖掘方法对学生聚类的研究有:舒忠梅等[8]利用相关分析和数据挖掘方法相结合,识别学生学习行为投入的相关因素,并将学生聚为7类;田娜等[9]根据学生的相似特性对学生进行聚类分析,以分析对课程成绩影响的各种因素;姜强等[10]利用贝叶斯网络方法不同行为模式的学生学习风格;孙力[11]将学习者归为4类:聚敛型、发散型、同化型、调适型。利用回归模型对成绩预测的研究有:马杰等[12]利用回归模型预测了成绩和多要素之间的线性关系;王亮[13]也设计了学习分析的预测模型,筛选出最佳预测效果的影响因子进行 Logistic 回归分析,并在教学管理平台中对该模型进行了实际应用;赵慧琼[14]利用多元回归分析法判定影响学生学习绩效的预警因素,在此基础上构建了干预模型,对产生的学习行为数据进行二元 Logistic 回归分析,并结合问卷调查和访谈法对该模型在学习活动、知识习得等方面的有效性进行验证。孙力等[15]采用数据挖掘中数据分类决策树方法,通过分析网络学历教育本科学生英语学习及相关信息,实现了对其英语统考成绩的预测。
综上所述,国内关于学习分析的研究多集中在理论引介、研究综述、应用模型设计与论证等方面,实证性研究仍较缺乏。已有的研究大多是针对在线课程、网络教育形式的教学,其数据的获取较方便和直接;而大多数学校仍是以面授课堂教学为主、课程考试平台为辅的线下教育,其特点在于,数据获取来源更加多样,反馈和干预可以更加直接。线下课堂需要通过学习分析技术解决以下问题:高校师生比失调,很难做到关注课堂上的每个学生,如何利用学生课程学习产生的数据,了解学生已经掌握什么和没有掌握什么,识别和发现困难学生?是否可以将学生进行分组和聚类,开展有针对性地分类指导,使得高校大规模课堂教学和个性化学习能够得到完美的结合[16-18]。如何根据学生在课程学习中的特定阶段和特定活动,从而总结学生的学习习惯和特点,预测每个学生的学习成果;如何整合多个平台的数据进行分析和决策,并快速反馈在实际课堂上来改进教学。
本文在查阅国内外相关文献的基础上,通过学习分析得到的数据,应用数据挖掘的方法构建预测和聚类模型,理解学习过程和学习行为,并依据分析结果重新调整教学活动,对学习困难的学生进行干预和指导,提高教学质量。
以我校2015级200多名学生为研究对象,以计算机应用基础必修课为切入点。该课程需要学生分3个学期完成64学时的教学内容,并以上海市统一的计算机等级考试成绩作为最终学习效果的检验标准。学生学习过程和行为跟踪数据,包括出勤率、课堂表现、在线浏览教学资源频次、历次课后练习和作业完成率(以在线实时测评系统形式),以及前2次学校组织的期末上机考试总成绩及分项成绩(命名为知识点1~9,见表1)。学生个人属性指标包括性别、生源地、高考成绩、民族等。学生学习效果定量指标为参加上海市计算机等级统考成绩。此外,利用微信平台,进行学习初期(问卷186份)和学习结束(问卷112份)2次在线调查,获取学生对课程目标和难度的感知、学习兴趣、学习满意度等变化情况。
表1 教学活动流程
学习分析的关键技术可参照数据挖掘的技术方法,如系统建模、分类、聚类、关联规则、决策树、回归、社会网络分析、话语分析及文本挖掘等。本文根据实验中课程和数据的特点,采用问卷调查、图表分析、聚类统计、回归预测的方法,遵循评估-预测-干预的反馈机制进一步改进和优化课程教学 (见图1)。 评估,主要是利用聚类分析方法,对学习行为特征相似的学生划分类型,分析各类学生的知识图谱、课程满意度,并辅助教师制定个性化的教学和辅导计划,安排教学进度;预测分析,主要是利用回归分析方法,以学生学习过程和行为跟踪数据为自变量,预测其可能的考试成绩或学习效果;干预,是根据评估和预测分析结果,判定每个学生是否存在学业风险,采取合适的对策和方法进行干预。
图1 研究框架图
经过数据清洗和预处理,删掉缺失严重的数据,共得到225个样本数据。在SPSS软件中,从学生个人属性、学习过程(投入)和学习绩效3个方面,共选取生源地、基础背景、作业完成率、自学进度、在线时长、登录次数、德育成绩、课堂表现、2次期末成绩、性别10个变量,与等级考试成绩进行相关性分析。10个变量的信度系数a=0.726,在可接受的范围内,具有统计学意义。相关分析结果(见表2)显示,等级考试成绩与前2学期的期末成绩、作业完成率、基础背景、自学进度等变量相关系数较高,与性别、生源地、在线时长、登录次数、课堂表现以及在校表现这些变量相关性较小,将其剔除。
表2 变量来源和等级考试成绩的相关性
在对学生的学习过程与学习结果进行记录与分析中,发现不少学生的学习行为呈现一定的相似性,可以归为一类,不同类型之间有明显的差异性,于是尝试应用聚类分析技术对学生学习行为进行类型划分,并发现不同类型学生的学习行为特点和规律。
在前述相关分析的基础上,选取相关性最高的5个变量进行聚类:学习基础、自学进度、作业完成率、课堂表现和前2学期考试成绩。首先,将5个变量数据进行标准化;然后,利用离差平方和法(基本原理是同类之间离差平方和较小,类与类之间离差平方和较大),指定 2~6个类别进行聚类分析,并进行反复试验;最后,根据聚类中心点的特征和不同类别之间的差异,将学生划分为为4类,分别命名为被动型、游离型、徒劳无功型,学有余力型,并分析不同类型学生的学习投入模式及其行为特征。
根据不同类型学生各个变量平均值分布雷达图(见图2),归纳出其各自特征。
结合实际课堂,不同类别同学的学习状况和学习特点总结如下:
(1) 学有余力型学生占25.5%,所有指标得分值都最高,各方面全面发展。在学完课程规定的知识和技能外,还具备进一步的拓展学习能力。 他们基础较好,课堂表现积极主动,具有较强自学能力,能独立完成学业任务。
(2) 徒劳无功型学生人数最多,占35.2%。他们基础一般,在校表现貌似很好,课堂出勤率也很高,各项行为中规中矩,但学习方法不对,自学能力不足,期末成绩并不理想。
(3) 游离型学生占26.2%,他们学习基础一般,学习目的不明确,学习态度不积极,有一定自学能力,不够努力和专心,期末成绩中等,学习成绩有很大提升空间。
(4) 被动型学生占13.1%,他们基础和自学能力较差,作业完成情况较差,成绩也较差,有自暴自弃倾向。
按照聚类分析的结果,又进一步统计了不同类型学生在2次期末考试中各知识点上的得分情况(见图3)。由图3可见,知识点8和9大部分学生都掌握较好,可以减少课时;但在知识点1上所有学生得分率均较低,应适当增加课时,重点讲解;在知识点2和3上,4类学生得分差距较大;在知识点4上,4类学生差距最小;在知识点5和7上,被动型学生和其他3类学生差异较大。以此为依据,可以合理调整教学重点和进度。
图3 不同类型学生知识图谱对比
计算机等级考试合格,是学生获得学位的必要条件之一,同时又是部分专升本考生计算机免试的条件,对于学校教学质量监控和学生的学业评估非常重要。因此,尝试利用已有学习过程监测数据,运用多元线性回归分析中的逐步回归方法,建立符合自变量和因变量之间关系的回归模型,以更好预测学生的学习成绩和效果。这里,以等级考试成绩(Y)为因变量,经过3次逐步回归,确定学习基础(X1)、期末考试成绩(X2)和作业完成率(X3)为自变量,建立回归方程:
Y=0.381X1+0.374X2+0.026X3+15.541
(1)
该方程显著性为0.000,拟合度R2为0.373,具体参数见表3。
表3 多元回归的相关系数
自变量系数的大小反映了对因变量影响的强弱程度。根据式(1),对计算机统考成绩影响程度从大到小依次是期末考试成绩、学习基础和作业完成率。进一步利用预测成绩与实际计算机统考成绩进行比对分析(见图4),以检验模型的有效性。参与建模人数为125人,预测人数为100人,预测不及格准确率为71.6%,预测及格准确率79.8%。基本符合预测效果。预测结果可为学生或教师提前发出预警和提醒,以便于及早加强干预。
图4 预测成绩与实际考试成绩对比图
大学生的学习效果很大程度上依赖于学生的自觉。如果教师对于学生的学习行为不能及时监测、评估、反馈和干预,学生的参与度、主动性和学习效果将会进一步降低。因此,需要从学习分析视角统计数据、建模、分析,使教师能够在数据支持下不断改进教学。结合学习初期和后期的2次问卷调查结果和前述的学习特征聚类结果,发现不同类型的学生对课程兴趣,对课程目标和难度的认知存在差异性(见图5)。例如,被动型和徒劳无功型学生对教学目标认识不清,完成学习任务有较大困难。针对该类学生,加强学习初期教育,端正学习态度,提高课程学习兴趣,改进学习体验,是教师改进教学工作的关键点。同时,按照不同类型学生的学习态度和能力,可更加有针对性地布置学习任务和作业,并通过作业和手机平台来督促和反馈每位学生的学习情况。这样教学过程能够体现学习者与教师之间的互动,在分类和预测的基础上干预和反馈,优化学习成绩和改进学习体验,提高教学效果。
图5 不同类型学生问卷结果对比
每周面授的课程,教师可以及时调整教学策略,并针对不同类型学生合理安排教学进度和内容。从对每个学生的情况中,做出合理判断和分析,对于徒劳无功学生,重点改进学习方法,提高效率;对于游离型学生,关注和纠正其学习态度和不良习惯;及时加强干预,帮助被动型学生解决学习困难,树立信心,对学有余力的学生适当拔高。针对不同类别的学生,结合不同类型学生的知识图谱,手机上推送预警消息和不同的学习资源,给予有效的引导和建议,激发兴趣,探索影响学生课程满意度的相关因素。对困难学生及时干预和预警,从最后实际的通过率来看,干预的措施对游离型学生效果较明显,被动型学生干预效果较差(见表4),需要调整策略进一步改进。
表4 对不同类型学生的干预及效果
以面授课堂上的学生为研究对象进行学习分析,从“计算机应用基础”课程前2个学期学生产生的学习投入、学习绩效和个人属性特征中筛选出 10个与等级考试成绩呈正相关的变量,确定了5个聚类因子,将具有相似性的学生分为4类,分类别统计知识图谱;选取3个影响学生等级考试成绩最大的学习行为因素构建了回归模型,并预测了学生成绩,筛选出困难学生;结合问卷结果,在第3学期的教学中有针对性地进行干预和反馈,根据对测试样本的验证,该方法可行有效。后续将继续营造信息化教学环境,尽力满足学生的多样化个性化的需求,转化多元异构数据,完善数据变量,改进预测模型,提高预测的准确性和反馈的实时性。