吴雅娟,杨壮壮,尚福华,解红涛,杜睿山
(东北石油大学计算机与信息技术学院,黑龙江大庆 163318)
射孔取心工培训系统对油田工人在射孔取心等领域知识的学习有着重要意义[1],但其存在着缺少对学习者学习状态的深入分析及学习者无法实时了解自己学习状况等问题。学习仪表盘正是学习分析领域典型的数据可视化工具,它通过收集到的数据对学习行为和学习信息进行可视化,并评估学习者学习状态,预测学习结果,促进学习者自我监控、自我反思[2]。
目前国内文献对学习仪表盘的研究较少,且多以科普形式介绍国内外学习仪表盘的发展现状及成果。张振虹等人分析并阐述了国内外相对成熟的学习仪表盘特征、功能及发展趋势,并指出未来学习仪表盘的优化方向[3]。姜强等人在对学习仪表盘发展现状进行梳理后,分别设计了针对个人、同伴和班级的学习仪表盘[4]。但学习分析研究领域并没有明确学习仪表盘的功能,使学习仪表盘的展示内容与功能呈现多样性,这也导致多数在线学习平台的学习仪表盘缺少科学性与规范化设计,学习者学习效果与学习行为的关系缺少深入挖掘,学习者无法凭借展示的信息深入了解自己真实的学习状况。如何规范化设计学习仪表盘的呈现内容及如何深入分析学习者学习状况成为学习仪表盘研究亟待解决的问题。
本文以学习者、呈现内容、呈现形式等为核心要素对学习仪表盘框架进行设计;运用逻辑回归分析数据,确定学习效果的影响因素,构建出学习效果与影响因素的关系模型,并将学习效果影响因素作为学习仪表盘呈现的核心内容;融入油田射孔取心工领域知识图谱,从学习行为、知识点掌握情况等多维度分析学习者学习状态,并提供指导与建议。最后将学习仪表盘应用于油田射孔取心工培训系统,通过实际应用进行效果验证。
实现学习仪表盘在射孔取心工培训系统中的应用首先需要对其框架进行设计,学习仪表盘呈现的形式与内容决定着学习者在线学习过程中的自我认知,影响着后续学习进程。因此,以符合学习规律的教育理念作为支撑,对学习仪表盘的呈现形式与内容进行规范化、科学性的设计具有必要性。本文以油田射孔取心工培训系统为基础,以给谁使用、呈现什么、怎么呈现作为核心要素,基于已有研究[5]以使用者确定层、指标选择层、数据处理层、内容呈现层、呈现形式层作为设计框架对学习仪表盘进行设计,见图1。
图1 学习仪表盘设计框架Fig.1 Learning dashboard design framework
学习者作为学习过程的主体是整个设计框架的核心。随着信息化的发展,各行各业的人群都需要进行学习,都有成为“学习者”的可能。因此,设计学习仪表盘首先要解决的问题就是“给谁使用”。不同年龄与职业的学习者有着不同的学习目的和学习期望,而且兴趣和偏好也存在差别,确定使用者的群体特征是设计成功的关键。而射孔取心工培训系统是针对油田领域职业为“射孔取心”的工人进行职业培训,其使用者确定为成人学习者。使用者确定层指导着指标选择层、数据处理层、内容呈现层和呈现形式层。
选择指标的目的是筛选学习信息,为分析学习效果的影响因素提供支持。指标的选择受到使用者群体特征的影响。射孔取心工培训系统作为成人职业培训平台,其使用者具有成人学习者的特征。在对成人学习分析的研究中,Park从性别、年龄、教育程度、家庭支持、组织支持、学习者满意度等变量对成人学习者的辍学率进行研究[6]。本研究参考已有的研究成果并结合开发的成人培训系统的独特性,从学习者基本信息、测试情况、行为特征等三个维度十三个指标对学业状态的影响因素进行分析研究,见表1。
表1 变量指标统计Tab.1 Variable index statistics
收集到指标选择层确定的数据指标后,如何对数据进行处理直接影响着学习分析效果的好坏,决定着学习仪表盘是否具有使用价值。当前对在线学习效果影响因素的研究常用方法包括聚类、分类、回归、关系树、关联规则挖掘、序列模式挖掘等[7]。其中逻辑回归(Logistic 回归)可以根据多个离散型或连续型的自变量对离散型的因变量进行预测分析。二元逻辑回归其因变量为两个类别的值,可以对射孔取心工培训系统中学习者学业状态(安全与危险)的影响因素进行分析来构建学业状态预测模型。
本研究遵循科学性、规范性原则并结合射孔取心工培训系统的特点将学习仪表盘的主要呈现内容分为三类。第一类直接展示随着时间的推移学习者课程学习情况,如学习进度、练习测试成绩、知识点掌握情况等。第二类展示经过数据分析后确定的对学习效果产生重要影响的变量指标,如系统登录次数、鼠标点击次数、讨论情况、在线时长、测试成绩等。第三类内容需要较为深入的数据分析后才能进行展示,如学习努力指数、学业状态预测、指导与建议等。
学习仪表盘常见的呈现形式有文字、数值、表格、图(折线图、柱状图、散点图、雷达图等)等。此外,为激发射孔取心工培训系统使用者的学习兴趣,以信号灯展示学习者的当前学习状态,以勋章形式奖励每次测试成绩超过90 分的学习者,以三维化的表格展示学习者知识点学习进度等。
学习仪表盘的关键技术主要包括:学业状态预测模型构建和学习状态分析结果展示。学业状态预测模型一方面用于对处于学业危险状态的学习者进行预警,另一方面模型中与学业状态呈显著相关的变量指标作为学习仪表盘展示的核心内容。为实现深入分析与建议,本研究根据已构建的射孔取心工领域知识图谱并结合影响学业状态的主要因素对学习状况进行分析与可视化,根据当前在学习行为与知识点上存在的问题进行具体的指导与建议。
2.1.1 前期分析与预处理
经过对射孔取心工培训系统使用者的信息进行前期分析发现,学习者大部分为男性且受教育程度大致相同,因此将变量指标中的性别和受教育程度剔除。每个学习者单机测试的平均成绩与联网测试平均成绩相似度高,如果两个变量都代入回归模型会干扰模型的构建,影响预测的准确度,因此剔除单机测试平均成绩指标,选择将联网测试平均成绩指标代入回归模型。学习者的联网测试次数都大致相同,经调查了解联网测试是班级统一组织,联网测试次数无法对预测模型产生影响,因此剔除联网测试次数变量指标。
本研究使用数据统计分析软件SPSS 将年龄、是否婚配、联网测试成绩、发起讨论数、回复讨论数、鼠标点击次数、系统登录时长、系统登录次数等八个指标与学业状态(期末考试成绩低于60 分为处于学业危险状态,高于或者等于60 分为安全状态)进行相关性分析[8],见表2。
表2 自变量与学业状态的相关性分析Tab.2 Correlation analysis between independent variables and academic status
通过表2 可以看出,是否婚配、发起讨论数、鼠标点击次数三个指标与学业危险状态没有显著相关性。而年龄、联网测试成绩、回复讨论数、系统登录时长,系统登录次数与学业状态在0.05 水平上显著相关,因此将学业危险状态作为因变量,将上述五个指标作为自变量代入到回归模型中。
2.1.2 构建模型
本研究以二元逻辑回归对学业安全状态的发生概率进行预测,设P为学业安全状态的发生概率,则(1-P)为危险状态的概率,P/(1-P)为学业危险状态的逻辑回归发生比,再取自然对数为ln [P/(1 -P) ]。设自变量为X1,X2,· · ·,Xn,因变量为P,则逻辑回归方程表达式表示为
因此可得出预测学业安全状态概率的方程式为
其中,
使用SPSS 22 将射孔取心工培训系统中与学业状态呈显著相关的100 条指标数据作为训练样本代入到二元逻辑回归方程分析,见表3。
由表3可以得出
将公式(4)代入到公式(2)即可得出最终的预测学业安全状态概率方程。
2.1.3 实验验证
为验证得出的学业状态预测模型的有效性,将83个测试样本的数据代入方程中进行预测结果与实际结果的对比,结果见表4。
表4 预测结果与实际结果对比Tab.4 Comparison between the predicted results and the actual results
其中预测结果为“安全”状态的71个样本中,实际为“安全”状态的样本个数是69个;预测结果为“危险”状态的12个样本中,实际为“危险”状态的样本个数是6个。最终预测结果中有75个与实际结果一致,预测准确率为90.4%,表明该模型有较高的准确性与适用性。
2.2.1 知识点掌握情况可视化展示
知识点掌握情况的可视化展示:一是图形展示,将已经学习但未掌握的知识点变为红色,并根据知识点之间的关系生成学习路径。二是文字提示,对当前出现问题的具体知识点进行描述,并结合学业状态预测模型对学习行为提出具体建议。知识点的可视化借助射孔取心工领域知识图谱进行表示。
射孔取心工领域知识图谱的知识元分为章、节、知识点三种。知识元之间的关系包括:章与节、节与知识点的包含关系;知识点之间的前驱关系、后继关系和并列关系。且包含关系、前驱关系、后继关系、并列关系都具有传递性。以射孔取心工理论知识中“技师”章为例,共11 节,172 个知识点。用“hasPartOf”表示包含关系,“isDescendentOf”表示前驱 关系,“isApposedWith”表示并列关系[9]。通过构建出的射孔取心工领域知识图谱实现知识点掌握情况的分析与可视化,见图2。
图2 “智能分析”页面Fig.2 “Intelligent analysis”page
2.2.2 学习行为可视化展示
仅有知识点的掌握情况无法全方位了解学习者学习状况,还需要对学业状态预测模型中影响成绩的重要因素,如联网测试成绩、系统登录时长、系统登录次数、发起讨论数、回复讨论数等进行分析与可视化。使用开源的数据可视化工具——ECharts 图表库,借助其提供的柱状图、折线图、饼图、气泡图、雷达图等对学习行为进行展示。通过学业状态预测模型对当前学习者的学习状态进行分析与可视化展示,见图3。
图3 “学情总览”页面Fig.3 “Learning situation overview”page
在原射孔取心工培训系统中加入学习仪表盘功能,并在油田试油试采公司进行测试与使用。经过两个月的跟踪调查并对183 位员工的学习数据进行整理分析,结果显示,使用加入学习仪表盘功能的射孔取心工培训系统的员工平均每周在线时长从11.2小时上涨至13.1小时,培训合格率从86%提升至92%。
通过发放150 份调查问卷了解使用者对学习仪表盘的满意度,调查结果如表5所示。
表5 学习仪表盘使用评价Tab.5 Evaluation of learning dashboard
其中78% 的使用者认为学习仪表盘有助于实时了解学习状态;62% 的使用者认为学习仪表盘能激发学习兴趣;58% 的使用者认为有助于明确学习目标;70%的使用者认为有利于提高学习效果;86% 的使用者认为学习仪表盘的培训系统优于原有培训系统。
综合以上数据可以得出,学习仪表盘能激发学习者学习兴趣,帮助学习者实时掌握自己的学习状态,明确学习目标,有利于提高学习效果。将学习仪表盘应用于射孔取心工培训系统增加了使用者的学习时长,提升了测试成绩,提高了射孔取心工培训系统的培训效率。
在线学习过程中学习状态分析与可视化对促进学习者的自我监督、提高教学效率有着重要意义。学习仪表盘作为学习数据可视化的载体,学习分析领域对其研究正逐渐深入。就学习仪表盘存在的呈现内容不规范以及对学习者学习状态分析不够全面和深入的问题,本研究设计出学习仪表盘的设计框架,为呈现规范化、科学性的学习信息做支撑。并在学习仪表盘中融入射孔取心工领域知识图谱,多维度分析学习者学习状态,从学习行为、学习路径等角度对学习者提出具体建议。将学习仪表盘应用到射孔取心工培训系统后,使用者每周学习时间增加,平均测试成绩提升,明显提高了射孔取心工培训系统的培训效率。