杨艺
【摘 要】 在高等教育领域已经储备有海量教学过程数据的背景下,强调了教学过程数据的价值,提出了大数据思维下基于教学活动流的分析模式,从数据采集、预处理到数据分析,最后进行预测建议。本文给出了具体的应用案例,借助真实的一线教学数据,并利用学习分析技术研究学生在学习过程中的实际参与表现和进展情况,分析相关性行为指标得出其间的相互关系,得到学生的学习行为规律,并根据分析结果进行指导和建议。分析结果可以优化学生的学习过程,为学生提供更有针对性的教学干预,推荐适宜的学习轨迹和学习方法;可以为教师改进课程设计、优化教学方法和改善现有的考核方式提供数据依据;可以为管理人员更好地实施教学管理提供决策支持。其目的就是让大数据开口说话,全面提升高等教育教学的质量。
【关键词】 大数据思维;教学过程;学习分析;数据处理;学习行为
【中图分类号】 G434 【文献标识码】 A 【文章编号】 1009—458x(2016)11—0022—06
一、引 言
随着全国各大高校教育信息化建设工作的推进,一些具体的教育数据在学校经年累月的信息化运行过程中不知不觉积累成为“大数据”。在这样的教育大数据背景下,高等教育各项工作要前进、要创新,必须借助数据这个财富顺势而为。这里提到的“大数据”并不仅仅指海量数据,更多的是一种“数据为大”的思维方式和问题解决方法(陈池,等,2014)。也就是说,注重对多元化数据进行全方位、全程化的收集,重视对尽可能全面的数据的深度挖掘和分析,从而发现数据背后的价值,以此来指导决策和提升洞察,减少传统惯性教育思维和个人偏好等因素的干扰。教学工作一直是整个教育工作的重中之重,因此,面向教学过程中的大数据研究及应用就显得尤为重要。
本研究的目的在于利用教学过程中的数据来辅助和指导学生的学习、教师的教授和管理者的决策。利用这些大数据可以:① 跟踪学生的学习行为。通过实时记录学生对知识点的掌握情况及其花费的时间和精力,可以更加真实地了解学生的学习状况,进行个性化辅导。② 辅助教师改进教学过程。通过调整教学目标和要求,改进教程设计,制定更加合理的教学大纲和授课计划,以及实施教学干预管理和开展课后补救等措施,改善学生的学习效果。③ 优化学习评价机制。通过数据分析对原有课程评价和考核机制进行纠偏,设计出有针对性的个性化评价考核机制,保证课程评价的客观性和科学性。
二、教学过程数据
教学过程是指教学活动的展开过程,是教师根据一定的社会要求和学生身心发展的特点,借助一定的教学媒介,指导学生与培养方案、课程计划或其他教学参与者所进行的交互活动的过程。它可以在传统的教学环境(如学校、教室、实验室等)及非传统的教学环境(如校外、室外等)中发生,也可以在传统的教学互动情境(如教师和学生之间的直接教学活动)或非传统的教学互动情境(如学生通过教学游戏、移动端交互APP进行学习)中(Glossary of Education Reform, 2013)发生。每一个教学过程都包含时间、地点和行为等因素。
(一)教学过程数据的价值
教学是学生与学习内容、环境、伙伴和教师之间复杂的交互过程,而这个过程中的基础数据就是教学过程数据,既包括学生和教师个人情况、学习内容、环境等静态数据,也包括学生对各种教学资源的操作等动态数据,以及这些因素之间的关系数据,这些经过多年累积下来的教学过程数据蕴含了巨大的分析价值(Bienkowski, Feng, & Means, 2012)。为此,可以建立称为教学过程记录仓库的系统来存储教学过程数据,例如学生在学习上投入的时间、对学习资源的利用行为、课堂中回答问题的表现、实验过程中的动手程度等,这些教学过程都值得记录。形成的大数据既可以帮助学生分析和优化学习过程,还可以帮助教师了解学生的学习行为特征,如学习参与度、理解能力以及与学习伙伴的互动协作等,从而可以对其学习过程和结果进行更全面、更客观、更科学的评估(Duhon, 2014)。
(二)教学过程数据的获取
可以从三种途径获取教学过程数据。对于作业、测试、问题评论以及教师的评分等静态数据,可以通过传统手工采集,或通过网络教学平台中课程管理系统自动采集;对于学生学习过程中的行为数据,如浏览学习内容次数、练习时间、下载资料文件次数等数据,可以借助网络教学平台中课程管理系统生成的日志数据;对于学生上课出勤率、回答问题表现、实验实训的投入程度等需要现场及时采集的数据,可以采用传统手工方式,也可以采用移动终端APP进行采集和记录,这部分数据采集的关键是及时性。
(三)数据的互操作问题
虽然目前大多数教育领域已经实现了信息化,但是其所部署的信息系统一般都采用封闭的系统架构,各系统之间彼此独立,因而造成数据孤岛,不同系统之间的数据缺乏互操作性,即各系统的数据不能整合、共享,以便用于数据分析(Bienkowski et al., 2012)。比如教务信息系统、网络教学管理系统、平时教师考勤系统以及评价系统等的数据就不可互用。因此,在数据采集完成后,还要考虑统一数据格式问题,除了要对数据进行名、型、值的统一,还要找出数据之间的关联关系。因此,还需要将采集的数据映射到数据分析所需的教学过程记录仓库中进行预处理,以便能让原始数据转化为可供分析之用的“数据的数据”(Global Pulse, 2012)。
三、学习分析技术与教学活动流
(一)学习分析技术
学习分析是近年来大数据在教育领域较为典型的应用,其实质就是通过不同的数据模型和分析方法对学习者的学习数据进行分析,并用分析结果探究学习过程,发现学习规律,阐释学习表现,从而促进更有效的学习(顾小清,等,2012)。另外,随着网络学习及相关学习管理系统的不断普及,数据分析挖掘方法在学习管理系统中得到应用,相关的研究和实践也表明,学习分析技术对于学生、教师、管理人员等都具有重要价值:可以分析学生的学习行为数据来优化学习过程;可以分析教学数据来改进教学过程和进行针对性的教学干预(Chen, Heritage, & Lee, 2005)。另外,学习分析技术的开展有赖于系统化、结构化的海量数据,而高等教育在十年前就开始全面推行采用网络课程系统和教育管理信息系统,已经积累了大量系统化、结构化的数据,这也为学习分析奠定了不可或缺的数据基础。
(二)教学活动流分析模式构建
1. 定义教学活动流
学生的学习是教学分析的主要对象,除此之外,还有教师的教授和引导,以及管理人员采取的管理措施和标准。通过对教学过程数据的分析,可以进一步细化教学分析的各种对象,从而界定出各种教学情境,并构建特定的分析模式。这里定义一种教学活动流来对教、学、管交互行为进行建模,这种流最终会以具有语义结构的数据形式存在,主要包含以下几种元素:人员实体、动作、时间、地点、工具、对象和结论,这种教学活动流数据保持了教学情境的意义(Duhon, 2014)。其中,人员实体是对象的操作者,如学生、教师、管理人员等;动作代表教、学、管过程的行为,如教授、听课、阅读、批评等;时间是动作发生的时间;地点是动作发生的地点;工具是用于教学的器具或手段,如电脑、手机、网络等;对象是人员实体实施动作的客体,如一种教学活动或一种学习对象,与动作相组合具有实质的意义;结论一般指关于动作经测量得到的输出结果的信息,如考试成绩、教学效果、学习反馈等。举例来说,这七种元素可组合为一组简洁的教学活动流格式:<人员实体,动作,时间,地点,工具,对象,结论>。利用这种格式的教学活动流对传统教学过程行为描述为:“某教师(人员实体)某年某月某日某时(时间)在某教室(地点)上(动作)了某课程(对象)”;而在非正式教学情景中描述教学过程行为可以是:“某学生(人员实体)某年某月某日某时(时间)在网络教学平台(地点)在线观看了(动作)某个知识点的程序演示(对象)”。
2. 利用教学活动流记录教学过程数据
教学过程数据可以来自多种教学环境或平台,包括正式课堂、基于网络的非正式学习和手机APP等。其记录的数据不仅包括诸如成绩、作业完成情况等传统教学过程数据,也包括教师和学生的行为日志记录,如“批改了一次作业”“使用APP进行了一次在线答疑”或“看了一篇文献”等。教学活动流是来自目前教学过程的映射,利用教学活动流可以记录教学过程数据。简言之,教学过程可以被分解为若干活动场景,人员实体在这些场景中进行一系列动作,动作过程中会用到一些工具作用到对象上,还会与其他一些人员实体发生交互,然后通过各种考核方式得到效果反馈,最后可根据反馈对教学目标及要求进行调整(顾小清,等,2014)。这样,可以归纳出一个简单的教学过程模型(如图1所示)。在这一模型的基础上,教学活动分析就是通过对观察到的“人员实体—动作—时间—地点—工具—对象—结论”行为数据进行理解和分析,然后回溯挖掘隐藏的过程信息,为教学目标及要求的调整以及对教学过程及其活动场景的组织和优化提供依据(郁晓华,等,2013)。
3. 教学活动流的分析架构
基于上述定义的教学活动流,可以进行以下一系列分析:①用于回答“谁在学(教、管)”的人员实体特征分析;②用于回答“学(教、管)什么、如何学(教、管)”的教学过程分析;③用于回答“学(教、管)的结果如何”的教学结果分析(魏顺平,2013)。教学过程分析因应用目标和服务对象的不同而有着不同的内容取向和技术方法,本文对于教学活动流的学习分析研究,聚焦于发现学生在学习行为背后所隐藏的内容与需求的关联,进一步从掌握的数据中揭露学生的需求与问题和教与学之间的偏差,从而为教学方法的改进、教学资源的提升、教学过程的优化和评价方式的修正等提供保证。
教学活动流的分析过程包括数据采集、数据预处理、数据分析和预测建议四个关键环节,整个功能架构如图2所示。采集模块将教学主体在各教学环境中的活动数据聚合到一起,对这些异源数据进行格式等的预处理后导入教学活动流库中,联合用户模型和工具与算法模型对这些数据进行统计分析和关联挖掘,根据分析结果洞察学生的学习意图或面临的教学问题,再反馈到教学目标和要求,对教学活动和评价方式进行调整和修正。
四、教学活动流的分析应用
根据前文提出的教学活动流分析模式,其分析应用过程就是在各种教学环境下对教师教授和学生学习过程中的知识发现和信息提取的过程。这些处理后的信息就是经过加工的教学过程数据,对教师和学生的决策或行为有现实的或潜在的价值。这里以同一门课程前后几届学生的累积数据作为样本进行分析,由于是同一任课教师教授的同一门课程,几乎可以不考虑课程内容、教授方式等人为因素带来的数据误差。
(一)数据采集
随着信息技术向教育领域渗透,传统课堂正在向传统课堂+数字课堂,甚至纯数字课堂演变,这里的基础教学过程数据主要来源于三个方面:传统课堂,网络学习系统和教务管理系统,以及移动端APP。
传统课堂的数据采集主要靠手工记录,记录的内容主要是师生实时教学过程中产生的行为记录,比如考勤、提问、发言等;网络学习系统和教务管理系统上的数据采集可以通过日志数据或系统功能自动进行统计,比如登录次数、在线时长、浏览或下载资源次数、提交作业次数、课程成绩等;移动端APP采用的是金蝶公司的云之家移动办公平台,按照某个班级的不同课程,或某门课程的不同班级生成圈子,在圈子中进行课后师生互动,比如知识讨论、讯息通知、问题解答等,使用方便灵活,更重要的是可以部署为私有云,便于各种数据的采集。
(二)数据预处理
方海光等(2014)认为:数据预处理就是对第一步采集到的基础数据进行整理、集成、筛选和转换,使之符合前述定义的教学活动流结构。这一阶段的工作,一部分需要手工处理,一部分可以通过工具或编码实现。基础数据预处理后的结果如表1所示。
(三)数据分析
数据分析就是通过分析学生在各种学习环境中的学习时间投入、课程完成情况、资源利用情况、考试成绩等数据,得出学习行为和学习效果之间的关系,应用分析结论来指导教学过程的参与者对学习过程进行必要的干预,同时为课程设计者提供实时改进教学设计和评价考核的依据,以提升教学效果,本文使用的学习分析技术主要是相关性统计分析。
1. 分析模型中指标变量的选择
学习分析设计的关键是选定用哪些数据作为指标进行分析(王亮,2015)。这里主要考虑行为表现指标变量,即在教学过程中学生的学习行为和阶段性表现。因为这类变量几乎都可以量化,易于从纸质记录或网络系统中获取。在对教学活动流库中的数据进行初步考察后,确定作为分析指标的数据为以下三类:第一,衡量学生成绩表现的指标变量,该变量关注的是学生的实时学习成果,如平时作业成绩、各类测试成绩、随堂提问成绩等;第二,衡量学生学习主观努力程度的指标,如网络学习平台的登录次数和频率、在学习资源上花费的时间、参与客户端APP知识讨论次数等;第三,这个指标是很有意思的一类指标,并不是从学生的学习能力、主动性方面来考虑,而是从学生的人格品质上来考虑,就是诚信指标变量,即学生在学习过程中有没有弄虚作假的行为,如抄袭作业、由别人代替登录上网等。
2. 任课教师视角的教学活动流分析应用
对任课教师来说,可以以所负责的某门课程开展教学分析。本文以作者所教同一门课程七届学生数据集作为研究对象,以学生学号作为数据集唯一区分标识。表2所示的是其中一个班级该门课程的五个教学过程行为指标变量数据统计表(部分数据)。
采用相关系数来测试五个行为指标变量与期末总评成绩之间的相关程度。利用公式(1)根据表2的数据计算相关系数,得到表3。
式中r描述的是两个变量之间线性相关的强弱程度。r的取值在-1与+1之间,若r>0,表明两个变量是正相关的;若r<0,表明两个变量是负相关的,r的绝对值越大表明相关性越强。描述表2中“平时作业总评”“网络教学平台登录次数”“下载资源次数”“上课考勤次数”“抄袭作业次数”五个指标中每个学号对应的分数,为其平均值;描述表2中“期末总评成绩”指标中每个学号对应的分数,为其平均值。
从表3可以看出,前三项行为指标变量与期末总评成绩的相关程度大于50%,其中网络教学平台登录次数和下载资源次数的相关程度均超过65%,后两项的相关程度低些,且抄袭作业次数是负相关的。同样,对这七届学生其他班级也进行同样分析,也呈现一致的规律。说明平时教学过程对最终教学效果的影响是不容忽视的,应该予以重视。
(四)预测建议
通过上述数据分析可以预测,学生在课程学习过程中的主观努力程度是决定学生课程成败与否的重要因素。通过改进课程设计、教学评价和对学生进行人工干预可以改善学生的主观努力程度。据此,任课教师从以下几方面进行了改革:第一,准备了更加充足的教学辅助资源上传到网络教学平台,强调学生必须利用课后时间浏览下载资源辅助学习;第二,在课程考核方面增加了平时成绩比重,比如从原来平时占20%,增加为30%—40%,甚至到50%;第三,加强教师对辅助教学平台数据的监控,缩短平台日志的浏览时间,一旦发现有异常的学生,及时给予提醒;第四,针对作业抄袭这一问题,通过一些技术手段来制约,比如要求学生在完成相同作业任务后,必须写一段针对该部分作业的感受体会,作业评分会向这部分描述倾斜;第五,了解班上的后进生,为他们安排一对一帮扶,加大其考勤和课堂提问频率,加强平时学习过程的监控。
通过这样的改革后,相同的课程,在第七届学生的教学过程中,各项行为指标变量和最后的期末过关率都有了一定的好转和提高。最值得欣慰的是:第一,班上一名濒临拿不到学位的学生,通过该门课程的学习,不仅增强了学习主动性,而且期末也顺利通过考试;第二,班上抄袭作业的风气得到遏制,几乎杜绝了这一现象。
五、教学活动流分析的实际应用意义
随着师生教学过程的推进,包括作业成绩、网络资源使用情况、讨论参与度等主观行为数据也在不断增加。因此,教学活动流的分析结果也会更加准确和动态变化,分析结果可以应用于管理者、教师以及学生等多种用户,让其了解当前现状及其影响因素,以优化教学过程。
(一)应用于管理者
作为教学管理者,可以根据分析结果了解某个办学机构的整体教学情况,如师生的各类教学活动总量及平均情况,各类教学资源的利用情况,当前教学计划的进展情况,以及是否出现偏离“轨道”的意外状况等,以便从宏观上对整体教学秩序和教学模式进行掌控和调整。
(二)应用于教师
对于教师而言,可以从自己承担的教学任务开展教学分析,分析内容包括学生学习行为统计描述、师生交互行为分析、影响学生学习表现的各种因素分析等。通过分析可以了解学生学习的现状,从而有助于掌握学生的学习习惯,及时调整课程设计和教学方案。另外,还可向高风险学生发出预警信号,与他们进行及时沟通交流,并提供必要的方法引导和思想疏导,避免教学失败,将教学质量落到实处。
(三)应用于学生
对于学生而言,目前的网络教学平台都具备完善的日志功能,记录了对每个模块的访问及行为方式,它的“统计报表”模块可让学生了解自己一段时间的学习行为。教学活动流库中的数据分析也可以让学生了解自己的学习行为表现,以及和其他同学的差距,通过对比起到后进赶先进的促进作用。
六、结论和展望
随着数字化校园建设和网络辅助教学工具等信息化工程在教育领域的大力推进,积累了海量的教学过程数据,如何采集、处理、分析和利用这些数据,让这些数据“活”起来,“开口”说话,为教学决策、过程优化、效果提升提供重要数据依据已成为教育工作者和广大学生关注的内容。本文提出的教学活动流分析应用起到了抛砖引玉的作用。在后续的研究中,还可从以下两个方面进一步深入:①多样化分析内容。除了本文分析的教学过程行为指标之外,还有很多内容也可以分析,如旷课学生统计、期末成绩分布、教学工具使用偏好统计、考试作弊行为统计、上网时间分布、师生交互情况分析等,可以根据教学规律归纳出若干有针对性的分析任务,为各个教学部门提供建议和决策支持。②采用多种分析方法和工具。除了采用相关性分析之外,还可以选择聚类、关联规则及可视化等分析方法和工具,并研究其适用的领域。
[参考文献]
陈池,王宇鹏,李超,张勇,邢春晓. 2014. 面向在线教育领域的大数据研究及应用[J]. 计算机研究与发展(51):67-71.
方海光,侯伟锋,王晓春,楚云海. 2014. 基于PADClass 模型的数字化课堂学习过程数据挖掘与分析研究[J]. 电化教育研究(18):110-113.
顾小清,张进良,蔡慧英. 2012. 学习分析:正在浮现中的数据技 术[J]. 远程教育杂志(1):18-25.
顾小清,郑隆威,简菁. 2014. 获取教育大数据:基于xAPI规范对学习经历数据的获取与共享[J]. 现代远程教育研究(5):13-23.
王亮. 2015. 学习分析技术建立学习预测模型[J]. 实验室研究与探索(1):215-218.
魏顺平. 2013. 学习分析技术:挖掘大数据时代下教育数据的价值[J]. 现代教育技术(2):5-11.
郁晓华,顾小清. 2013. 学习活动流:一个学习分析的行为模型[J]. 远程教育杂志(4):20-28.
Bienkowski,M., Feng,M. & Means,B. 2012. Enhancing Teaching and Learning Through Educational Data Mining and Learning Analytics: An Issue Brief. Retrieved May 13, 2016, from http://www.doc88.com/p-6611144862305.html Chen, E., Heritage, M., & Lee, J. 2005. Identifying and Monitoring StudentsLearning Needs With Technology[J]. Journal of Education for Students Placed at Risk, 10(3),309-332.
Duhon, R. 2014. Mapping Learning into the Experience API. Retrieved May 13, 2016, from https://www.td.org/Publications/Magazines/TD/TD-Archive/2014/01/Mapping-Learning-Into-the-Xapi
Global Pulse. 2012. Big Data for Development: Challenges & Opportunities. Retrieved May 13, 2016, from http://www.chinacloud.cn/upload/2012-07/12071822344575.pdf
Glossary of Education Reform. 2013. Learning Experience. Retrieved May 13, 2016, from http://edglossary.org/learning-experience/
责任编辑 韩世梅