学习者学习行为分析及应对策略的研究

2019-11-11 10:53代红崔文华张文宇欧阳鑫玉
教书育人·高教论坛 2019年10期

代红 崔文华 张文宇 欧阳鑫玉

[摘 要] 智能学习环境下随时随地可以进行学习的方式是人类学习方式的重大变革,也为人类能够进行终身学习提供机会。本文使用哈佛大学和麻省理工学院的edX在线学习平台公开的数据集进行统计分析,同时使用K-MEANS聚类算法对edX平台上具有中国国籍网络学习者的学习行为信息进行挖掘分析,得出不同类型学习者的学习行为模式。针对得到的学习者学习行为分析模型提出网络学习绩效提高的策略和建议。

[关键词] 学习行为分析;在线学习平台;学习绩效

[中图分类号] G642    [文献标志码] A [文章编号] 1008-2549(2019) 10-0076-03

随着无线通信技术的发展和智能手机的广泛应用,2014年至2018年至今,对网络学习行为的研究热度在持续上升,论文数量达到533篇,是过去十年的1.21倍。利用学习者的网络学习行为数据,并借助数据挖掘、机器学习技术进行学习者学习结果分析,可以对学习者给出更客观全面的学习评价,同时也为教育管理者的政策制定、教师的教学干预和学习者的自我调整提供参考和指导。通过阅读文献,总结对学习者学习行为数据分析上的研究还存在以下不足:(1)多数研究者使用的是本校部分学科学生网络学习行为的数据,受学习环境影响,数据缺乏通用性、代表性且样本数量小。(2)多数研究是以对知识点的学习次数为特征属性,缺少学习交互次数、学习频度等特征属性的关联分析。为此本文使用哈佛大学和麻省理工学院开放的数据集从智能环境下的网络学习行为分析方法入手,采用力求特征集中的特征数据为建立准确模型的贡献率最大的方法,构建有利于提高学习者学习绩效的分析预测模型,同时对教学干预提供参考建议。

一网络学习行为分析的发展研究

伴随物联网、云计算以及大数据等新技术的出现,智能学习环境下学习者的学习方式正在逐渐发生变革。2006年《中国电化教育》期刊上华中师范大学彭文辉老师的一篇题目为“网络学习行为分析及其模型研究”的论文中第一次对网络学习行为的概念进行了总结定义,同时他在对2004~2013年这个时间段我国网络学习行为期刊论文的内容分析进行了调查研究。由于网络学习方式场景多元化,多层面获取知识实时、方便和快捷等优势,改变了学习者学习习惯和学习态度,对实现学习者终身教育也很有帮助。但是如果在学习行为分析后除了给出适合学习者的学习模式,进行有效学习建议反馈和学习路径推荐之外,对学习者进行一定的学习行为预测和干预,将会对学习者的学习绩效提升更有意义。

二 智能学习环境下学习者分析模型

1 学习者学习特征属性的选择

学习者的学习行为分为显性和隐性。学习者显性学习行为一般是操作层面的行为日志信息,如评价、交流、答疑、测验、讨论、分享、创作等反映在交互文本上信息,以及学习事件次数、学习时长、学习重复率、学习时间跨度等统计出来的数据。学习者隐性学习行为一般需要通过数据筛选、过滤、挖掘分析出来,同时进行信度度量,如学习动机、学习目的和学习目标等信息。本文研究使用的数据来源于edX 2014年发布的数据集——“HMXPC13_ DI_ v2_ 5-14-14.csv”,如表1所示。哈佛大学和麻省理工学院的edX数据并没有提供长期学习行为模式的信息,如论坛帖子是否随时间而增加或减少,视频访问是否随时间而改变等等(见表1)。

在edX公开数据集中共包含641138个实例,其中标注中国国籍的学习者5170个实例。开放数据集的20个列项按照内容归纳成五大类,即课程信息类、学习者基本信息、学习者类型信息、学习者行为信息和其他。其中按照edX开放数据集中给出的学习者特征属性信息,将学习者类型又分为注册者(registered)、浏览者(viewed)、探索者(explored)和获得证书者(certified)。平台要求先注册才能进一步学习,因此开发数据集中的所有实例学习类型均先为注册者。在学习者注册时有些信息并未输入,如性别,为此在数据集上留有空白或者标注N/A。本文对学习者学习行为进行分析,因此使用学习者行为信息建立学习分析模型,将学习者类型的特征属性信息作为建立模型的标签,且只对国籍为中国的学生进行学习者学习行为分析。这样在不降低模型建立准确性的前提下,既减少了模型建立的冗余属性,节省了存储空间,同时也加快了模型建立的时间。

2 学习者学习行为分析模型

(1)学习者基本信息分析

通過对edX平台上的16门课程开放数据的统计,对全球学习者类型与中国学习者类型进行了对比,全球大部分学习者以浏览者学习类型数量居多,同时也能够得到中国学习者数量占全球学习者数量的0.81%,其中中国学习者在edX平台通过学习获得证书者占全球学习者获得证书数量的0.35%。根据有标注性别的信息统计(标注N/A和空白不在统计之列),在中国学习者中男性数量偏大,且大多数属于浏览性质的学习。

对于身份经过申请认证的获得证书学习者来说,数量方面男女相差不大,尤其是女性学习者在进行探索性学习后大部分都能获得证书,说明女性学习者的学习目的很明确,需要拿到证书。在获得证书的学习者中专门对学历和性别进行统计,学历高的学习者不太重视在平台上获得证书,学历偏低的人群更注重证书的获得。除了向在线学习者提供普通证书课程之外,其还与德州公立大学系统开展合作,开发“线上”与“线下”相结合的学分课程,这样既方便了德州公立大学系统内的学生选修通识课程学分,又使课程学分在大学系统内得到充分认可,将在线教育正式纳入正统学位教育,为此分析出学历偏低的学习者更希望通过课程认证增加求职的机会。

由于学习者行为信息不能通过简单的统计分析出学习者行为模式,现只对针对中国学习者进行研究分析,选取了反应学习者行为信息的课程交互次数、课程访问天数、播放视频次数、学习章节数和论坛发帖数特征属性作为学习行为分析的客观依据,以注册者(registered)、浏览者(viewed)、探索者(explored)和获得证书者(certified)为模型的类别标签。采用挖掘分析,建立学习者行为分析预测模型。

(2)学习者学习行为分析模型

由于K-MEANS算法在处理大数据时算法简单、具有收敛速度快等优点,为此本文使用此算法进行学习分析模型的建立。首先对HMXPC13_ DI_ v2_ 5-14-14.csv开放数据集进行预处理使其满足数据挖掘工具软件Weka的格式导入要求,导入后使用K-MEANS算法进行聚类分析。以获得证书者聚类模型为例,对获得证书者数据用K-Means算法迭代八次,初始产生了两个中心点,最终有62个instances聚合为一类,5108个instances聚合为一类,建模时间为0.12秒。对其他学习者类型采用同样K-MEANS算法可以建模。

(3)结果剖析

通过数据挖掘统计结果,可以得出中国学生课程平均交互次数为144.86次,平均访问天数3.33天,平均播放视频次数为64.26次,平均学习章节数2.904,中国学生不论是否获得证书均没有论坛发帖,即平均论坛发贴数为0。获得证书者课程平均交互次数s为3854.90次,平均访问天数38.94天,平均播放视频次数为200.17次,平均学习章节数16.69,获得证书者在课程交互次数和访问天数均远高于学习者平均水平。在使用K-MEANS算法对其他学习者类型建立模型后总结归纳得到表2学习者行为对比信息。

从表中信息得到中国学习者不论是哪种学习者类型都比较喜欢通过观看视频方式获取知识,因为观看视频方式作为网络学习最大优点是可以对不懂之处反复学习观看,且相对于自己浏览学习章节更能够吸引学习者注意力。如果视频制作能够短小精悍、有针对性地介绍某个知识点,且能够引入多种元素进行介绍,会有更多的学习者愿意采用此种方式进行网络学习。从学习频度和学习交互次数上看,获得证书者和探索者的网络学习投入的时间和精力远高于一般浏览者,说明开放学习平台是学习者获取知识的有效途径之一。为此合理地设计课程和组织课程学习资源,并在学习社区上请专家和名师参与互动,可以更有利于调动学习者的参与度,从而使优质资源共享得到最大利用。而获得证书者在不同学习者类型中投入网络学习的时间和精力值是最大的,其中课程平均交互次数远远大于其他类型学习者,但是获得证书者和其他类型学习者在国外论坛从未发帖,而在国内网站上通过在论坛发帖获得帮助是很常见的。分析原因在于文化背景、语言习惯或者使用方式上有一定差异导致这种网络学习方式在有多国学习者环境中被遗弃。

三 提高网络学习绩效的策略和建议

1 明确学习目标,提高激励价值

网络学习是一种依据个人学习目标和意愿自主选择学习时间、学习地点的学习方式,其中学习的目的性直接影响学习绩效。从学习者学习行为分析模型得出,获得证书的学习者都有明确的学习目的和目标,因此在学习过程中每项活动的参与度均高于其他类型学习者。为此建议提高网络在线学习证书的认可度,直接刺激和提高学习者的学习自控性。当网络在线学习成绩、学分和证书的认可度提高时,或者学校将在线学习教育纳入正规学位教育时,社会对在线学习教育更加认可,就会有更多学习目标清晰的学习者参与进来。为了提高证书价值,可以在平台建设中增加未来能够使用网上认证证书的企业与公司信息,明确证书类别信息,使学习范围和目标更加明确,同时也为企业和公司猎头寻找优秀人才提供有效数据、线索和帮助。通过学习者学习行为的统计分析,为学习者提供量化的数据和预测学习绩效,可以改变学习者的认知内驱动,使其能够更加清晰地意识到自己学习的薄弱环节和提高学习绩效的方法。

2 丰富课程资源,提高学习兴趣

通过在edX平台上对学习者行为对比信息分析发现,在线学习者更愿意学习章节、观看视频,而不愿在网站通过发帖讨论方式获取知识。说明学习者进行网络课程交互时,学习章节和观看视频获取知识更加快速高效,而讨论虽然会启发思考,但有时讨论后未必直接能够得到答案。为此建议对于讨论发帖进行知识归类和整理,或由专家进行定期回复和总结。利用微课程微型、超链接、微媒体、半开放结构、个性化特点,吸引学生进行自主课外学习,减少阅读或观看时间过长给学习者带来的疲劳感,更加高效学习。在平台资源建设上,将优秀教师的科研项目、指导学生的竞赛成果与课程知识点结合,增加拓展性资源,使其获得最直接的经验和科研竞赛思路。

3 消除文化、语言、使用平台障碍

从各国高校推出的edX在線课程数量上来看中国位列世界第二,但在edX平台上从中国学习者使用数量来看,远低于其他国家,分析其原因之一是语言和平台使用上的障碍。为此开发者在交互化界面设计上,尤其要关注学习者学习习惯和可视化效果,注重视觉听觉效果,结构设计合理,便于学习、资料查找和操作。

从edX平台上的统计数据看到无论国外学习者还是中国学习者在交互的论坛中参与度相对其他交互学习方式少,说明学习者在交互式论坛中很难找到归属感和认同感。在学习共同体的建设中,应该充分考虑消除文化、语言交流障碍。对于主要使用英语提供网络学习服务的edX在线学习平台,建议使用多种语言版本或者具有自翻译功能,这样受教育者在网络资源使用上人人平等。由于在线学习资源可以共享共建,随着学习者参与度的提高,可以使网络资源更加丰富,使得更多的学习者进行网络学习成为习惯。

4 教师参与评价,及时反馈预测

利用平台上学习行为数据,可以对学习绩效提前预测,当反馈给学习者时,能够使其总结反思,增强认知内驱动,并通过教师给出的指导性建议来改进学习者的学习行为和学习方法,从而形成动态良性循环。从edX平台上学习者论坛发帖数量对比来看,学习者自我表达、主动思考提问的积极性不高,教师积极参与互动和上线频率提高能够帮助学习者找到归属感,有利于提高学习者思考问题的积极性和自我表达,特别是在自己提出的问题得到及时回复后,学习者将更加愿意在线交流,从而形成良性循环。

参考文献:

[1]彭文辉,曾东薇. 近十年我国网络学习行为期刊论文的内容分析研究[J].中国远程教育,2015(1):42-48.

[2]傅钢善,王改花. 基于数据挖掘的网络学习行为与学习效果研究[J]. 电化教育研究, 2014(9):53-57.

[3]江波,高明,陈朝阳. 建构学习行为模式发现与学习效果关系研究——基于虚拟仿真的学习分析[J]. 远程教育杂志, 2018(4):95-103.

[4]武法提,牟智佳. 基于学习者个性行为分析的学习结果预测框架设计研究[J].中国电化教育,2016(1):41-48.

[5]彭文辉,杨宗凯,黄克斌. 网络学习行为分析及其模型研究[J].中国电化教育,2016(10):31-35.

[6]李小娟,梁中锋,赵楠. 在线学习行为对混合学习绩效的影响研究[J]. 现代教育技术, 2017(2):79-85.

[7]吴青,罗儒国. 基于在线学习行为的学习成绩预测及教学反思[J]. 现代教育技术,2017年06期,18-24.

[8]MITx and Harvardx.Harvard X-MITx Person-Course

Academic Year 2013 De-Identified dataset,version 2.0[EB/OL].[2018-08-09].http://dataverse.harvard.edu/dataset. xhtml.

persistentld = doi: 10. 7910/DVN/26147.

(责任编辑:张宏玉)