王雪宇 邹刚 李骁 王玉龙
摘要:选取哈佛大学和麻省理工学院联合发布的edX平台开放数据和国防科学技术大学MOOC教育平台数据作为研究基础,通过数据的处理、整合、分析,从平台、课程、学习者类型三个方面针对中关MOOC学习者学习行为进行分析,并从学习者类型出发,指出当下热点问题MOOC“高辍学率”的影响因素。
关键词:MOOC;教育大数据;学习行为分析;教育信息化
引言
自2013年中国多所大学掀起“MOOC风暴”,MOOC在中国的发展迎来了一个黄金时期,随着各学科领域MOOC课程建设的加速推进,MOOC学习者的数量也在不断增多。2013年8月,国防科技大学率先在军队开设MOOC平台,力推将信息时代的教育硕果分享到全军。如何正确看待当前的“MOOC热”,作为MOOC发源地的美国与当下MOOC正时兴的中国,两国MOOC学习者在学习MOOC时有何差异,带着这些问题,本文分析了edX平台和国防科大梦课平台所记录的众多学习行为信息,力求找到一些答案。
1相关背景
1.1关于MOOC
大规模开放式网络课程(MOOC)最早是由加拿大学者Dave Comfier和Bryan Alexander在2008年提出的,而真正应用此概念的是加拿大学者George Siemens和Stephen Dowries,当时的MOOC主要基于关联主义(Connectivism)学习理论,以CCK08等课程为代表,强调自学、互助,也称cMOOC。
2012年,以Coursera、edX、Udacity为代表的学习平台将MOOC推向全球,赢得了世界各地高校、教育机构的重视,在许多著名学府积极加入国际化课程平台的同时,各国也在加紧建设具有本国特色的MOOC学习平台,这其中比较典型的是澳大利亚的Open2Study、西班牙的MiriadaX、英国的Futureleam等,这类基于行为主义学习的理论称为XMOOC,接近传统教师授课的在线教学模式。
在近几年的发展中,以MOOC为基础又衍生出了更多的在线学习新形态:SPOC(小规模限制性在线课堂)、MOOL(大规模开放在线实验室)、PMOOC(个性化公开课)、MOOR(大规模开放在线研究课程)等。
截至2014年末,约有400所全球知名大学参与提供MOOC教学服务,其中美国排名前25名的高校中有22所在向全球学习者最多的几个MOOC服务平台提供免费的MOOC。
1.2关于MOOC学习行为分析
21世纪无疑是大数据的时代,利用海量数据进行决策分析成为信息时代众多问题的有效解决途径之一。
MOOC学习过程中,用户在注册、登录、点击链接、观看视频、参与互动、页面停留等每一个环节均留下了痕迹,众多痕迹汇聚成的海量数据。无疑是探析学习者学习行为、发现潜在问题、帮助教师检验新教学法和评估教学、帮助学生理解和优化学习等活动的重要资源。
MOOC学习行为分析是基于MOOC教育大数据,充分利用学习分析技术和数据处理技术,从记录学习者学习行为的海量数据中获取有用信息,得出某种规律,为学习者有效地定位学习需求,支持个性化学习,帮助教学者根据学生个性差异和学习需要为学生的个性化学习实施各类分层。同时通过MOOC学习行为分析也可以跟踪高校师生教与学的历程,分析地区间学习者学习差异,获得教与学的聚焦规律。
2实验数据集概况
2.1数据集介绍
2.1.1“The HarvardX-MITx Person-CourseDataset AY2013”公开数据集
2014年,哈佛大学和麻省理工学院联合发布了两校开设在edX平台上的16门课程的公开数据集,这是全球第一个公开发布的MOOC学习数据,具有很强的研究性,为众多MOOC学习分析研究提供了重要的数据支持。该数据集共有641139条记录,每条信息包含课程名、学习者ID号、出生年份、国籍、学历等共20项内容,其中哈佛大学课程记录338224条,麻省理工学院课程记录302915条。该数据集在公开前通过K-Anonymity(K-匿名模型)、Quasi-Identifies(准标准属性泛华)、L-diversity(L-多样化)等方法进行了去身份识别(De-identificationg),既保护了学习者隐私,又未对数据真实性造成影响。
2.1.2_国防科学技术大学梦课平台数据集
2013年8月,国防科学技术大学利用自身在教学和科研领域的优势率先在军队开放了面向全军官兵的自主学习平台——梦课学习平台,为建设现代军事职业教育模式做出贡献。截至2015年10月,梦课平台累计开设课程112门,注册官兵数296957人,组织了近3000批次、3.2万余人次的在线考试,网站点击量超过2500万次。
在国防科大梦课平台数据库里记录着学习者登录时间、视频观看、互动交流、学习成绩、教师回复、学习者活跃程度等多项内容,共超过9000万条学习行为信息。分析梦课学习平台积累的这些海量官兵学习行为数据,研究部队学习者的在线学习行为,对洞悉部队官兵的在线学习规律、改进授课教师的MOOC建设质量、提升平台的教学组织管理能力具有很重要的作用。
2.2选取处理数据集
为有效分析学习者学习行为,以两个数据集为基础,通过MySQL数据库、IBM SPSS、Tableau等工具对数据进行选定、去空值、筛选后,从641139条edX数据中最终获得美国学习者学习行为信息151122条,从303985条国防科大梦课平台数据中获得中国学习者学习行为信息86689条,以上述数据为研究基础,进行中美MOOC学习者学习行为分析。
3数据分析
MOOC学习者的学习行为涉及方方面面,在本章将按照当前MOOC学习行为分析研究的通常做法,从平台、课程、学习者类型三个方面对中美MOOC学习者进行分析,并对当前社会关注的热点问题“MOOC辍学率”进行研究。
3.1平台分析
分析平台层面时,对两个平台数据集中学习者的注册信息进行了处理分析,分别比较美国和中国MOOC学习者的学历组成、年龄分布和性别差异,如图1所示。
通过中美MOOC学习者学历组成比较发现,美国学习者中高学历人群占比较大,特别是有博士(5.90%)和硕士学历(21.80%)的学习者,两类学习者中本科学历的比例基本持平,但中国学习者中高中及以下学历的人群远大于美国,这与中国军队中许多士兵均是18岁便参军入伍有关。
在年龄分布比较中,将数据集中所有MOOC学习者的年龄分为三类:青少年(0-20岁)、中青年(20~40岁)和中老年(40岁以上)。比较发现,美国学习者中40岁以上的人群占比(23.60%)远多于中国学习者,中青年龄段比例二者基本持平,而中国学习者中29岁以下的人群占比较多(28.20%),这与前面提到的绝大多数服兵役的青年官兵均是18周岁入伍有关。
从已有的MOOC研究中可以知道,MOOC学习者中性别差异远大于社会中性别差异,男性学习者占绝大多数。从图1的分析结果可以发现,美国学习者的性别差异比中国军队学习者小,说明在美国有更多的女性参与到了MOOC学习中;中国学习者性别差异大与现实情况相符,军队中男性占比本就远超过女性。
3.2课程分析
课程分析部分,针对中美MOOC学习者各选取了4门课程共计86948注册人次进行分析,其中哈佛大学2门(健康知识、计算机概论)、麻省理工学院2门(计算机编程介绍、生物学概论)、国防科技大学4门(多媒体设计、网络知识、3D打印、车辆管理),如表1所示。
从表1可以看出,美国学习者中女性学习者倾向于选择偏文科的课程,但总体看来选课的女性占比远大于中国学习者,这与军队中女性比例本身过低有关;对比中美获得证书的学习者占全部注册学习者的比例,中国学习者完成课程的比例较高于美国学习者,这可能与军队相关组织制度有关,而就中美学习者内部而言,不同课程获得证书的学习者占比基本相近;对比选修课程学习者的平均年龄,中国学习者的平均年龄均小于美国学习者,这与军队中主要是18~20周岁的青年官兵有关,而无论中美学习者,课程获得证书学习者的平均年龄均大于全部学习者平均年龄,说明学习者年龄对课程的完成也存在影响。
3.3学习者类型分析
MOOC的主体是学习者,而这个主体不仅数量巨大,种类也多。有的学习者会把MOOC当做传统课程认真参与学习;有的学习者只是把MOOC当做在线参考或者工具,交互特点呈现不同步性和选择性;还有一些学习者只是把MOOC当做检验其对相关知识的掌握程度的工具,因此他们很可能只做题而不看视频。在这里,采取哈佛大学和MIT联合发布的课程报告中的方法将学习者分为仅注册者(只注册了课程,没有其他学习行为)、一般学习者(注册并访问了课程)、积极学习者(注册并访问了大于1/2的课程内容)和获取证书者(获取了证书)4类(分类图片来自课程报告)。图2为四类学习者的分类和中美各类型学习者比例。
从图2不难看出,中国学习者两极分化严重,仅注册者和获取证书者、积极学习者均多于
下面从学习者类型出发,以获取证书学习者和全部学习者为对照,来研究MOOC兴起至今人们始终关注的一个热点问——MOOC课程远高于传统课程的“辍学率”。据媒体报道,Coursera、edX、Udacity三大平台的平均辍学率高达95%。为什么MOOC会有这么高的辍学率,这与哪些因素有关,学习者学历、年龄还是学习行为?美国学习者,特别是获取证书者比例超过美国学习者的7倍,表明中国学习者中认真对待MOOC课程的不是少数,而美国学习者中超过一半的均是一般学习者,获取证书和积极学习者占极少的比例。
数据集中美国MOOC学习者能获得证书(即顺利完成学业)的人群占比为2.1%(3244人),辍学率为97.9%;中国学习者中取得证书的人群占比15.7%(13572人),这个比例高于世界普遍水平。为研究辍学率的影响因素,对获得证书学习者的学历、学习进度、学习行为等进行了分析并与全部学习者做了对比,见表2。
从表2可以看出,获得证书的学习者中高学历占比远高于全部学习者,特别是有博士、硕士学历的学习者,说明学历对辍学率有一定影响,这一点在美国学习者中显得尤为突出;在取得证书的学习者中,中美学习者学习进度超过一半的占比均超过了97.0%,说明取得证书的学习者多数都认真学完了课程,以获取知识为目的;在学习行为中,选定了数据集中课程交互次数、学习天数、视频播放数三个数据进行分析,对于两国MOOC学习者来讲,结论是相同的,获得证书的学习者均是交互积极、学习持续时间长、播放课程视频次数多的学习者。另据哈佛大学和MTF联合发布的课程报告《HarvardX and MITx:TheFirSt Year of Open Online Courses(Fall 2012-Summer 2013)》中统计数据显示,在全部16门课程中取得证书的学习者平均年龄均大于全部学习者的平均年龄,所以学习者年龄也是辍学率的一个影响因素。
4结语
美国作为MOOC的发源地,在MOOC建设上一路领先其他国家,在众多知名大学加盟的情况下,MOOC发展更是如虎添翼。中国自掀起MOOC热潮以来,正瞄准前沿不断发展,越来越多高校和机构的加入必将推动MOOC稳步前行。本文通过对中美MOOC学习者学习行为进行研究,既找到了两类学习者的共同点,又发现了差异,这对于MOOC学习行为研究多少能有一些启示。同样,中国军队MOOC的发展也值得关注,许多军队学习者以超出普通学习者数倍的精力投身于MOOC学习中,取得了不俗的成绩。要推动我国MOOC的健康持续发展,需要国家和社会的共同努力,从课程建设、激励机制、疑难解答等众多方面进行创新和攻关,让MOOC真正成为改变一代人甚至几代人教育理念、教育模式和教育环境的时代产物。