熊小进 谢定源
摘 要:MOOC作为大数据技术在教育领域的典型应用,已有颠覆传统教育之势。文章以大数据网络的基本特征为出发点,采用文献法,探讨了大数据技术在MOOC中应用与发展的现状,建议从国家、学校与教师三个层面着手,采取有效的措施积极推动MOOC发展。
关键词:MOOC;大数据;教育;教学
中图分类号:G642.3 文献标识码:A 文章编号:1002-4107(2016)08-0027-03
随着社会的进步和计算机、互联网技术的迅猛发展,大数据已经成为现代社会一种新的思维方式、一种新的问题解决方法。大数据并不仅仅只是一个单纯描述数据量之巨大的概念,同时还意味着数据来源的多样化、数据类型的多元化以及在数据处理与分析层面的大容量和高速度。大数据立足于对大量数据的深度挖掘与科学分析,寻求数据背后的隐含关系与价值,使得人们可以从基于小样本数据的推测或基于感性的偏好性选择转向基于数据分析与理性证据的决策[1]。
美国《纽约时报》将2012年称为MOOC元年。时至今日,MOOC浪潮席卷全球。MOOC教学平台能够搜集所有学习者学习过程的完整数据,为教学过程的调整和优化提供依据,被认为是一种有别于传统教学模式的新型知识传播模式,大有颠覆传统教育之势。
一、MOOC是大数据技术在教育领域的典型应用
大数据网络具有4V特征,即Volume(规模大)、Variety(多变量,异构)、Velocity(动态性)和Value(数据及价值稀疏性)。
结合MOOC来说,首先体现在学习者数量巨大上。传统课堂的学习者一般为三四十人,多则百余人。而MOOC中一门课程的学习者动辄成千上万,学习者的学习能力、知识水平也存在差异。北京大学2013年一共开了1998门课程,平均每堂课允许48人听讲,实际每堂课平均听课人数为29人[2]。而与之形成鲜明对照的是,斯坦福大学2011年夏季开设的“人工智能”课程,吸引了除朝鲜之外的全球所有国家16万多学习者注册学习。edX于2012年开设的“电路与电子计数”课程,吸引了160个国家的15万名以上的学习者。清华大学自2013年秋季在edX和学堂在线平台上开设“电路原理”课程,累计已经有超过7万名学习者。这个数字远大于清华大学电机系自1932年建系以来所有学过这门课程的学生人数。MOOC学习者的数量规模是传统教育方式望尘莫及的。
其次,MOOC平台既保存了课程的资源数据信息,也保存着学习者的学习数据信息,两者都具有多维的属性和特征。比如学习者有姓名、性别、学历等身份信息,还有视频观看时长、论坛参与频度、作业提交情况、测验完成情况等学习特征数据。平台中的数据具有多种模态,既有结构化数据,例如学习者的姓名、年龄、学历等存储在数据库中,可以用二维表结构来逻辑表达实现的数据信息;也有半结构化数据,例如XML、HTML文档等数据的结构和内容混杂在一起,没有明显区分的数据;还有非结构化数据,例如课程资源中的文本、图片、音频和视频等不能使用数据库二维逻辑表来表现的数据。
再次,MOOC课程学习行为数据以网页点击流方式被实时记录。随着课程的进行和学习者学习活动的开展,学习者的学习特征数据不断变化。课程进行中,部分学习者会因为各种原因退出学习,也有学习者中途进入课程来学习。这些都是MOOC数据动态性的实际表现。
最后,MOOC平台完整、详细地记录了每一位学习者的每一次学习活动。几周时间的MOOC教学实践所积累的学习行为数据几乎是传统课堂教学几十年才能收集的数据总和。数据之间的关系极为复杂,对学习者海量的学习行为数据进行深度挖掘,能够发现有价值的学习规律,对后续的教学提供指导和帮助。
因此,以现代信息技术为支撑的MOOC,是大数据技术在教育领域的典型应用。
二、大数据在MOOC中应用研究现状
在中国知网以“MOOC”为主题进行检索,共检索到2133篇文章,其中基于大数据视角方面的文章,只有寥寥25篇,占比仅仅超过1%。
25篇文献按照内容分为两类:一类是大数据技术在MOOC中应用的理论探讨与研究,另一类是基于MOOC平台大数据的实证研究。
关于大数据技术在MOOC中应用的理论探讨与研究,有8篇论文。文献极少,研究内容和方向也较为分散。东北大学李封等[3]和深圳大学的黄婷婷等[4]对MOOC学习者的学习行为进行了分析研究。重庆广播电视大学的吴南中[5]设计了基于教育大数据的MOOC资源开发范式。清华大学张羽等研究者[6]对基于MOOC大数据的学习分析和教育测量进行介绍和探讨。上海理工大学的张艳[7]和北京航空航天大学的吴文峻[8]等研究者深入研究了MOOC对专业教育和教学方式带来的变化和影响。
基于MOOC平台大数据的实证研究,有17篇论文。主要是基于国内现有MOOC平台采集的数据展开研究,也有极少数针对国外知名MOOC平台公开的数据进行的分析研究。
北京大学的王卓等[9]等研究者借助Coursera平台的数据,构建和优化了学习者分析评价模型。首都师范大学的贾积有等[10],安徽商贸职业技术学院的张强[11]等研究人员研究了学习者学习行为与学习成绩、学习效果之间的关系。北京大学蒋卓轩等[12]研究人员通过分析学习者典型学习行为特征,对其学习成果进行预测。清华大学的李曼丽等[13]使用定量分析模型,对MOOC学习者的课程参与和完成情况进行了深入分析。湖南机电职业技术学院的曾丽婷等[14]研究人员探讨了MOOC学习者学习规律的变化与学习规划的养成。南开大学的王哲[15]对MOOC的用户行为模式进行了初步分析。石油化工管理干部学院的左俐俐[16]对MOOC学习者的学习状态变化进行了分析,揭示了学员在学习目的上的分集。深圳大学的危妙[17]和傅霖[18]等研究人员以优课联盟MOOC课程平台为研究对象,研究了教学平台的应用状况、影响因素、功能以及对教学的促进作用。国防科学技术大学的李建平[19]等研究人员对MOOC平台在线讨论板块进行实证调查,认为MOOC课程在线讨论区对促进教学具有重要作用。清华大学杨永林[20]等研究者探讨了智能化资源平台对于英语写作教学的促进作用。广西师范学院的杨满福[21]等研究人员对edX发表的题为《探究全球性课堂中的学习:基于edX首门慕课的研究》的研究报告的产生背景、方法及意义作了深入的剖析。上海大学的王萍[22]基于edX平台开放数据,探索中外MOOC学习者的学习行为和特征。
三、大数据技术应用于MOOC的问题
虽然大家一致认为将大数据分析技术运用于MOOC教学能够优化教学环境,提升教学质量,完善网络课程系统,促进MOOC的可持续发展,但是现阶段我国MOOC的推进过程中,运用大数据技术进行学习分析的工作才处于起步阶段,相关的理论探讨和实证研究都还较少。在MOOC推进过程中,运用大数据分析的结果来改进和优化教学的工作还有待继续深入开展。
基于MOOC平台数据的实证研究,数据源覆盖面偏窄,数据量较少,研究分析结论可能与实际情况存在偏差,并没有充分体现大数据分析的特质和优势。目前国内利用大数据技术分析MOOC学习者的学习行为与学习效果的研究报道较少,对于MOOC平台学习数据的分析大多沿用传统的统计分析方法,从研究结果上只能看到片面的学习过程,并没有反映学习者学习过程的全貌。使用传统的统计分析模型,在数据处理的规模和处理速度上,都会存在缺憾。我国的MOOC平台只是实现了海量学习行为数据的采集工作,虽然拥有了大量的数据,但是数据的分析和利用工作却严重滞后。后续在数据存储、数据清洗、数据归类、数据建模、数据分析计算、教学决策、结果的可视化呈现等方面都还需要更加深入的研究和实践。
没有专门的教学数据分析机构,没有专门的教学数据分析平台,也没有专业的教学数据分析人员。MOOC平台搜集到的教学信息数据没有得到及时分析处理和深度挖掘。由于时效性的原因,平台收集的数据不能发挥出最大效益。
综上所述,我国MOOC推进过程中,尚未形成完善的MOOC生态链,不能称之为完整的、真正意义上的大数据应用。
四、大数据背景下的MOOC建设路径
基于MOOC发展和研究的现状,为了应对信息技术的发展对教育提出的挑战,把握难得的发展机遇,需尽快从国家宏观管理、学校支撑协调和教师个人努力三个层面着力,充分利用大数据技术,将我国的MOOC稳步推进,实现教育质量的全面提升,促进教育公平与民主。
首先,在国家层面,教育行政主管部门可以从推进教育民主,促进教育公平的战略高度出发,通过制定相应的政策措施,指导、鼓励、扶持各地MOOC的建设和推进;规范和约束MOOC建设中的法律、法规问题,例如知识产权保护、学习者个人信息保护等;加强教育大数据基础设施建设力度。保障MOOC健康、稳定、可持续发展。2015年4月,教育部颁发了《教育部关于加强高等学校在线开放课程建设应用与管理的意见》,明晰了我国MOOC的发展方向和思路。
其次,在学校层面,高校作为慕课建设和应用的主体,应将MOOC的推进作为教学改革的重要部分,制定相关激励政策和配套措施。在国家政策的指导下,积极探索具有自身特色的MOOC建设路径和方法,遴选有基础的课程,推荐优秀的教师,建设优质的MOOC课程。以校本教育为基础,以提升教学质量为抓手,打破“数据悖论”,重新构建数据分析指标,利用现有资源及数据分析结果进行教学开发,呈现更好的教学内容[23],将其逐步推向全国,推向全球,为社会提供优质的教育资源,扩大自身的影响和声誉,承担文化知识传播的社会责任。
最后,从教师层面来看,教师个人应当主动积极地学习现代教育思想和理论,改变传统教育理念,结合大数据思维和技术,在实践中不断探索MOOC的教育规律和方法,将传统的以课堂为主体,以教师为主导的学习转变为以学习者为中心的学习,主动适应学习者个性化发展和多样化的终身学习需求。
现代信息社会,大数据技术已经渗透到政治、经济、科技、文化、教育、医疗卫生等社会的各个领域。MOOC作为大数据技术在教育领域的典型应用,也正在逐渐改变传统的教育。我国地域广袤,人口众多,各个地区之间,特别是东部地区和中西部地区之间、城市和农村之间,教育资源分配严重失衡;各类人群之间,比如学生和在职人员之间、管理人员与技术人员之间,教育需求也存在极大的差异。我们应当高度关注教育信息化的迅猛发展,抢抓机遇,顺势而上,做好顶层设计,构建完善的MOOC生态链,有效提升教育质量,推进教育公平和民主,推动知识和文化的传播。相信在不久的将来,公平的教育机会、优质的教育资源、先进的教育理念、信息化的教学手段、个性化的教学方式都将展现在我们面前。
参考文献:
[1]郑燕林,柳海民.大数据在美国教育评价中的应用路径 分析[J].中国电化教育,2015,(7).
[2]杭州智慧教育得到全国与会者点赞[EB/OL].http:// www.edu.cn/xxh/focus/xs_hui_yi/201510/t20151027 _1331257_1.shtml.2015-11-04.
[3]李封,李婕,赵长宽等.大规模网络课程中学习者学习行 为分析[J].计算机教育,2014,(20).
[4]黄婷婷,陆元明.基于学堂在线的MOOC平台学习者互动 行为研究[J].教育信息技术,2015,(7/8).
[5]吴南中.教育大数据应用于MOOC的资源开发范式研究 [J].中国远程教育,2015,(8).
[6]张羽,李越.基于MOOCs大数据的学习分析和教育测量 介绍[J].清华大学教育研究,2013,(4).
[7]张艳,刘亚.大数据时代MOOC对计算机专业教育的影响 [J].计算机时代,2015,(3).
[8]吴文峻,吕卫锋.大数据时代的大规模开放在线教育 [J].计算机教育,2013,(20).
[9]王卓,张铭.基于贝叶斯知识跟踪模型的慕课学生评价 [J].中国科技论文,2015,(2).
[10]贾积有,缪静敏,汪琼.MOOC学习行为及效果的大数据 分析——以北大6门MOOC为例[J].工业和信息化教 育,2014,(9).
[11]张强.MOOC学习者学习行为聚类分析[J].通化师范学 院学报:自然科学版,2015,(4).
[12]蒋卓轩,张岩,李晓明.基于MOOC数据的学习行为分析 与预测.计算机研究与发展,2015,(3).
[13]李曼丽,徐舜平,孙梦嫽.MOOC学习者课程学习行为分 析——以“电路原理”课程为例[J].开放教育研究, 2015,(2).
[14]曾丽婷,范逸洲,刘玉.MOOC学员学习规律与学习规划 的实证研究——以“翻转课堂教学法”MOOC课为例 [J].工业和信息化教育,2014,(11).
[15]王哲.大规模开放在线课程的用户行为研究[J].计算 机教育,2014,(21).
[16]左俐俐.大规模在线公开课程(MOOC)学习状态变化分 析[J].石油化工管理干部学院学报,2015,(1).
[17]危妙,傅霖,黎刚等.MOOC课程平台学习行为与学习成 效大数据分析[J].教育教学论坛,2015,(38).
[18]傅霖,危妙,郭姗姗等.探析影响MOOC学习者学习成效 因素[J].教育现代化,2015,(6).
[19]李建平,丁吉超,吴强等.高等数学MOOC课程讨论区开 放性问题在线讨论实证调查与思考[J].高等教育研究 学报,2014,(4).
[20]杨永林,张世蓉,丁韬等.从“慕课”到“小微课”,看大数 据在教学中的应用[J].现代教育技术,2014,(12).
[21]杨满福,焦建利.大教学、大数据、大变革——edx首门 “慕课”研究报告的分析与启示[J].电化教育研究, 2014,(6).
[22]王萍.基于edX开放数据的学习者学习分析[J].现代 教育技术,2015,(4).
[23]香港科大庞鼎全:MOOC促进高等教育改革与创新 [EB/OL].http://www.edu.cn/xxh/focus/li_lun_yj/ 201510/t20151016_1327027_1.shtml.2015-11-05.