【摘 要】本文分析基于大数据分析的在线教育平台的应用价值,阐述从物理层、数据层和应用层构建基于大数据分析的在线教育平台交互模型,论述基于大数据分析的在线教育平台实现技术,针对在线教育平台应用中数据标准不统一、数据采集覆盖面窄、教育模型构建专业性不足、数据共享机制尚未形成等问题,提出政府统一数据规范、智慧教室设置人脸识别与学习状态捕抓传感器、加强大数据相关专业人员素质培养、建立有效的资源共享机制等对策。
【关键词】大数据 在线教育平台 大数据分析技术 云计算
【中图分类号】G 【文献标识码】A
【文章编号】0450-9889(2020)06C-0190-03
随着信息科技的不断发展、教育改革的不断深入,很多学校都构建了网络教学平台,利用网络信息技术作为教学辅助手段。然而要进一步提升网络教学平台的教育教学效果,使其真正具备“智慧”,就要在网络技术中融入大数据技术,利用大数据分析技术采集用户的学习行为,改变传统的学习方法,以学生为中心,为不同的学生提供个性化的教育服务,从而实现教育领域的革命性变革。
大数据分析技术是数据分析的前沿技术,是把大量、种类多样、有商业价值并能迅速对数据进行分析从而把数据转为信息资产的技术。构建具有良好的交互水平的在线教育平台,是发展基于大数据技术的在线教育的基础。目前,基于大数据分析的在线教育平台主要分为两类:学习行为管理驱动平台和教学教育资源驱动平台。我国各开放大学如广播电视大学等高校和国外比较热门的Blackboard、Moodle等在线教育平台大部分都是属于学习行为管理驱动平台,而目前的慕课、微课和翻转课堂等属于教学教育资源驱动平台。
一、基于大数据分析的在线教育平台的应用价值
基于大数据分析的在线教育平台,是一种基于“互联网+”的学习行为,通过云端采集用户数据,再利用大数据对数据进行分析、清洗,最后通过针对个人用户的特定算法对数据进一步的迭代,从而获得一个适合学习者自身的学习方法与用户数据。基于大数据分析的在线教育平台具有以下应用价值:
第一,实现随时随地学习。基于大数据分析的在线教育平台,教师与学生可以不受时间与空间的限制,进行双向学习交互与信息资源的高度共享。通过云端的资源共享,学习者可以非常便利地获取需要的学习资源,当中包括常用的学习视频、在线答疑、分析测试和交流互动等内容,从而进一步提升自己的学习能力与水平。尤其对于职场上的在职人士来说,他们已经脱离了全日制学习,只能利用碎片式的时间学习,而且他们相比全日制学生更难掌握学习的方法,但是利用基于大数据分析的在线教育平台,就能通过移动便携设备或者PC端掌握适合自己学习习惯的科学学习方法。
第二,促进个性化教育。传统的教育对教师的依赖程度较高,教师的个人能力与工作量对整个教育质量影响较大。如今在大数据的基础上开发先进的教育应用,可使教学更加灵活。数据是个性化教育的重要指标,基于大数据的个性化教育,可以采集更多更完整的数据,比如学生在课堂的表现情况,包括课堂练习情况、作业情况、参与课堂的表现、课堂教学举手提问次数及回答问题的时长和准确率、师生互动频率和课堂的专注程度等数据。通过大数据分析,可以如实勾勒出課堂的实景和学生对本次课堂教育的接受程度,从而根据学生的个体差异实施个性化教育。个性化的教学服务和独立自主的教学方式,使得学生能够根据自身个体差异制订学习计划,把传统的教育方式转变为学生主导、老师辅导的教育方式。
第三,促进学生自主学习。由于教育资源有信息化技术支撑,可以实现远程的信息同步与共享,未来的教育将在一个开放的教育平台下,为学生提供宽阔的学习空间,学生可以根据自身的条件自主创新学习方法和习惯,从而增强学习的独立自主性。在线教育平台通过采集学生学习的时间、对各个知识点的理解程度和教学工具的使用等数据,将各类数据扩展为大数据教育信息数据库,实现把海量数据转化为有规律的信息,规律的信息汇聚成为知识,知识指导着教育,不断层层细化,从而达到学生自主学习、教师因材施教的目的,有效地提高教育质量。
二、基于大数据分析的在线教育平台交互模型的建立
基于大数据分析技术的在线教育平台应该以用户的使用体验感为核心,针对学习者的需求,为学习者量身定做一套关于学习的个性化服务。从平台的架构来看,建立基于大数据分析的在线教育平台交互模型应该包含三层:物理层、数据层和应用层。如图1所示。
(一)物理层
在物理层中,通过虚拟化和云计算技术对物理设备进行集约化管理,实现资源共享,提供物理基础。物理层采用虚拟化技术在提高硬件性能的同时,降低硬件的能耗,大大提高了设备系统的可靠性和安全性,为大数据平台提供了可靠的硬件基础。
(二)数据层
运用大数据分析技术,在数据层中,通过统一身份访问技术对实时采集的数据进行预处理,再将初始数据进行清洗,对数据挖掘进行处理,最后把有价值的数据保存到数据中心,并使用数据容灾等技术备份数据,进一步提高平台系统的可靠性。
(三)应用层
基于大数据分析的在线教育平台可以使用人脸识别的方法来认证用户的访问权限,不同权限的用户可以登录到不同的系统界面获取相应权限的服务。对于学生而言,登录到平台进行在线学习的同时,也为数据平台提供学习的形态数据,可以通过不断的数据采集调整自身学习的方法,为自身学习定制出一套合理的学习方案,从而提高学习的效率,实现“以人为本,以学为中心”的学习理念。教师通过平台采集教师的教态,通过大数据分析评估教育方案,一方面可以改进教师的教育教学方法;另一方面教师作为教育者同时也是学习者,基于大数据分析的结果能够促进教学相长,真正意义上实现以学促教。
三、基于大数据分析的在线教育平台的实现技术
在当前人工智能发展迅速的背景下,基于大数据分析的在线教育平台的建设前提是要把握教育发展的趋势与规律,利用大数据与云计算技术,重点要开展对教育数据的挖掘,使得教育平台具有人的智能性,能够不断地通过数据采集进行自我动态升级,从而能够站在用户的立场上切实地、精准地为用户提供个性化交互的教育教学服务。
(一)数据收集
所有的数据系统都需要进行数据采集,随着大数据技术的应用越来越广泛,数据的采集问题也随之变得重要。大数据采集可以分为离线采集、实时采集和互联网采集。离线采集,在数据仓库的语境下,ETL基本上就是数据采集的代表,包括数据的提取(Extract)、转换(Transform)和加载(Load)。在数据的转换的过程中,需要针对教育场景对数据进行治理,对数据进行监测与过滤、格式转换与数据规范化、数据替换、保证数据完整性等。实时采集,可以利用Kafka流处理平台进行采集实时数据,利用智能设备、移动终端和数据源提供的API或者采用爬虫工具采集外部数据,实时采集主要考虑教育过程中的流业务场景,在流处理场景时,数据采集会成为Kafka的消费者,就像一个水坝一般将上游源源不断的数据拦截住,然后根据业务场景进行对应的处理(例如去重、去噪、中间计算等),之后再写入对应的数据存储中。互联网采集,利用垂直搜索引擎技术的网络蜘蛛或者网络机器人自动获取其他教育网站信息,如Scribe日志收集系统可以从不同数据源、不同设备上收集日志,完成在互联网上关于教育数据的采集。
(二)数据存储
在数据存储阶段,分析不同数据存储方案的优缺点,大致分为下面三种。
第一,基于MPP架构的新型数据库群集,采用Shared Nothing框架,主要针对行业大数据的存储,大数据教育平台可以通过大数据列存储、块级粗粒度索引等处理技术,结合MPP架构的云计算技术来完成对教育应用的分析。基于这样技术的存储平台架构,具有高速、高可靠性和高扩展性等特点,除了应用在大数据教育平台外,也广泛地应用在其他分析类的领域。
第二,基于Hadoop的扩展和封装技术,充分地利用Hadoop的开源优势,针对大数据的非结构化和半结构化的数据存储,把基于Hadoop的扩展和封装技术应用到互联网的大数据存储、支撑大数据分析技术中。Hadoop平台对于大数据复杂的数据类型、ETL操作、数据挖掘和云计算技术的处理是非常擅长的。
第三,大数据教育一体机,这是硬件集合了存储设备、终端与服务器,软件集合了操作系统、数据库管理系统和预分析处理软件等,是一个软件和硬件相结合的产品。它为大数据教育应用的处理数据、分析以及信息采集提供了支撑,具有良好的纵向扩展性和稳定性。
(三)数据处理和分析
在数据处理阶段,根据不同的教育应用领域,可采用MapReduce、Spark、Storm等计算框架对数据进行流式处理与批处理等预处理。在数据分析阶段,采用Mahout、Spark MLlib等数据建模工具来实现分类、聚类、过滤、推荐、频繁子项挖掘等大数据智能分析功能,采用HiveQL查询语句,能够提高大数据的数据抽取、数据转换和数据加载的效率。
四、基于大数据分析的在线教育平台的问题与建議
根据有关基于大数据的在线教育平台的调研报告统计,285位学生中有61.5%的学生认为,现有的教育平台在界面布局设计、文字色彩、特效动画、响应速度、操作流程复杂等方面存在不足;有47%的学生认为,现有的教育平台在共享资源、及时性、个性化和互动性方面还存在很多问题,需进一步改进、优化。
(一)针对数据标准不统一问题,政府应统一数据规范
大数据分析的数据基本来自多种类型和多个信息源的集合,面临的问题就是数据字典的统一问题,数据的汇聚需要规范和建立一个统一的标准。基于大数据的教学环境与教学过程方面的数据尚未发展起来,虽然近年在线教育发展比较成熟,但是数据的标准也没有得到统一,成为大数据技术在教育领域有效应用的瓶颈。建议在政府层面上推动大数据平台的发展并制定相关大数据教育平台的政策,从顶层上定义数据字典,统一数据规范。
(二)针对数据采集覆盖面窄的问题,智慧教室应设置人脸识别与学习状态捕抓传感器
我国已基本建立关于教育方面的公共服务平台,在教育教学和管理方面的数据也基本成熟,但是在个性化教育教学方面,尤其是个性化教育教学过程中的数据采集方面,尚存不足。在现有的远程在线教育平台开发中,只是单纯地利用网络把教学方式从传统的面授改为远程教学,没有考虑关于用户方面的数据分析,对教与学的数据采集不够完善,从而影响教育数据的分析。经调查研究发现,目前很多的智慧校园建设,也没有统一对教与学的数据进行采集研究分析,对大数据的应用缺乏整体设计,给未来基于大数据的教育发展带来困难。建议在智慧校园建设中除了相关的智慧平台外,还应该加入智慧教室,设置人脸识别与学习状态捕抓传感器,学生进入教室,就被自动记录相关学习数据信息。
(三)针对教育模型构建专业性不足的问题,应加强大数据相关专业人员素质培养
数据模型的构建是基于大数据的在线教育平台进行有效预测、监管、评价与诊断等功能的总体框架。基于大数据的在线教育平台从应用到决策,都要通过严谨的数据模型来支撑。由于目前远程教育平台都是单独开发和构建的数据模型,没有真正地利用大数据,没有做到“全民来建”,所以专业化水平不高。由于前沿教育数据分析技术不足,未能有效利用大数据技术,导致教育专家知识领域的应用与教育科研成果没有得到充分合理地相结合,影响了未来的教育发展。未来的教育应加大关于大数据相关专业的人员培养,提高教育的数据分析、系统建模、数据挖掘等技术水平,充分调动各行业的积极性和主动性,推动未来教育之路的发展。
(四)针对数据共享机制尚未形成的问题,应建立有效的资源共享机制
基于大数据的在线教育平台的核心价值是数据,海量数据的收集需要全面大规模的采集,那么就需要合理而规范地进行数据共享与开放。目前,由于商业利益、个人隐私等因素,还没有建立有效的数据共享与开放机制,因此,还需要通过国家政策建立有效的资源共享机制,通过多种途径汇聚教学,研究和管理数据,扩大数据的规模,形成基于大数据分析的教育平台的独特优势。
我国的教育正在走向大数据时代,谁能够掌握数据,谁就能够赢得未来的生存;谁能够运用数据,谁就能够赢得未来的发展。目前大数据、云计算、物联网快速发展,教育数据的形式和应用越来越多元化、多样化,谁能快速发现和整合数据,并能解决如何利用数据挖掘其背后的价值这一问题,将会有效增强其在未来的竞争力。在“互联网+”的时代,为了更好地应对教育大数据所面临的一系列挑战,基于大数据的在线教育平台的发展需要将大数据技术与教育领域进行深度融合。
【参考文献】
[1]曹良亮.在线学习中的交互设计——以交互结构为核心的交互设计方法[J].中国远程教育,2010(1).
[2]徐海波.浅析面向在线教育的大数据应用[J].数字技术与应用,2015(12).
[3]李瑞霞,郑睿,张领.大数据环境下个人隐私存在的安全问题研究[J].电脑知识与技术,2015(12).
[4]宋秋莲.基于云计算和大数据的在线交互平台应用模型的构建研究[J].智能城市,2016(10).
[5]琳昕.基于云计算的大数据挖掘平台构建研究[J].山东工业技术,2015(17).
[6]杨美沂,林勇.大数据背景下基于云计算的政府统计平台构建[J].统计与决策,2016(4).
[7]李巍巍.基于云计算的大数据统一分析平台设计与应用[J].自动化与仪器仪表,2016(8).
【基金项目】2016年度广西壮族自治区中青年基础能力提升项目“基于大数据的教育技术信息平台的应用研究”(KY2016YB899)
【作者简介】李超宇(1982— ),男,广西梧州人,工学硕士,梧州职业学院讲师,网络工程师,研究方向:云计算、大数据与计算机网络方面的研究。
(责编 王 一)