基于大数据的学生校园行为分析预警管理平台建构研究

2017-05-30 06:15邓逢光张子石
中国电化教育 2017年11期
关键词:教育大数据预测模型数据挖掘

邓逢光 张子石

摘要:大数据是当今最热门的概念和技术之一,给我们的工作、生活、学习以及思维方式都带来了革命性的影响。为改变当前学生管理依靠说教和事后分析找对策的传统方式向更有针对性、个性化和预测性的科学管理方式转变,该文通过学生教育管理和信息技术深度融合的途径,分析了学生校园行为产生的大数据价值,深入阐述了学生校园行为大数据采集方法、分析预测模型和可视化模型等关键技术,采用主流的Hadoop开源平台架构,建构了学生校园行为大数据分析预警管理平台系统,对学生行为进行预警安全管控,实现了学生管理手段的信息化,提升学生教育管理科学化水平,促进智慧数字化校园建设。

关键词:教育大数据;学生行为分析;预测模型;数据挖掘

一、引言

联合国在2012年发布了《大数据白皮书》,对大数据时代的到来并将深刻影响经济社会发展做了阐述。国务院在2015年8月也出台了《促进大数据发展行动纲要的通知》,大数据已经成为我们国家基础性和前瞻性的技术,是国家实施创新驱动发展战略的内在需要和必然选择。我们应该结合国家大数据政策与教育信息化大战略,积极推进教育大数据在学校中的应用,探索发挥大数据技术对变革教育方式、促进教育公平、提升教育质量的支撑作用,这是当前提升学校教育管理信息化水平的关键。根据最新的青少年自杀报告信息显示:中国儿童自杀率高居世界的第一位。我国每一年都有大约三十多万人自杀而死亡,将近二百多万人自杀未遂,其中百分之四十是未成年人。我国中小学生有情绪、学习和行为障碍的接近三千多万人。相关的研究也发现我国高等学校有心理问题的大学生大约占20%,其中15%的学生属于一般性的心理问题,需要学校辅导员和亲朋好友进行心理疏导;3.5%的学生属于有心理障碍,会经常出现消瘦、失眠和烦躁等症状;1.5%的学生属于有精神病,会失去自我控制能力,分不清现实与幻觉。这些都是不容忽视的数据,表明当前我国青少年心理问题的严重性。但遗憾的是我们学校对学生的行为和心理健康干预是缺位不作为的。目前,我国学校的学生校园行为管理手段大多数是宣传说教和定期排查,其管理方法只停留在事后定性分析上,这种管理手段非常被动和落后,已经不适应学校现代化教育管理的需要,更不符合大数据时代的发展方向。

二、教育大数据的研究与应用现状

大数据的产生给未来信息技术带来新的机遇与挑战。大数据技术对科学数据的实时性、完整性和有效性都提出非常高的要求,必须根据大数据的特点对当前数据处理技术实施变革,从而形成更有益于大数据采集、存贮、清洗、分析、共享的新兴技术。世界上,大数据于2012年起就成为学术圈的热门话题,在教育领域也被广为讨论。美国布鲁金斯研究院报告中指出,教师通过大数据就可了解学生平时的表现和学习方式,而不必依赖传统的测验方法,就能够清楚知道学生掌握的知识和对学生最有效的教育方式是什么,并可以用大数据的深度综合分析来研究学生的学习状况。2012年10月美国教育部发布了《通过教育数据挖掘和学习分析促进教与学》的报告,对美国大数据在教育领域的应用上所面对的机遇和挑战进行非常详细的论述,并且以大数据技术在自适应学习系统中的应用进行了案例分析说明。

自2009年开始大数据技术就成为学术界常用的名词术语,但是国内大数据在教育领域中的应用是近几年才开始出现的。自2013年起,我国掀起了教育大数据应用性研究的热潮。在教育部办公厅的《2014年教育信息化工作要点》中强调,要对动态监测、决策应用、教育预测等相关数据资源进行汇聚整合,为教育科学决策提供及时、准确和有效的数据支撑,并能共享全国的教育基础数据。大数据技术在教育管理中的应用主要包括教育数据的采集、存储、分析和智能挖掘等几方面,能为教学过程提供实时的、全样本的数据信息,为教学活动的实施方案提供可操作的客观分析,用智慧的手段帮助教师和学校管理者形成科学和快速的决策,真正实现智慧教育。教育大数据还可以依托学习分析和数据挖掘两项关键技术,通过技术思维反向驱动大数据分化成为教育教学应用的独立分支,提供研究和解决教育信息技术领域问题的新方法,促进教育管理、教学模式、个性化教育、教育评价等方面创新。

由此可见,教育大数据的研究与应用越来越受到教育管理者的重视,并展开与教育各领域工作的深度融合,为更科学更有效的教育管理提供支撑。但目前关于教育大数据的研究与应用还处于开始阶段,研究主要停留在学习分析、学习策略、个性化教育、教育数据挖掘、管理方式的改善等方面,对学生校园行为等一些具体的应用分析研究不够,缺乏科学性和规范化的顶层设计,面临实际应用、安全与隐私、运营等许多层次的挑战。因此,特别需要对教育大数据进行整体规划和具体应用综合研究。

三、学生校园行为大数据的产生与价值

随着信息技术的不断发展,数字化校园的数据产生主要通过教学活动和教育管理过程两个渠道实现,并生成了巨量的结构化或非结构化的教育数据,如与学校教学和管理相关的网络行为、网上查询、微博微信、跟帖论坛等。随着智慧学校的不断发展,校园数据迅速膨胀,其存量越来越大,成为名副其实的“大数据”。教育大数据是在整个教育活动过程中产生的、根据学校教育教学和管理需要而采集的、有巨大潜在应用价值的数据集合。

校园行为数据种类繁多,非常复杂,难以精确整合,不易建立起各类数据间的相关联性,同时对这类数据的处理经验也不足。对于半结构和非结构数据的处理,传统的关联分析、聚类算法等数据挖掘技术已满足不了需求,传统的数据挖掘技术面临着前所未有的冲击和挑战。根据学校的数据体系,我们可以通过校园“一卡通”数据、校园网络监控数据、基础教务数据等数据源收集大数据,并通过大数据处理与分析技术来实施学生校园行为大数据分析,挖掘出教育数据在管理、教学、学习中的实际价值(如图1所示)。

我们可以通过校园“一卡通”各个终端机收集到海量的数据,并且针对具体的教学应用场景进行分析建模。通过大数据技术分析“一卡通”系统中的上课考勤、实验室出入和宿舍门禁等刷卡记录情况,建立学生行为表现预警系统,记录所有在校学生的迟到、早退和旷课次数、体育训练、参加公益活动、课堂测试成绩等数字化信息,达到设定值系统就会自动预警,管理者和辅导员可以根据预警情况及时做出响应和判断。通过分析“一卡通”系统中图书馆借阅情况、学生用餐记录、超市消费情况、学生校医就诊情况、宿舍上网情况等,就可以帮助教师和家长了解学生在学校期间的所有行为情况,分析预测学生的各种行为趋势,并且可根据学生行为的綜合表现,公正、全面地对学生德智体美劳等进行评价,从而实现家校之间的良性互动和沟通,真正管理好在校的学生。通过分析“一卡通”系统中学生的学习专业情况、公共选课情况,分析学生的兴趣和爱好,建立相互关联的自动推荐分析系统,帮助学生更好地进行职业生涯规划;通过分析优秀毕业生的成长经历,让学生非常容易地学习到成功者的经验,同时也帮助学生真正了解自己的特长和兴趣,进一步提高学生将来的社会就业率。

四、学生行为大数据分析关键技术

传统的学生行为管理,往往是经验的、路径依赖式的管理,如今的大数据应用,让我们能主动掌握学生校园行为发生的特点和规律,并可据此做出研判和预测,实现学校“前置式”的管理模式创新。因此,挖掘教育数据在教学管理、教学、学习中的实际价值,开发基于大数据的学生校园行为分析预警管理平台,能够根据学校教学质量、学生日常行为、学生安全管控、学生心理辅导等来进行教育大数据处理与分析,辅助学校管理的宏观决策,辅助教学生产安全管控,包括:金融信贷风险、网络行为、消费行为、旷课行为、挂科、学分不足等一系列的预警,深度挖掘学生心理问题,对有问题的学生进行预警和重点关注。

(一)学生校园行为分析数据采集方法

移动互连、物联网、云计算、社交网络、Web的快速发展让学生校园行为数据前所未有的增长,海量数据中必然蕴含着巨大的价值。当前学生校园行为分析方法主要包括关联分析、特征分析、分类预测、异常分析和TopN分析等,这些都需要采集大量的数据。学生校园行为分析数据包括结构化和非结构化的数据。结构化数据可以通过“一卡通”、网络监控、教务、考勤等校园部署的信息系统进行数据采集和转换。非结构化、半结构化数据大部分来源于互联网、社区论坛等,需要利用数据采集平台,运用云化ETL工具、流数据处理、网络爬虫等工具进行采集。

(二)学生校园行为分析预测模型

学生校园行为分析以统计分析、聚类、预测、关系挖掘、文本挖掘等教育数据挖掘方法为基础,设计与建立学生离群行为分析、学生情感分析等非常规挖掘模型,从学生心理健康测试、精神状态、情感态度、人际关系、行为轨迹、家庭背景、上课考试情况、课外活动情况、各种奖惩统计、微博微信活跃度、宗教信仰等方面进行数据关联性分析,设置各分析系统模块的分级指标和权重比例,深入剖析每位学生的个性特征、行为规律、生活习惯及其智力水平等,建立以影像、图形、文本、語音等非结构化数据为对象的学生校园行为大数据分析安全预警管理模式,做到未雨绸缪,防微杜渐,真正实现“平安校园”的管理目标。

(三)学生行为大数据可视化模型

大数据背后蕴藏着非常大的应用价值,但是如果没有人能够看得懂这些数据背后含义的话,再多的大数据分析方式方法都没有用。通过专业的可视化工具SAS、SPSS建立学生校园行为大数据可视化模型,实现对学生行为大型数据仓库中的数据进行可视化,使管理者不再是简单地通过数据关系表来观察和分析用户数据信息,从而以更直观、更方便的方式观看到所有用户的数据及其结构关系。我们通过对学生行为的数据进行离群点分析,初步形成具有相似行为特征值的聚类分析,最后梳理生成不同主题内容的大数据分析模块。学生在校期间的课堂出勤情况、考试分数、及格率、优秀率等可自动生成不同的动态曲线图,让老师非常直观地掌握学生的学习情况和发展趋势;通过对网络行为监控,可以对使用网络的学生进行热点话题分析,针对重点标注的政治性词语出现的频率,可以分析学生对时事政治敏感问题的关注情况,教师和学生管理者可以根据这些数据进行舆情分析;对学生安全数据的进行系统分析,可以将学生的情绪和态度进行直观可视化,并且针对重点标注“焦虑”“失恋”“愤恨”等负面情绪主题词,实时掌握学生的生理和心理健康问题。还可以根据学生情感问题情况、人际交往记录、行动轨迹信息、常用联系人等数据,跟踪观察在校学生的行动行为轨迹,预先划定学习区域、运动区域和生活区域等人身平安区域,一旦系统出现监测到数据出现不稳定或者超常规的迹象预警时,就要密切关注和跟踪学生的行为,防患于未然。

五、学生校园行为大数据分析预警管理平台的建构

学生校园行为大数据分析预警管理平台采用当前主流的大数据框架Hadoop对数字化校园环境产生的大规模学生行为数据进行采集、加工和分析,建构起大数据与学生管理系统中的相关性联系,形成学生校园行为数据分析系统总体架构;设计学生校园行为分析系统的数据采集框架、功能架构和关键算法,对学生校园行为异构数据进行分布式存储和处理,实现学生行为数据的全面挖掘和深入分析,对学生的行为动态提前掌控,并对重点学生的行为发展做出预判。

(一)平台总体框架设计

基于大数据的学生校园行为分析预警平台采用“1+1+4+N”的总体功能架构设计:1个校园基础数据源;1个大数据基础运行平台;4大平台:数据采集存储平台、综合分析挖掘平台、智能预警平台、安全运行管控平台;N大应用,包括:智能预警、数据挖掘、多维分析、关键指标、专题分析等,如图2所示。

系统将校园大数据学生行为分析中心的四大平台体系分成“3+1”结构,即数据采集与存储平台、分析与挖掘平台、监测与决策平台,以及覆盖整个系统的安全管控平台。数据采集与存储平台的主要职责是对学校管理基础信息和学生行为相关大数据进行收集,并将采集到的数据进行结构化存储和清洗。这是学校的信息数据,也是未来数字学校的最重要资产。分析与挖掘平台的主要职责是对学校采集到的大数据进行专门的分析建模,此后再深入对数据进行挖掘和智能分析。智能预警平台的主要职责是利用大数据技术分析的结论对学生的异常行为进行智能预警,以及产生与之相对应的安全监督措施等。安全管控平台的主要职责是负责整个系统数据监控和数据管理,确保学校的数据资产的安全性和可控性。

(二)平台技术架构

基于大数据的学生校园行为分析预警平台采用典型的大数据技术架构,分为三大层次,即:数据源层、数据处理层和应用层(数据分析挖掘与智能预警层)。数据源层主要有结构化、非结构化和半结构化数据。结构化数据包括“一卡通”、网络监控、教务数据、考勤等系统自动收集到的数据;非结构化、半结构化数据主要来源于互联网、文档等。数据处理层包括数据采集平台(云化ETL工具、流数据处理、网络爬虫等)、数据存储平台(主数据仓库)、数据运算平台(分布式数据库、Hadoop平台等)。数据分析挖掘与智能预警层包括基础分析组件、多维分析组件、数据挖掘组件、实时分析组件、自助分析组件等,如图3所示。

六、结束语

基于大数据的学生校园行为分析预警平台系统是在当前非常流行的Hadoop开源平台下进行二次开发,首先底层数据采集模块进行设计开发、文本化存储模块,实现各种异构数据和非异构数据的采集和文本化;然后用分析算法实现各个功能模块,进一步对各种数据进行挖掘和分析,并采用主流的架构完成相关模块的开发,同时对分析结果进行图形化直观展示。平台系统能够深度挖掘学生行为和心理问题,帮助学校管理者进行教学管理的宏观决策,辅助教学生产安全管控,实现预警指标模型、预警信息产生、预警信息推送等一系列的预警功能,真正实现智慧数字化校园。

猜你喜欢
教育大数据预测模型数据挖掘
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
“教育大数据”视角下的精准教学的研究
教育大数据在教育管理中的运用分析
基于神经网络的北京市房价预测研究
中国石化J分公司油气开发投资分析与预测模型研究
基于IOWHA法的物流需求组合改善与预测模型构建
基于预测模型加扰动控制的最大功率点跟踪研究
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究