胡培培
(无锡科技职业学院 学工处,江苏 无锡 214028)
近年来,大数据的研究和应用越来越广泛,催生了社会诸多领域的变革。在教育领域,大数据对教学、学习、管理、评价、科研、服务等教育主流业务提供智慧支撑,改变了传统教育思维方式,为破解传统教育难题提供了新思路。其中,利用大数据完善学生资助体系是较典型的应用。
目前,普通高校建立了以“奖、助、贷、勤、减、补”等多种形式并举的资助政策体系,资助额度和人数逐渐增加,资助覆盖面不断扩大,但在实践中存在 “精准资助”定位不准、资助资源浪费严重、跟踪监督不到位、育人工作跟不上等问题。在目前没有健全、畅通的渠道了解学生家庭经济状况的前提下,大数据可以作为解决以上问题的一种尝试。
大数据是指无法在一定时间内用常规软件工具对其内容进行抓取处理的数据集[1]。学校大数据中心可以采集贫困生的校内外数据处理并分析,在大数据的驱动下,高校资助工作可以更加量化与科学化。
(1)有利于资助政策的完善。每年教育部资助中心都会发布当年资助发展报告,用大数据解读全国资助发展情况,通过了解优势和不足,为下年资助政策制定与决策提供依据,各高校也应如此。
(2)有利于提高资助精准性。教育部长袁贵仁在2015 年全国教育工作会议上明确提出: “要提高国家资助政策的精准度,确保国家学生资助、奖补等优惠政策真正落实到每一个需要帮扶的学生身上。”[2]通过对贫困生校内外数据的采集和深度挖掘,全面掌握学生家庭经济和生活实际情况,改变以往单凭学生申报的家庭经济情况分配资助资源的做法,建立实行动态资助体系,提高资助精准度。
(3)有利于育人工作的开展。高校资助工作的重心逐渐从物质资助转为精神资助,重视贫困生健康人格和能力的培养。大数据可以监督学生的学业和道德成长情况,对于发现学生成绩明显下降或者参加培训、活动次数少的及时给予指导,同时结合就业大数据优先推荐贫困生就业。
(4)有利于资助工作创新研究。以前高校为甄别贫困学生,想了很多办法,包括竞选贫困生、评议贫困生,这些做法遭遇不尊重学生隐私的质疑,而大数据通过权限设置可以保证学生信息安全。
智能资助的关键是贫困生信息的全面采集和处理,在建构智能资助大数据技术体系的过程中,“三权分立”模式是一种趋势,即数据采集、存储管理、数据分析使用过程的安全保护由不同的管理决策者来执行,以保证贫困生信息的安全。
按照资助大数据的全流程管理过程,在标准规范的约束下,智能资助大数据技术架构包括如下五层,具体组成与技术实现如表1所示。
表1 智能资助大数据技术架构
第一,数据采集层。他是整个智能资助系统的基础层。所采集的数据包括静态的贫困生情况调查表,动态的智能手机、电脑、传感器、监视器等采集的贫困生校内外信息等。
第二,数据传输层。他负责将采集到的成千上万的贫困生信息通过光传输、通信与网络设备等传输到大数据处理中心进行处理,网络性能是重要参数指标。
第三,数据存储层。他用于存储传输到数据中心的各种数据,主要包括服务器、存储器、数据中心和云服务。高校需要有一个高度自动化、可横向扩展的存储与计算平台,绿色数据中心(指数据机房中的IT系统、制冷、照明和电气等能取得最大化的能源效率和最小化的环境影响)支撑着智慧校园各个上层应用。
第四,数据处理层。他是智能资助系统的核心,贫困生数据传输到大数据中心的各类数据库上存储起来后,通过各种平台软件群进行分析预测,经过计算机一系列精密算法,处理生成各种需要的数据,以可视化的形式展示所需要的信息。
第五,数据应用层。他将可视化展示的信息经数据接口提供给应用层,为资助决策者提供信息的查询、分类、决策、预警、趋势判断等应用服务。
在智能资助大数据技术架构基础上搭建大数据计算平台,以平台为核心开发实现数据处理各环节的多个应用系统,通过应用系统和平台的协调运行,实现智能资助。
处理贫困生信息的技术有两类:一类是定期总结并处理贫困生家庭情况、经济水平、消费水平等数据的大批量处理技术,如目前广泛使用的Hadoop和Spark;另一类是实时处理贫困生监控信息的流式数据处理技术,如Storm。这三种计算平台的特点和应用情况如下:
(1)处理海量数据的开源分布式技术Hadoop。他是由Apache基金会开发的分布式系统开源框架,其核心是HDFS和Mapreduce,以高性能、可拓展性强、简单、高效受大众关注,是大数据处理领域实际上的标准,Hadoop衍生出Common、Aaro、Hiver、Hbase等多个生态圈项目。目前,该技术普遍应用于电子商务(如淘宝)、金融模拟、文件处理、海量日志分析、广告投放等领域。Hoodoop是离线批处理平台,引入SQL高级查询语言,如PIG和HIVE。他是对关系型数据库的补充,擅长处理结构化数据,也可以用于处理文本和图像等没有固定属性的非结构化数据。在智能资助中,由于采集的贫困生信息大都具有固定属性、能用关系模型刻画的结构化数据,具有非实时性,因此高校大多数使用Hadoop技术。
(2)处理速度更快的分布式处理系统Spark。他拥有Hadoop Mapreduce的所有优点,在用于复杂的迭代算法(如机器学习、图挖掘算法)和交互式数据挖掘算法方面更具优势,其核心是RDD技术。在智能资助中,有些贫困生数据可能是通过智能手机终端、SNS等获得的,而Spark Graphx和Mlib结合使用非常适用于微信、微博、社交网络、电子商务等智能化数据的挖掘。与Hadoop相比,Sparks拥有更快、更通用、更好的容错性能,迭代运算效率更高,他是以后高校智能资助大数据处理技术的运用趋势。
(3)处理实时数据的流计算系统Storm。Storm的核心概念是流,由Nibus、Zookeeper、Supervisor三大组件组成,其特点是流式数据和实时计算。该技术被广泛应用于实时场景如广告推送、实时监控、社交网络分析、实时交易系统等。Storm技术可以解决某些实时性要求比较高的贫困生信息,如突发状况、资助资金使用情况的实时监控等,他是今后高校大数据处理技术发展的趋势。
高校在运行过程中,可选择采用不同的技术平台对不同类型资助数据进行处理和挖掘。
智能资助大数据全流程包括资助数据的采集、处理、分析、展示和应用五个关键环节。具体过程如下:
对贫困生信息进行全方位采集是实现智能资助的基础。它主要通过传感器、互联网、业务数据表、日常观察等采集贫困生家庭经济、消费、资助情况、学习、社会活动等方面的数据,用于判断贫困生家庭经济情况和成长情况。贫困生信息采集分在线自动采集和线下观察两种。自动采集数据包括学生基本信息(家庭成员数、成员健康状况、家庭收入、家庭经济情况等),学生在校数据(食堂消费、超市消费、休闲场所消费、门禁记录等),困难申请记录(国家资助次数与金额、助学贷款次数与金额、勤工助学次数与金额等);日常观察数据包括学习表现和生活表现。
数据处理是实现智能资助的重要支撑。数据处理就是借助数据管理和分析工具,对采集的贫困生大数据按照数据类型进行分类、识别、转换、计算、检索,逐步形成描述某一主题的信息集合过程。它包括数据清洗、规范化处理、综合性处理、数据存储、数据交换等步骤。随着智能校园建设的推进,资助数据类型越来越丰富,半结构化和非结构化数据所占比重越来越大,这就需要先对资助数据进行整合和存储,以便进行后期数据分析。
数据分析是实现智能资助的关键环节。利用商业智能(business intelligence )、机器学习、数据挖掘、预测分析等技术对资助数据分析,挖掘贫困生数据以实现资助目标。
在智能资助数据分析中会运用很多大数据挖掘算法模型实现分析目标,如可以利用新型聚类分析算法分析资助绩效评估,新型人工智能网络和决策树算法分析预测未来贫困生发展情况,SVM支持向量机精准分类贫困生贫困层次,蒙特卡洛算法认定贫困生资格,深度学习算法识别图像、语音和人工智能领域的信息。在挖掘方案方面采用基于SPARK的MLbase挖掘工具,自动化分布式挖掘,设计简单,自动找算法,自己选择和优化,产出最优的模型和计算结果。当然也可以采用基于HADOOP的Mahout,实施海量分布式数据挖掘,但需要使用者具备机器学习能力,选择想要的算法和参数。
该过程是分析出数据结果以后,以直观的方式展现给用户,以便服务于决策支撑,它是资助大数据分析的重要环节,如何让复杂的分析结果易于理解是技术解决的重要问题,可视化技术的发展解决了这一难题。
可视化是用户可以见到的一种大数据表现形式。他将大量复杂的数据自动转化成直观图表,能提供多种进行数据分析的图形方法。他能够反应信息模式、数据关联或趋势,帮决策者直观观察和分析数据。目前,基于2D的图形图像展示方式和基于3D的多维展示交互技术发展迅猛,常见的工具有VISualeyes、Google Trends、Zoomdata等。精准资助认定的结果界面上逐条显示精准资助认定结果的学生信息,如姓名、学号、年级、学院等。
资助数据展示的结果是为了更好地开展应用,如精准认定、优化资助策略、动态管理、预警异常状态、指导贫困生成长成才等。不同的应用目标需要不同的数据展示图。当然技术要和人很好地配合,对于技术分析的结果要进行人员二次确认,加强对贫困生的人文关怀,真正实现精准资助和感恩育人的资助目标。
高校在具体技术实施过程中,因师资和资金问题,可采取与企业合作的形式,利用企业技术和人才优势,购买企业提供的教育大数据技术产品与服务,如成都寻道科技有限公司精准资助认定系统。从而把有限精力投入到更好地为学生服务中去。
高校在实施智能资助过程中,可以按精准认定—精准资助—动态调整—预警机制—人文关怀模式进行,操作如下:
根据大数据分析结果将贫困生贫困情况分等级,评定标准各高校可以根据自身情况制定。有的高校是根据家庭经济情况,有的高校是根据学生在校消费情况,有的高校是根据统一的贫困生认定指标确定困难指数。
根据认定结果发放奖助项目。高校的奖助项目很多,为了最优化资助资源,避免浪费,发放的基础是依据成本理论和教育分担原则,评估学生家庭经济状况,学校发放奖助总金额=年教育成本-(年家庭总收入-年家庭总支出),总金额不高于年教育成本。在实施中,根据贫困等级,特困奖助最高额为年教育总成本,比较贫困金额为部分学费+年成活费总额,一般贫困奖助最高额为年生活费总额。特困生可以减免学费和给予生活补助。
资助大数据管理系统可以记录学生日常消费和行为,通过数据分析调整贫困等级,对比分析学生困难情况与获得资助信息情况,评估学生获得资助是否满足学习和生活的经济需求,协助学校及时调整资助资源,避免资助不足和过度资助。对日常消费的分析要注意时间均衡性,可选取一学期校内月消费均值作为调整贫困等级的参考标准。
大数据系统可以预警经济和学习行为波动较大的学生,提醒资助管理者注意。对于预警的学生,资助老师要及时核对情况,对于经济突发困难的要及时给予补助,对于学习成绩下降大的要及时给予指导。
资助管理者要保护贫困生信息安全,尊重学生隐私与自尊心,给学生营造良好的大学校园环境;心理老师要开展多种形式的贫困生心理辅导、心理咨询;辅导员和班主任要关心贫困生的日常生活情况,鼓励他们成长成才;学校要开展多种形式的针对贫困生的技能培训、实习实训和勤工俭学,提高他们的就业能力;就业部门加强对贫困生就业推进和指导,使贫困生早日走上工作岗位。
成都电子科技大学(以下简称“成电”)应用了寻道科技研发的“精准资助”系统,该系统有线下流程电子化、大数据精准认定贫困生以及贫困生动态管理三大功能[3]。新生报道前,登录界面进入智能系统,点击学号完善个人信息后进入智能助困系统界面,填写个人信息,系统将采集新生家庭经济及成员信息、学生本人及受资助信息、学生所在生源地经济水平信息、学生日常消费评价等涵盖4大类、40余个小类的上千万条数据。通过大数据的挖掘与分析,自动生成家庭经济困难新生名单。学生在校期间,收集校内消费数据,如食堂饭卡、超市消费、健身馆消费、乘坐校际班车、水卡等,分析学生的消费水平,通过计算机一系列精密的算法,系统判定学生的困难指数(1~9),困难指数越高则代表越贫困。学生被分为不困难、一般困难、困难和特困4大类。最终,系统筛选出了200名最需要资助的学生。将此名单与各学院辅导员进行一一核对,反馈挖掘的困难学生名单准确率100%。
系统还可以精准把握不同年级、不同民族、不同类别、不同去向的学生资助需求,实现差异性资助。如针对品学兼优的学生组织企业参观实习、短期出国交流,针对少数民族同学设立少数民族学生奖学金,针对有志于服务西部、选择基层就业的学生发放求职交通补助等。
为了动态完善受助学生数据库,学校每年寒暑假还将开展“百名辅导员实地走访经济困难学生家庭”活动。此外,学校也将建立学生网络征信档案体系,对学生资助申请材料进行核实,将申请资助过程中的不诚信行为记入学生诚信档案。
6.2.1采用与企业合作的形式 成电采用的是寻道科技大数据研究所开发的家庭经济困难学生精准识别系统“智慧助困系统”,公司提供系统维护、功能定制与后续服务等功能。与企业合作,高校即避开大数据应用人才与管理等方面缺失,又节约了开发资金。
6.2.2精准识别与动态管理 该系统在线全面采集学生数据,动态记录学生消费、行为轨迹,运用大数据算法,从多行为轨迹、人脉关系、学生消费、家庭背景、助贷记录五个维度建立学生经济水平评估模型[4],对比分析学生困难指数和贷款记录,评估学生是否需要资助与资助额度,真正实现“资助智能管理,资源利用更加精准”的目标。系统一旦发现学生经济情况好转,则停止或减少资助力度;经济情况变差,则增加或加大资助力度。
6.2.3以人为本的资助 成电把资助育人工作贯穿学生成才全过程,注重学生心理健康成长。入学前建立联系,介绍资助政策,提供来校路费;在校期间实施一对一帮扶、实地走访、差异性资助,注重提升学生就业能力;毕业后持续关注基层就业、服兵役等后续资助,真正做到“让每一个贫困生都活得精彩”的目标。
精准资助和育人教育是今后我国学生资助工作的两大目标。大数据技术可以很好地解决贫困大学生认定、资助、管理以及社会资源的收集、分配、监督等问题,为助力贫困生成长成才提供可靠的帮助。
[1] 赵勇.大数据革命:理论、技术和创新模式[M].北京:电子工业出版社,2014:3.
[2] 中国教育报.全面深化综合改革全面加强依法治教加快推进教育现代化:袁贵仁部长在2015年全国教育工作会议上的讲话[EB/OL].(2015-01-22)[2017-08-21]. http://old.moe.gov.cn//publicfiles/business/htmlfiles/moe/moe_176/201502/183984.html.
[3] 中国教育资讯网.创新新生扶贫 “精准资助”系统获央视点赞[EB/OL]. (2016-09-19)[ 2017-08-21][EB/OL].http://learning.sohu.com/20160919/n4686925-11.shtml.
[4] 成都寻到科技有限公司.寻到科技精准扶贫[EB/OL].(2016-12-11)[ 2017-08-21] http://www.xdbigdata.com/public/template/helpDetail.html.