张效尉,王 伟,姜 静
(1周口师范学院 网络工程学院,河南 周口 466001;2周口师范学院 计算机科学与技术学院,河南 周口 466001)
当前高校学生测评主要是根据已有的学生成绩信息和量化积分,参照相应的管理制度给出一个分数,作为学生评优评先和评定奖学金的依据,评测结果很难体现学生的学习过程、发展进程,难以成为调节和引导学生发展的风向标,造成学生在校期间过度追求课程学习和奖学金评定,不注重个人全面发展,这已成为高等教育发展的难题[2].针对当前高校综合测评方式单一、人才欠缺、数据挖掘意识不强等状况,高校日积月累的学生数据并没有得到有效的开发和利用,要盘活学生数据,挖掘出数据背后的信息,只靠人工是无法完成的,“互联网+”时代必须借助于新一代信息技术.
随着计算机和网络技术的不断发展与普及,20世纪90年代,国内高校开始建设校园网,初期以建设硬件基础设施为主,建成校园内部网络系统,对外通过路由设备接入广域网,满足校园内部用户的上网需要.进入21世纪后,国内高校开始以数字化信息和校园网络为基础建设数字化校园,相继开发针对人事、教务、财务等各个部门的信息管理系统,实现办公自动化,提高学校的工作效率和管理水平.伴随云计算、大数据、物联网、移动互联网等技术的发展,高校纷纷建设智慧校园,开始高校信息化建设的新阶段,利用云计算建设网络基础设施,收集物联网和移动互联网使用过程中的数据,使用大数据技术挖掘潜在的有用信息,以提高服务的灵活性、全面性和易用性,从而实现校园智慧化服务和管理的新模式[3].“互联网+”时代,针对当前高校学生测评的状况,利用新一代信息技术,完成高校学生信息的采集、存储、分析与可视化,是当前高校提高学生测评水平所必须解决的问题.
大数据时代,学生数据量激增,数据类型多样,针对高校学生综合测评体系不完善的现状,需分析出有价值的信息,使学生在校各个方面量化测评成为可能.在已构建的数字化校园的基础上,依据现有数据平台,逐步完善各种数据源,提高数据质量,建立跨不同业务职能部门与各种应用系统、综合测评学生在校情况的分析挖掘和结果展现平台.建立在大数据之上的高校学生综合测评系统,应遵循以下几个方面的设计原则[4].
2.1.1合理收集和整合内部资源,搭建统一数据平台
海量数据是大数据分析的原材料,需利用技术手段采集学生日常行为数据,可以研究通过技术手段如日志信息收集、物联网设备采集等合法途径获取数据,如根据学生一卡通使用情况,获得高校学生日常消费,进出宿舍和图书馆等大量学生行为信息.与此同时,高校的每个管理部门都会产生与学生相关的数据,如学生处、教务处、图书馆、后勤保障处、网络中心等,不同部门将本部门产生的数据保存在各自数据库中,以供本部门系统日常工作运行.学生作为一个独立的个体,其产生的数据不能分割开来单独测定,需将不同部门数据库中的数据进行提取、转换和加载,按照统一的格式整合起来,放到一个中心数据库中,打破业务部门间的数据界限,实现数据“1+1>2”的使用效果.
2.1.2重视大数据技术的应用
随着智慧校园的建设,对学生信息的全面感知,形成学生数据体量大,数据达到TB级或PB级;数据类型多,除了传统存储在关系数据库中的结构化数据,未来学生综合测评中,还需考虑学生上网日志、微博发表文字和图片、监控视频等半结构化和非结构化的信息;数据量的增大,类型的繁多,使得存储和处理学生数据时,需考虑当前流行的大数据处理平台,比如Hadoop、Spark和MangoDB分布式数据库等大数据的分析与存储工具[5].
2.1.3注重关系挖掘,综合测评学生在校表现
大数据技术价值的核心在于从海量数据中挖掘出不同类型数据的相关性,而非单纯的考虑因果关系,自然界各种事物存在必然的逻辑关系,分析挖掘出事物之间的潜在关系,为人们的决策提供参考,是大数据的真正意义所在.如学生吃早餐与学习成绩,这两个看似不相关的问题,实则有很大的相关性,经过分析挖掘后就会发现成绩好的学生早上会吃早餐,因为他们早上要去上课,学习本身也要消耗大量体力,而成绩差的学生吃早餐的次数就少,他们不愿起床上课.充分利用大数据技术分析学生信息,构建学生综合测评的新方法,不能只考虑硬性指标和测评结论等方面,要考虑针对学生的个性化差异进行分析和过程性引导,使新评测体系既注重整体性,又兼顾差异化,既注重定性分析,又兼顾定量分析.
“互联网+”时代高校学生测评系统的构建,需要以云计算作为平台支撑,以大数据为处理核心,以智能感知作为主要信息来源,实现对学生信息的智能分析[6],其具体系统结构如图1所示.
图1 学生综合测评系统结构图
(1)智能感知层.学生在校期间,通过校园网和无线网络登录慕课与各种在线学习系统进行日常学习,弥补传统课堂教学的不足,学生在线学习点击的过程中,留下了大量的行为操作日志.通过校园一卡通刷卡,学生留下消费和行为习惯记录,同时学生使用微博、QQ空间等发布图片、文字和位置等信息.通过采用物联网技术实现的校园一卡通和各种感应技术,全面感知学生在校的行为信息,实现数据的实时采集,为大数据分析提供数据源保证.这些海量的学生信息为通过数据挖掘手段,获得学生在校的生活规律提供可能,感知层建立了现实世界与物理世界连接的桥梁.在高校学生综合测评系统建设过程中,主要考虑学校各部门应用系统中存储的学生信息和一卡通使用过程中学生的日常行为日志信息作为数据源.
(2)网络通信层.智慧校园建设过程中,信息传输必不可少,决定信息的流动过程,保证系统之间的信息交换.近年来,有线网络不断发展的同时,移动通信技术快速发展且逐渐起主导作用,人们进入4G 时代,当前的网络具有传输速度快、安全性能高、运行稳定性强、覆盖面广等特点,为实现设备之间的彻底互联互通提供保证.学生通过有线网络和无线网络,随时随地地接入实现高速互联,保证数据及时传输,当前建立学生测评系统网络方面的基础条件已经具备.
(3)云计算与大数据层.在学生测评系统建设中,云计算与大数据层是核心,利用云存储保存采集的学生相关海量数据信息,使用云计算的分布式处理能力计算数据,采用大数据技术合理地分析学生数据,构建数据挖掘模型,利用建立的测评模型评价和预测学生的行为.学生综合测评系统的基础云计算平台设计时,考虑到系统的易用性、稳定性、与学校原有平台的兼容性,不同于当前企业大多采用开源的Openstack平台.项目采用VMware公司企业版的虚拟化软件vSphere 5.5,在该软件基础上部署多台虚拟机,安装上Ubuntu Linux操作系统,提供分布式计算能力.海量学生数据在存储时,在传统的磁盘冗余阵列基础上,引入分布式网络存储技术,在云计算平台上部署Hadoop系统,打造大数据处理生态圈,利用Hadoop系统中的HDFS分布式文件系统存储学生日积月累产生的大量数据.同时,为进一步提升数据分析的能力,项目采用当前流行的Spark平台分析处理数据,相对于 Hadoop的MapReduce计算处理框架,Spark在内存中运行,速度更快,Spark SQL允许开发人员采用类似SQL语句的方式分析数据,Spark Streaming保证系统可以实时处理学生数据,MLlib保证系统可以采用调用库的形式使用机器学习算法处理数据.
针对学生在校产生数据进行分析的模块,设计过程分两部分实现:①针对学生总体信息统计、一卡通消费、进出宿舍和图书馆等方面的分析,采用Java语言编写程序调用Mysql数据库接口,利用SQL语言中的命令和函数实现数据的统计与计算,该部分属于系统功能性的实现,因学生数据量庞大,故采用Hadoop中的Hive与Spark平台中的Spark SQL结合实现.②针对学生在校情况综合测评模块,采用数据挖掘和机器学习的方法,从学生的个人信息、一卡通消费、课程成绩、进出宿舍和图书馆等方面提取影响测评结果的特征,采用Apriori关联规则算法、逻辑回归、聚类等多种模型分析学生的行为,给出学生在校情况的好与差判断.
(4)可视化层.将学生数据分析处理的结果通过网页设计技术可视化显示,用户通过各种智能终端查看结果,与系统进行交互.学生测评的结果可视化展示时,应简洁美观,多采用图表等形式,直观地显示学生测评的情况,同时应考虑移动端的显示,使用户无论所处任何环境,都可以查看,以贴心的服务,提升用户体验.分析结果可视化展示一般采用JavaScript或D3.js方法.
高校学生综合体系构建过程中,要弄清楚从大数据中得到什么,目标是否明确,分析的结果是否科学可靠,否则很容易浪费人力、物力和财力,走进数据挖掘的迷途.“互联网+”时代,大数据技术的利用,数据海量、类型多样且多源异构,使数据分析结果错误的风险增加,探寻有价值的信息困难.因此,学生综合测评体系构建时,要目标明确,定义清晰,科学拟定体系结构和设计指标,从高质量的数据中选取指标,使其能构成一个相互联系,相互制约的有机整体,全面反映学生在校各个方面的情况.学生测评体系构建时,即要注重学生群体的宏观分析,又要针对单个学生个体的习惯爱好和成长需求实现微观分析;既要注重学生平时表现的定性分析,又要从数据结果中定量分析;既要保证测评体系的操作可行性,又要注重测评结果的科学性[7].
随着教育信息化的发展,高校建立的基础设施和应用系统中积累了海量数据,并且数据的增长速度伴随“互联网+”行动计划的开展,大量新业务系统的部署正迅猛增加,但是当前学生数据分析和挖掘工作还非常有限,大量的工作体现在学生信息的统计分析,缺少成熟的系统和学生信息被开发利用的成功案例.造成上述情况的主要问题是大数据时代,数据的类型不再局限于数字,大量文字、图片和视频数据的出现,给数据分析带来新数据源,目前针对非结构化数据分析技术不成熟,给数据分析带来难度[8].未来的学生信息挖掘,要改变现有数据分析的思维模式,充分利用大数据分析的技术,采用数据分析的最新研究成果和技术,利用Hadoop和Spark等开源数据平台,服务于学生综合测评系统等高校数据分析挖掘系统.
高校学生使用校园网留下访问日志,一卡通消费记录学生日常开支,手机无线定位记录学生位置信息等,这些学生行为数据为大数据分析提供数据源保证,但同时也带来一个新问题,即学生的个人隐私保护,如何在现有法律下合理利用数据,又不侵犯学生的隐私,是高校建设学生综合测评系统中所必须考虑的问题,否则会带来一系列的法律纠纷和其他恶性事件.高校学生综合测评系统构建过程中,要充分重视学生的隐私保护,具体应体现如下:①建立防火墙等措施保障网络安全,防止数据被不法获取;②针对数据管理和使用人员,进行安全教育,设置各类人员的访问权限,区分数据管理者和开发者,建立数据仓库,使开发者只能访问数据仓库中的数据;③制定制度保障学生综合测评结果的保密性,对外公开给学生的结果应科学可信,不涉及隐私,不恶意传播,重视对学生进行系统分析结果的宣传和解释,消除学生对测评系统的误解和疑虑,将测评结果作为学生在校情况分析的辅助工具[9].
目前,高校教育信息化的工作大多由网络中心承担,受限于编制和业务范围,网络中心人员较少,大部分网络和系统的运维交由专业公司完成,网络中心变为介于行政和技术业务之间的部门,即承担教育信息化方面方案的提出,日常的管理,又需要对接公司,完成整个学校网络和各业务系统的正常运行.上述情况造成网络中心人员少且工作任务繁重,无法形成专业团队进行数据的整理和分析,更难于实施像学生测评体系的构建和系统的研发等业务需求.高校应组建专业的团队和人员完成类似高校学生综合测评体系的构建等业务的需求分析、系统的设计、数据挖掘模型的构建、可视化分析结果、系统的测试和运维等工作,真正在“互联网+”时代为高校教育信息化提供制度和人才保证.
在“互联网+”时代,运用云计算、大数据、物联网技术搭建学生信息处理的平台,综合分析学生的学习动态数据和日常行为数据,利用统计和机器学习的大数据分析方法,验证所提出的学生综合测评方法的效果,完善高校现有的学生综合测评体系.通过构建能综合反映学生在校情况的测评体系,良好的可视化结果查看页面,不仅学生能及时了解自我,而且能为相关管理部门的决策提供依据,使所提出的学生综合测评体系能成为引导学生在校生活和学习的风向标,用更正确的方向指引学生度过美好的大学生活,提升高校教学质量.
参考文献:
[1]蒋东兴,付小龙,袁芳,等.大数据背景下的高校智慧校园建设探讨[J].华东师范大学学报(自然科学版),2015,S1(3):122-123.
[2]丁铁.大数据背景下高职院校学生综合测评的探析[J].南方职业教育学刊,2014,4(3):53-56.
[3]刘湘玉.建好数字化校园提升地方高校的办学水平[J].中国高等教育,2013,3(23):56-57.
[4]何伟,胡莹莹.基于大数据分析的高校学生安全预警管理模式建设初探[J].学校党建与思想教育,2015,15(3):78-79.
[5]宓詠,赵泽宇.大数据创新智慧校园服务[J].中国教育信息化,2013,2(24):3-7.
[6]王珺.大数据视角下高校智慧校园信息化建设创新研究[J].学术探讨,2015,8(5):83-84.
[7]吴雷.大数据助力高校网络思想政治教育创新的长效机制构建[J].淮海工学院学报(人文社会科学版),2015,13(3):124-125.
[8]姚琪.大数据在“智慧校园”中的价值研究[J].理论研究,2013,6(8):92-93.
[9]逢索,魏星.大数据在高校思想政治教育工作中的运用[J].思想理论教育,2015,7(6):72-75.