杨晔
摘要;随着现代科学技术与经济的不断发展,大数据时代已经来临。在大数据的背景下,我国各大高校也开始了校园的信息化建设。文章基于数字化校园建设过程中的实践经验,对于大数据分析技术在数字校园建设中的应用,以及应用过程中出现的问题,进行了探讨与分析,并提出了适应大数据时代的数字校园建设思路,以进一步推动校园信息化建设的深度发展。
关键词:大数据;数字校园;校园建设;大数据应用;大数据分析技术
中图分类号:TP399 文献标识码:A 文章编号:1009-3044(2017)07-0116-02
1引言
随着互联网技术的进步和云计算等先进计算方法的产生,海量的数据以成倍增长的速度不断生成,开启了大数据的时代。而大数据时代的到来,也为数字化校园的建设带来了一场技术和思想的变革。
2大数据的发展背景
大数据,指的是蕴含巨大价值的海量、高增长率、多样化和复杂关联的信息数据集,其在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据的特征,决定了大数据在数字校园建设中的应用价值,决定了其会对教育信息化的发展产生巨大影响。因此,如何高效的处理这些海量数据,并展现其中蕴含的巨大价值,则成为了关键。
由于在大数据背景下,数据的来源丰富多样、数据的类型也不具备一致性、数据的规模更是非常庞大,而传统的数据存储和分析技术是采用关系型数据库,一般只能处理数据格式一致,规模也较小的数据。因此,需要特有的大数据分析技术,如大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、云计算平台、可扩展的存储系统等,才能分析得出大量额外的有价值信息和数据关系。
3数字校园应用大数据分析技术的优势
数字校园是基于计算机和网络技术建立起来的对教学、科研、管理、技术服务、生活服务等校园信息的收集、处理、整合、存储、传输和应用,再以校园网为基础,实现包括教育教学环境,电子资源,科研活动等方面的,具有整体性的校园信息化管理。
3.1解决海量数据的无用堆积
随着各种信息通讯技术、数据库管理技术以及网络应用的高速发展,基于数字化校园的应用系统、信息系统也越来越多,如教务管理系统、科研管理系统、电子图书馆、OA办公系统等,这也直接导致各应用系统数据库存储的数据量也急剧增大。这些信息系统每天都在产生大量的结构化的、半结构化的以及非结构化的数据,日积月累,大量堆积,但是一方面由于对数据价值的忽视,另一方面基于数据挖掘与数据分析整理的难度,这些宝贵的资源都被弃之不用,导致大量的数据成为数据存储方面的包袱,不但没有产生价值,反而因不能随意丢弃而占用了大量存储空间。
3.2提升管理水平和业务发展水平
由于传统信息系统数据库的查询检索机制和统计分析方法,已经不能适应数据规模剧增情况下的海量数据库。只有通过大数据分析技术,才能对高校的信息资产进行有效的数据挖掘和数据分析操作,从而为学校管理层进行决策提供有力的数据支撑,为教学、科研等方面工作的改进提供合理的统计数据。同时,大数据分析技术还可以通过对信息系统数据的集成,增加师生校园生活的获得感,如对学科建设的支持、校园交通规划和改善、準确快速的网络舆情分析等,从而从根本上改变校园的管理方式及应用水平,充分挖掘宝贵的信息资源,进一步提高业务的发展水平和统计分析水平,辅助教育管理和教育决策,实现从拥有数据到预判需求。
3.3促进信息技术与教学科研的深度融合
大数据分析技术还可以促进教学质量的提升,从而进一步促进信息技术与教育教学的深度融合。比如,通过采集在线学习系统中学生课后习题的完成情况,了解学生知识掌握的情况;采集学生对课外学习资源的访问情况,了解学生的兴趣方向;采集学生课堂的互动信息,了解学生喜爱的课堂教学方式等等,从而改变传统单一化的教学方式,为学生制定个性化的学习指导计划,帮助学生完善知识结构,甚至为学生提供个性化的就业指导。而通过大数据分析技术,在自然科学领域实现的对信息和数据更全面的掌握,则对于无论微观科学还是宏观科学都会带来更加进一步的提升。
4大数据分析技术应用的难关
4.1大数据的清洗
由于在产生和获取数据的过程中,即使是多个数据源,也必然会有大量相同的数据,而这些就会成为数据的冗余。同时,数据的采集过程也伴随着很多无关数据和错误数据的进入,因此数据的清洗就是对大数据进行降噪去冗的处理,从而提高数据的质量,提高大数据的价值密度。但是在清洗的过程中,也会丢失一些有用细节信息。因此如何把握数据清洗的平衡,既保证数据的质量,去冗降噪,又不会因为过度清洗而流失数据的价值,成为大数据分析技术应用的第一道难关。
4.2大数据的集成
大数据必须进行有效的集成,才能成为数据挖掘的基础信息资源,才能发挥其巨大的价值。而当前大数据复杂异构的特性对大数据的整合形成了挑战,结构化数据、半结构化数据以及非结构化数据的大量并存和融合、不同来源不同特征的多种数据混杂,以及不同数据库系统中文件系统差异形成的数据格式的巨大差异,无不造成大数据有效集成的困境。
4.3大数据处理模型的建立
数据的挖掘和分析需要建立数据分析处理模型,但是数据的海量多样、应用场景的各不相同以及各个应用管理系统复杂的业务处理流程,使这些系统的功能模块各有差异,处理框架也是不尽相同,导致很难整合这些碎片化的业务数据。因此,大数据处理模型需要专业的大数据技术人员以及业务领域的专业人员投入大量的时间和精力去研究和梳理业务流程,经过反复的测试和修改才能建立。
5大数据背景下数字化校园的建设思路
5.1基础环境建设
数字校园的建设首先要重视数据采集的基础建设,确保有良好的基础传输网络可以使用,为教学、科研、管理提供无所不在的基础环境。需要充分利用先进的科学技术,按照基本的建设标准,保证大数据能够存储,并能够高速地传输。数据传输更是基础网络建设的重点,尤其是现代化教育对视频等多媒体课程的需求量加大,需要建立良好的基础传输环境。
5.2打破信息孤岛。建立完善的数据采集系统
大数据的集成、分析和管理等技术都是基于尽可能多的、完善的数据资源的基础上才能进行的,而数字校园早期建设的信息系统已经在各自的数据库中存储了大量的历史数据,但是由于早期信息系统的建立大多各自为政,导致这些数据都是处于信息孤岛之中,无法为大数据技术所用。因此,大數据背景下的数字校园,首先就需要打通这些信息孤岛,让所有的数据产生联系,然后再从物理环境和应用环境两个方面,建立一个具备数据采集、存储能力的、较为完善的数据采集系统。物理环境方面主要指数字校园建设中的硬件设施及传感器,比如通过语音教室、数字图书馆、视频监控、一卡通刷卡设备等采集的数据;应用环境方面则是指通过各业务应用系统采集运行过程中产生的大量数据,包括数字校园的统一门户平台及其他云平台软件、虚拟化软件等。
5.3统一数据格式。建立良好的数据标准体系
良好的数据标准体系的建设,能极大地提升并决定数字校园建设的质量与水平。由于数据规模的增长相当迅速,当出现存储设备容量的增长速度跟不上数据规模增长速度的情况时,就会对大数据的集成造成困扰,对大数据的存储同样制造了沉重的压力,而大数据不进行有效的集成和整合就不能发挥其蕴含的巨大价值。在此背景下,统一数据格式、制定数据标准、保障数据来源的唯一性,通过统一的数据交换平台,减少冗余的数据,降低数据源的差异性,进而建立良好的数据标准体系,成为大数据有效集成的必然要求。
6结束语
网络应用、云计算、物联网等技术的发展,为数字校园的建设注入了新鲜的血液,但是同样也带来了新的挑战,例如,如何对海量数据进行去冗降噪处理,提高数据质量和相对降低数据规模,如何进行分析与模型处理等等。作为教育信息化的实践者,数字校园的建设要求我们不断深入学习大数据分析体系的各种技术,而随着对大数据技术的学习和实践,我们也期待看到大数据技术为校园信息化建设带来更多的活力。