丁建英+张钰涵
摘 要 大数据是继云计算和物联网之后IT领域的又一次颠覆性技术创新,大数据时代的到来为陷入瓶颈的信息化校园数据利用提供了新的出路。探讨智慧校园建设现状,基于大数据技术特点,提出基于大数据的智慧校园支撑平台,分析、挖掘隐藏在校园信息化大数据中的教学结果和教学规律,对未来进行预测,以便于教师、学生和教育决策者及时掌握个性化教学状态,改进教育策略,最终真正实现智慧校园。
关键词 大数据;智慧校园;智慧校园支撑平台
中图分类号:G642 文献标识码:B
文章编号:1671-489X(2017)22-0038-03
Construction of Wisdom Campus Support Platform based Big Data//DING Jianying, ZHANG Yuhan
Abstract Big data is another disruptive technological innovation in IT after cloud computing and the Internet of things. The arrival of Big Data Era provides a new way for the information campus data utilization which is in the bottleneck stage. This article discusses the status quo of the wisdom campus, proposes wisdom campus support platform based on the Big data, so as to analyze and excavate the tea-
ching results and rules which is hidded in the campus big data. Then teachers, students and educational decision makers can master the individual teaching state, improve the education strategy timely, and ultimately realize the real wisdom campus.
Key words big data; wisdom campus; wisdom campus support platform
1 前言
2012年,《纽约时报》首次提出“大数据”一词。“大数据”用于命名和描述信息化时代爆发的海量数据以及随之出现的技术革新和发展[1],它是继云计算和物联网之后,互联网领域又一次颠覆性的技术创新,给各行各业的发展带来了极大的机遇[2]。作为新技术应用前沿阵地之一的高校,大数据的概念已经延伸至校园信息化建设中,来重塑校园业务流程、IT基础设施以及对于教育信息、教学资源的获取和使用方式。面对大数据时代的到来,如何构建基于大数據的高校智慧校园服务平台,从根本上促进校园活动的深度融合,是当前高校信息化建设的主题。
2 智慧校园建设现状
智慧校园是数字化校园的进一步发展和延续,它是应用各种新兴的IT技术,如物联网、智能感知、云计算、移动互联和大数据等,在完全感知校园环境,智能识别教师、学生的个别特征和校园教学、生活等场景的基础上,有效整合学校的课堂教学、科学研究、运行管理等方面的资源与应用,为教师和学生建立智能、开放的教育教学环境,改变其知识传递、资源共享和交互协作的方式,将学校物理空间和数字空间有机衔接起来,实现以人为本的个性化创新服务。
智慧校园结构如图1所示。首先是利用物联网络和移动互联网络连接校园网中的各种基础传感设备,创建一个一体化的智能感知环境,实时采集教学设备的运行状态,教师与学生的教学、活动动态,以及生活环境状态信息等,以积累校园教育教学、科学研究、运行管理等各个方面的海量大数据。在此基础上,智慧校园还必须要建立一个基础服务支撑平台,使用先进的技术(如大数据处理技术、数据挖掘技术等)深入分析挖掘校园大数据中有价值的信息,将其转化为上层应用服务的优化依据,为所有上层应用提供存储、计算、共享等服务,从而为教师和学生提供基于角色的个性化教学引导服务;同时引导教育信息化工作者从烦琐的业务中抽身出来,推动业务服务向基于大数据分析的个性化服务模式发展[3],从而真正实现智慧校园的智慧化。
当前大部分高校已经完成智慧校园的基础设施建设,也开展了数据中心建设,考虑了数据的积累和管理,但还没有深入对这些海量教学数据进行分析、挖掘和充分利用。以山西师范大学为例,据不完全统计,截至2016年底,学校核心业务系统的结构化数据总量累计近1300 GB;在非结构化数据方面也积累了大量的课件、视频材料等,然而目前这些海量的基础数据并未得到深入分析和利用。因此,对智慧校园运行过程中积累的海量大数据展开深入分析、挖掘,获取其中蕴藏的知识和价值,为学校的教育决策者、教师和学生提供个性化数据服务的迫切性正逐步呈现出来。
3 大数据概念及特点
“大数据”这个概念最初是在全球知名咨询公司麦肯锡(McKinsey & Company)于2011年5月发布的报告《大数据:创新、竞争和生产力的下一个前沿领域》中提出的。该报告指出:“数据已经渗透到各行各业的职能领域,并且逐步构成了行业发展的重要生产因素;因而人们对于海量数据的高效利用必会带来新一波生产率增长和消费者盈余浪潮的到来。”[4]大数据现在还没有统一的界定,著云台暨《中国云》团队将大数据定义为:企业在运行过程中产生的海量结构化、半结构化以及非结构化数据,而这些海量数据采用关系型数据库分析,将消耗大量的时间以及金钱。信息专家涂子沛认为:大数据并不单单是指容量大,其更深层次意义在于通过对海量异构类型数据的整合、统计以及分析,挖掘出其中蕴藏的知识和价值。IDC将大数据定义为:为了更加快速经济地从海量的、异构类型的数据中挖掘出潜藏价值而设计的新型架构体系以及相关技术。endprint
总结起来,各种表达的共同之处就是:大数据不是传统意义上的海量数据,而是一种数据量很大、数据形式多种多样的非结构化数据,它具有信息容量庞大、信息种类多样化、处理速度快、价值密度低的特点。
1)数据量庞大,指采集、存储和分析的数据量非常大,在实际应用中,很多企业用户把多个数据集放在一起,从TB级别跃升到PB级别、EB级别或者ZB级别。
2)数据种类多。大数据的种类和来源是多样化的,既包含结构化的数据,也包含半结构化以及非结构化等形式的数据,如文字、图片、文档、视音频、网络日志、位置、环境信息等。2012年由互联网数据中心(DCCI)举办的“Adworld2012互动营销世界”指出:2010年,全球数据量已经达到1.2 ZB,然而在如此庞大的数据中,结构化数据大约只占10%,其余的大部分数据则是由视音频、各类文档、位置、环境等组成的大量半结构化数据和非结构化数据[5]。
3)处理速度快。和传统的数据挖掘技术不同,大数据需要对海量数据采取近实时的分析和挖掘。因此,大数据强调利用强大的机器算法和专用技术如数据挖掘、数据仓库和OLAP(联机分析处理)对海量非结构化数据进行科学、快速分析和挖掘。如2011年,日本发生大地震之后仅仅九分钟,美国国家海洋和大气管理局(National Oceanic and
Atmospheric Administration)就通过分析海洋传感器的实时大数据,挖掘出了海啸影响模型,公布了详细的海啸预警[6]。
4)价值密度低。大数据的信息容量极为庞大,然而其中有利用价值的信息少之又少,如时长60分钟的视频中,有利用价值的数据可能仅仅十几秒。
4 基于大数据的智慧校园支撑平台研究
智慧校园的关键特色在于利用校园内的各种智能感知设备、物联网以及移动互联网络等技术,获取海量的教学互动和状态大数据,并基于这些海量大数据的分析挖掘而掌握教与学的相关特征和规律,从而展开智慧的个性化教学应用[7]。这其中的关键就在于对海量数据的分析与挖掘,使得高校师生通过数据不仅知道发生了什么,而且掌握数据背后隐藏的个性化指导信息,以便于他们在教学与学习过程中及时做出相应的调整决策,主动积极地开展个性化的教与学。
面对这些问题,大数据时代提出利用Hadoop技术包括分布式存储HDFS、分布式计算Map Reduce和数据实时反应技术等,对海量的数据进行科学化管理和分析。这个方法通过构建一个基于大数据的智慧校园支撑平台,利用HDFS分布式文件系统为海量非结构化数据提供并行分布存储,确保负载均衡的同时保证数据的可靠性和安全性,并通过Map Reduce并行计算多个任务,提高大数据分析的速度和效率,快速、准确地为上层应用提供智慧服务。基于大数据的智慧校园支撑平台如图2所示。
智能感知层 智能感知层首先利用各种传感技术和传感设备来收集校园活动的原始数据,包括教学设备仪器的工作状态、教师和学生的教学、生活和状态数据等,为智慧校园支撑平台提供海量、多样化的校园基础大数据。
大数据处理层 大数据处理层包括数据采集、数据分析和数据挖掘三个部分。
首先,数据采集是对智能感知层的海量非结构化数据进行数据过滤、数据筛选以及数据存储等操作。其中,数据过滤主要是对海量的大数据展开约束性检查,实施去冗余化等操作,初步保证数据的真实性以及可用性;数据筛选是对海量数据进行多次反复过滤,从而获取到低信息粒度的连续性数据;数据存储则是利用Hadoop中的HDFS技术对经过筛选的非结构化数据进行安全存储。
其次,数据分析是利用Hbase、ZooKeeper等数据处理和管理工具动态生成Map Reduce任务,对经过筛选的非结构化数据(如教室信息云、教师信息云、学生信息资源云、教学信息云等)进行计算和聚合高效处理。并利用Hadoop的ETL处理输出基本模型分析汇总信息,以推断出各种数据之间的细微差异与关系,从而获得有利于优化教与学效果的洞见点。如通过分析教学信息云中学生的课堂学习行为、与他人协作行为、解决问题行为、提交作业行为等学习行为,获取每一个学生的性格特征、学习能力、交互协作能力、资源利用能力以及学习方式倾向等个性化信息,以便于教师和学生根据分析结果做出适当教学调整。
最后,对数据进行分析之后,大数据处理层还要利用回归算法、分类算法、聚合算法等数据挖掘算法对数据进行深层次挖掘,以提取隐藏在数据背后的有价值的信息,对未来的教与学提供相关优化策略。如通过挖掘学生的各类资源点击率和观看率,可以直接预测出学生更倾向于哪种资源。
智慧应用层 智慧应用层是在大数据处理的基础上,获取学生学习能力、性格特征、作息规律等个性化信息,评估目前教师的教学效果以及学生的学习效果,然后对这些个性化的处理数据加以应用,如信息检索、数据可视化应用、教学评估与预测等,从而便于学校各业务部门、教师和学生及时改进。如课程教学之后,及时对学生的学习数据进行分析和挖掘,在此基础上对该课程的后期课时设置、教学环境设置等提出针对性建议。
5 结语
随着高校教育信息化的迅猛发展,各种业务产生的非结构化数据必将会以成倍的速度快速增长,如何科学有效地分析、挖掘大数据中的隐藏价值,使数据真正为高校的教学、科研、管理等发挥指导和预测作用,逐渐成为高校信息化部门的关注焦点。基于大数据的智慧校园支撑平台能够对这些海量的数据展开收集、过滤、深入分析和挖掘等一系列完全操作,从而为高校教育决策者、教师和学生提供教与学的相关特征和规律,以便其开展智慧的个性化教学应用。
参考文献
[1]成果.大数据背景下智慧校园云资源利用研究[J].信息化建设,2016(1):185.
[2]刘中宇,刘海良.基于大数据的云教学环境设计[J].中国教育信息化,2013(24):18-21.
[3]宓詠,赵泽宇.大数据创新智慧校园服务[J].中国教育信息化,2013(24):3-7.
[4]Manyika J, Chui M, Brown B. Big data: The next frontier for innovation competition and productivity[R].USA: McKinsey Global Institute,2011.
[5]Adworid2012互動营销世界夏暨2012微锋汇启动[J].电脑与电信,2012(5):14-15.
[6]佘丛国,朱志军.大数据与云计算的关系及其对通信行业的影响[M]//中国通信学会通信管理委员会学术研讨会暨宽带中国战略与创新学术研讨会.2012.
[7]蒋东兴,付小龙,袁芳,等.大数据背景下的高校智慧校园建设探讨[J].华东师范大学学报:自然科学版,2015(S1):119-125.endprint