李铮铮 庄孝彰 贾金娜 刘梦嘉
大数据时代高等院校教育数据建设研究
李铮铮庄孝彰贾金娜刘梦嘉
1.石家庄陆军指挥学院;2.军械工程学院;3.河北传媒学院;4.河北大学外国语学院李铮铮(1981-)女,汉族,河北石家庄人,工程师,博士研究生,研究方向为军事教育训练技术。
行业曲线
本文针对大数据时代背景下,高等院校教育数据采集获取量大种类多、数据资产规范管理难度大、数据存储处理技术要求高、数据综合服务保障多样化等诸多新挑战,提出了抓好顶层设计、制度与标准编制、关键技术研究和安全保密建设等关键环节,加强数据工程建设的观点,在高等院校教育数据建设领域起到重要借鉴和指导作用。
大数据已经逐步向各个行业和领域蔓延,并不断对人们的知识结构和思维方式产生影响。在教育领域应用大数据技术,能够让参与教育活动的各方受益。本文分析了大数据产生的背景及其本质,详细阐述了大数据时代高等院校教育数据建设在数据采集、管理、处理和应用四个方面面临的新挑战,并总结提出了高等院校开展数据建设应该把握的关键环节。
进入大数据时代,人们得以从更全面、更精细的视角来看待世界的复杂性。在教育领域,大数据蕴含的巨大潜力在于推进个性化学习、改善教材和教学,并最终提高学生的成绩,而这些作用也必将在高等院校教育中得以体现。尤其是处于互联网+教育的当下,高等院校开展的各项教学活动,产生和使用了海量数据。在此背景下,抓好教育数据建设,将其转化为对高等院校教育决策和综合信息服务的有力支撑,切实有效推动高素质创新型人才培养,就显得尤为重要。
大数据产生的背景
最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“我们正在处于一个创新和生产效率快速增长浪潮的潮头,面对着全新的竞争和价值获取模式——所有这一切的推动力就是大数据,消费者、企业和经济部门都在发掘其潜力。”
大数据具有鲜明的时代特征,其产生根源主要是信息技术革命以及信息技术驱动下人们行为方式的改变。过去的50多年里,信息技术不断创新发展并被广泛应用于各行各业,触角遍布社会生活的每个角落,改变着社会的经济结构、生产方式和生活方式,由此产生了海量数据,并呈指数快速增长。究其具体原因,包括以下四个方面:
(1)互联网的广泛应用,吸引和驱动了数以亿计的用户使用互联网进行商品交易、资讯浏览、资料查询、聊天交友、信息共享等,网络应用与用户的操作内容、操作行为共同成为海量数据的重要来源。
(2)移动通信网广泛应用并与互联网结合的越来越紧密,越来越多的人通过以智能手机为典型代表的移动设备进行语音视频通话、短信交流以及访问移动互联网,也带来了数据量的激增。
(3)传感器的广泛使用,产生了大量的实时状态监测数据、影像数据,这些数据持续快速产生,并占据了较大存储空间。
(4)传统文档资料的电子化处理,便捷了查询使用的同时,也产生了大量数字化信息资源。
大数据的本质分析
当前,“大数据”这个术语已被广泛使用,其主要特点可归结为高容量、多样性、快速性和价值低密度四个方面,但对其概念的界定尚未达成共识,不同角度有不同的定义和描述。国际数据公司IDC将其定义为:为了更为经济的从高频率获取的、大容量的、不同结构和类型的数据中获取价值,而设计的新一代架构和技术。高德纳咨询公司Gartner将其定义为:需要新处理模式进行处理才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据的定义与特点既体现了大数据的存在状态,又体现了大数据面临的难题与矛盾,这些必将引发和推动数据存储技术、管理技术和分析技术的革命与创新,最终形成一系列信息技术来为决策服务。因此,大数据的本质集中体现为:
(1)数据本质:是指大数据的数据量远远超过传统理解上的数据量,数据类型和数据来源多样,数据产生速度快及要求的处理速度快,数据的价值密度低。
(2)技术本质:是指需要有以存储技术、管理技术、挖掘分析技术和可视化技术为主要内容的大数据技术体系对海量数据进行处理分析,并为决策服务。
(3)知识本质:是指大数据处理分析的最终目的是从海量数据中发现潜藏的历史规律,或对未来进行预测,以知识的方式辅助做出更好的决策。
高等院校教育数据
在大数据时代背景下,高等院校教育数据建设问题也引起了专业人员的关注。高等院校教育数据主要是指高等院校开展教学活动相关的数据,主要包括教师队伍信息、学生基本信息、课程信息、教材信息、教学活动信息、教学管理与保障信息、科研学术信息、文献资料信息、校园网网络行为数据以及其他通用资源信息等,且在信息技术飞速发展与广泛使用的当下,这些数据也表现出大数据的特征。与此同时,高等院校面临着培养综合型人才、素质型人才、创新型人才的形势任务,如何制定科学有效的培养方案、创新教学培养模式、适时完善教学决策、优化教学资源配置、提供个性化信息服务,都离不开海量教育数据的支撑,也对海量教育数据基础上的数据开发利用提出了更高要求。
大数据的出现对传统思维方式造成了强烈的冲击,其功能和价值的体现建立在海量数据分析的基础上。在这样的时代背景下,高等院校教育数据建设面临诸多新挑战。
数据采集获取量大种类多
先进信息技术使得面向事物的全数据采集成为可能,而足够数量的数据是进行大数据分析的基础和前提,因此数据采集就成为高等院校教育数据分析与应用中的重要一环。高等院校教育数据采集有基于物联网传感器的采集,也有基于网络信息的数据采集,还有基于工作人员的手工采集,需要采集的内容包括与教师和学生相关的基本信息、教学过程中产生的课程信息、教学软件平台使用信息、校园网用户行为信息、文献资料等,其数量之大远在TB级以上。此外,这些数据包括分布在各管理信息系统中的关系型数据、文本数据、访问日志数据、数字化文档资料数据,图片、音频、视频等多媒体数据,类型十分广泛。
此外,当前的高等院校教育数据尚处于自然发展阶段,数据资产意识还不强,需要建立有多部门共同参与的数据收集体系,明确数据采集责任分工、采集内容、采集时机与采集要求等,并考虑建立数据校核机制,确保数据的准确性。
数据资产规范管理难度大
在高等院校信息化水平不断提高、教育数字化程度日益加深的今天,几乎参与教育活动的每个人都卷入到数据及其处理的浪潮中,数据已经成为重要的生产要素和无形资产。但目前的高等院校数据或多或少的面临着数据不完整、数据分散不一致、数据质量低、数据共享集成成本高、数据教学效益不显著等问题,难以对数据进行全面、统一、高效的管理。
以数据分散管理为例,当前很多教学数据分散在不同的信息系统中,数据标准不统一、可用质量差,数据核对、清理、映射工作量大的问题较为突出。尤其是有的学者提出了终身学习、个性化教育的理念,这就需要延伸对于学生相关信息的采集,建立学生终身的学习档案,无形中极大的增加了数据管理的难度,数据的质量也难以得到保证,进而影响了数据的应用。
数据存储处理技术要求高
高等院校教育数据量增长速度快,加上已积累的大量历史数据,对数据存储、处理、分析带来了巨大的挑战,要求其必须具备快速性、准确性和高效性。
在数据存储方面,由于数据的数量、类型、应用对象的不同,要求数据存储必须综合考虑当前需求和长远发展,充分开展传统关系型数据库、数据仓库及面向大数据的NoSQL数据库论证,科学设计数据存储架构。其次,需要突破多源异构教育数据融合的技术瓶颈,扩大深入融合处理数据对象的范围,提高融合效果和性能,实现分散异构教育数据快速融合入库。
在数据处理分析方面,需要加强教育数据实时处理,对相关音视频等复杂类型数据开展内容分析,对教学模式、规律、趋势等进行预测分析,对海量教学数据进行并行处理,从而提高教育数据快速高效处理能力。同时,带动数据处理向知识加工、决策支持等方面进行拓展,进一步提升教育数据的附加值。
数据综合服务保障多样化
“数据是稳定的,处理是多变的”。当前面向高等院校教育的各个方面,产生了多样化的应用需求,如教育决策支持、综合信息服务、个性化信息支持、教学科研服务等。这些应用服务,要求针对存储的海量教育数据进行高效的处理分析,并快速、灵活呈现给用户。例如,教育决策支持问题,需要通过教学过程数据、教学资源数据、教师学生相关数据等的实证分析,才能为课程内容设置、资源优化配置、教学模式评估等提供支撑。再如学生个性化信息支持问题,需要全面掌握学生知识能力基础信息、历次学习情况信息、现阶段学习情况信息等,综合分析学生知识结构、学习能力、学习课程等方面存在的短板,优化教学内容,有针对性的为学生提供课程辅导、推送信息资源,甚至拓展至学生就业后的持续信息服务,切实提高学生的能力素质。
高等院校要想在大数据时代迎头赶上,充分开发利用大数据支持教育决策,就必须把握顶层设计、制度与标准编制、关键技术研究和安全保密建设等关键环节,加强数据工程建设。
突出抓好数据体系顶层设计
高等院校数据建设要主动适应全球信息化发展大势,准确把握高等院校信息化发展的阶段特征,把数据资源建设作为事关高等院校充分发挥作用、可持续发展的重要长期性基础性建设工程和关键性应用工程,提高思想认识,科学开展规划论证与顶层设计。一是开展高等院校数据资源全面摸底,掌握数据资源总体情况,摸清数据资源产生来源和获取渠道,评估数据资源使用现状及存在的主要矛盾问题。二是牢固树立数据体系“一盘棋”思想,将本院校数据体系纳入国家高等院校信息化建设体系中进行统一规划论证,避免出现结构性矛盾,影响高等院校之间甚至国家范围内的数据共建共享。三是综合运用大数据管理、企业架构、信息资源规划等先进理念和技术方法,紧密贴合高等院校教学应用需求,构建科学、合理、可行的高等院校数据体系架构,切实提升数据建设质量,为高等院校教学应用奠定坚实基础。
制定完善数据建设制度与标准
高等院校教育数据建设,需要依据相关数据标准规范,统合各类信息代码,强化主数据管理,确保各信息系统的数据能够综合集成、有效衔接。一是建立数据管理制度。要建立数据采集、处理、维护与使用相关的规章制度,明确高等院校不同职能部门的业务关系,及数据管理的组织机构、职责分工、主要内容与工作流程,确保数据管理工作的规范有序。二是制定数据标准规范。围绕信息分类与编码、数据元素、数据集、数据交换、公共信息模型等内容,开展相关数据标准规范的编制、修订与完善,确保数据的标准化、规范化,以利于高等院校相互间及院校内部的高效集成交换和共享利用。三是建立数据质量管控体系。建立数据质量管理框架,明确数据生命周期所有阶段质量管控的方法、时机与标准,切实提高数据质量,确保教育决策与信息服务的有效性。
突破海量数据开发利用关键技术群
着眼高等院校海量数据效能的发挥,聚焦数据高效采集获取、数据高性能存储、数据深度挖掘分析、数据多样化应用等领域,开展关键技术研究,建立集海量数据“采、存、析、用”于一体的技术解决方案,为现实应用奠定技术基础。一是完成技术体系规划设计,在教学应用分析和数据架构设计的基础上,围绕功能实现,构建技术体系架构,明确需要应用的技术、接口、方法,以及技术过渡、转型的模式等。二是尽快完成高等院校海量数据开发利用技术攻关立项,在获得上级机关认可及经费支持的基础上,加大技术研究的深度和广度,围绕高等院校数据应用的专有问题,切实解决制约海量数据开发利用的瓶颈问题,实现数据从数量规模优势向质量效益优势的跨越。三是评估分析其他行业运用大数据的有关研究成果,采取“拿来主义”,能够直接应用或改造应用的成果,尽快部署应用,节约经费与时间。
配套完善信息安全体系建设
当前,高等院校教育数据运行管理主要依托校园网进行,加强信息安全体系建设、增强信息防御能力,是海量数据效能得以持续稳定发挥的重要保证。一是建立健全高等院校信息安全管理新机制,制定相关规章制度,明确信息安全管理的任务分工、权限要求和方式方法。二是加强信息安全手段建设,依据信息系统建设安全防护等级要求,准确划分信息安全防护等级,加强设施环境、网络环境建设,配套相关安全保密设备,补充完善软件系统功能,提高信息安全防护能力。三是建立数据安全实时动态感知机制,实时监测计算机网络、数据库系统、应用软件系统以及其他附属软硬件的运转情况,准确感知潜在威胁,及时预警并按照规定有效应对,实现数据安全态势的全局性实时掌控。
大数据时代的到来必将对高等院校教育产生深远影响,正如维克托·迈尔-舍恩伯格在《与大数据同行-学习和教育的未来》中指出的那样:“利用大数据,我们可以使决策者得以在全面而坚实的经验基础上改善其决策的质量,从而使教育决策从意识形态的偏见中脱离出来”。目前,大数据在高等院校教育中仍处于研究探索阶段,需要我们紧跟大数据技术发展趋势,结合高等院校教育应用的现实需求,分步骤、有选择的开展应用研究与实践,真正发挥大数据在高等院校教育中的巨大价值。
DOI:10.3969/j.issn.1001- 8972.2016.13.046