韩泉叶 贺国旗 高宏文
摘 要:智慧校园建设是一项复杂的系统工程。文章首先介绍了智慧校园的基本概念,然后以教育信息化2.0为背景,在数据生命周期概念的基础上,提出了基于数据生命周期的智慧校园设计,并详细阐述了设计中涵盖的主要组成部分及其功能内容。同时,文章梳理了数据在整个智慧校园系统中的产生、存储、应用和消亡过程,并对基于数据生命周期的智慧校园原型进行部署实现,对原型部署后的完善与扩建给出建议。
关键词:数据生命周期;智慧校园;原型实现
中图分类号:TP315 文献标志码:A 文章编号:1673-8454(2021)13-0059-04
随着“互联网+”战略的大力实施,以移动网络提速和用户终端提质为主要代表的信息技术革命,正深刻影响和改变着我们的工作生活。“互联网+教育”使得更多优质教育资源通过互联网共享[1]。物联网、云计算、大数据等技术催生的智慧校园,其建设和管理将越来越依赖于大数据,通过更深入的数据治理与挖掘,为学校教学、管理提供科学决策依据的同时,也给广大员工带来便利。
一、智慧校园概述
智慧校园是运用“云计算、物联网、大数据、人工智能、移动互联”等技术手段,把学校分散的、相互独立的信息系统和资源整合为一个具有高度感知能力、协同能力和服务能力的集成系统[2]。这个集成系统以各种应用服务系统为载体,将教学、科研、管理、服务和校园生活进行充分融合,经过数据采集、融合、治理、分析与挖掘,得到各种有价值的数据信息,实现学院管理精细化、服务精益化、资源节约化、环境绿色化。最终呈现泛在的学习环境、精准的信息服务、一体化的院校管理模式。
二、基于数据生命周期的智慧校园设计
1.数据生命周期
数据生命周期是指数据从产生到消亡的全过程,分为四大阶段,包括数据生成的“入”期、数据存储的“存”期、数据应用的“用”期和数据退出的“出”期。
“入”期包括数据的定义和采集。有效的数据管理始于数据产生之前,首先要做好数据需求计划,对数据标准进行定义,制定数据管理规范,确保数据按照标准产生,从源头抓起。然后数据因各种终端设备采集而产生。
“存”期包括传输、存储和集成。集成是按照数据标准转换数据从而打通数据孤岛,实现数据共享、交换,让数据在集成系统中流动起来,才能发挥更大价值。只有实现了数据集成,数据仓库才能称之为数据仓库,集成程度不同,数据仓库的作用深度不同,否则即使把数据集中起来存储,也只能叫数据垃圾堆。
“用”是数据真正产生价值的期間。数据因使用而升值,用处越多价值越大,包括数据治理和发现。该期间数据的最大价值在于数据复用和服务复用,对于节省成本、提高效率非常重要。
数据的“出”期也非常重要。虽然存储设备的价格越来越低,但产生的数据如不加以管理,会产生很大的负担,不利于数据资产的整体效益。更有甚者,本该归档或者清除的数据和“活跃”数据存放在一起,将严重影响效率。
2.基于数据生命周期的智慧校园设计
经过对智慧校园涵盖内容、组成部分进行分析,依据智慧校园中数据的生命周期及其管理意义,对基于数据生命周期的智慧校园进行设计,架构如图1所示。
图1由应用终端、应用平台、数据中心、泛在网络与信息安全空间几大部分组成,在泛在网络与信息安全空间下,数据通过各种应用终端经过统一身份认证或实时采集进入各应用系统且存储于数据库,成为原始数据。箭头表示在智慧校园中数据或信息的流动方向。数据信息可通过请求、响应、抽取、转换、加载、建模等方式来往于终端、统一认证系统、应用系统、数据仓库和支撑平台之间,完成搜索、浏览、下载和管理等。
(1)应用终端
应用终端包括通过C/S或B/S技术访问接入的应用终端(非感知终端)和通过射频、图像等技术实时采集数据的应用终端(感知终端)。其中,感知终端包括传感器、电子标签、量测装置、监测装置、采集终端、定位终端、边缘网关等,可实现状态感知、量值传递、环境监测、行为追踪等数据信息的感知输入,并生成原始数据。
(2)应用平台
应用平台从功能上包括[3][4]智慧教学环境、智慧教学资源、智慧校园管理和智慧校园服务四大类。其建设内容及功能如图2所示。
(3)数据中心
数据中心建设包括机制规范和相关软件、数据、处理过程的构建,以及满足智慧校园需要的存储资源和计算资源的建设。数据中心可以消除“信息孤岛”,最终实现具有分析决策支持功能的一体化管理与服务。
在数据中心的建设过程中,对数据的集成由数据标准与交换平台完成,通过对数据信息的抽取、转换、加载,使不同系统之间实现数据交互,消除“数据孤岛”。
核心应用系统承载了整个校园内部百分之八十的关键数据,访问频繁。当数据访问越来越多的时候,访问核心应用势必会给系统带来很大压力,甚至崩溃,建立主数据可有效解决频繁访问对核心应用系统产生的压力。
主数据是用来描述智慧校园核心业务实体的数据,是从学校的多个应用系统中整合的最核心且需要共享的数据。通过相应的技术和算法,对业务流程、业务模型和分析模型进行提取,并以服务的方式把统一、完整、准确的主数据分发给上层应用。主数据的提取由数据中心的数据治理平台和数据挖掘与分析平台完成。
存储与计算资源、支撑平台之间的数据存、用关系如图3所示。
在图3中,不同应用终端产生(读取)的数据种类有文件型、数据库型、HTTP服务型和JMS消息型等,并独立存储到各自的数据库中,成为原始数据,即存储在数据仓库的细节数据层(Data Warehouse Detail,DWD),该层是数据仓库与业务层的隔离层。
DWD层数据通过数据标准与交换平台,在数据定义的基础上,经过ETL(Extract—Transform—Load)处理,对数据进行清洗、加工,补全各类信息,包括编码字典解释等,实现数据的标准化,存储于数据仓库的基础数据层(Data Warehouse Base,DWB)。DWB层是具有大量数据标准的客观数据层,目的是在不同应用系统之间实现数据交互,消除“数据孤岛”。
DWB层的数据根据学校不同业务领域创建业务模型,按照业务模型进行数据处理,形成分析某一个主题域的服务数据,存储于数据仓库的服务数据层(Data Warehouse Service,DWS)。此阶段为数据治理阶段,更加强调数据的质量与安全,数据治理的最终目标是提升数据的价值。
DWS层经过大数据汇总、统计、分析,將结果定期存储在数据集市层(Data Mart,DM),为上层应用提供数据源。通俗地说,DM层存储的是为管理层智能决策特定需求而预先计算好的数据,从而满足智慧管理对性能的需求。
元数据库存储上述DWD、DWB、DWS和DM层四个库的表及字段元数据。元数据管理是数据质量的核心。通过元数据管理,可以实现整个数据处理过程的追踪,知道目标数据的源头就可以一步步地追溯到数据的提供者。
一般情况下,以文本形式保存的各类应用系统每日导出的数据文件和数据抽取、转换、加载过程中的日志文件,保存期限为三个月;核心数据根据活跃程度由强到弱,其保存期限为3~10年;一般数据根据活跃程度由强到弱,其保存期限为1~10年;各类参数信息永久保存。
(4)泛在网络与信息安全空间
泛在网络是指实现有线无线无缝接轨的安全、稳定、通畅、万物互联的网络环境。
信息安全包含[5-7]安全管理和安全技术防护,其内容涵盖如图4所示。
三、基于数据生命周期的智慧校园原型实现
1.原型概念及优势
原型是一种让用户提前体验产品、交流设计构想、展示复杂系统工程的方式。就本质而言,原型是一种沟通工具,原型图是最终系统的代表模型或者模拟。
智慧校园本质是复杂的集成系统,使用原型设计的基本思想是在投入大量的人力、物力之前,在限定的时间内,用最经济的方法开发出一个可实际运行的系统模型。用户在运行使用整个原型的基础上,通过对其评价,提出改进意见,对原型进行修改,再统一使用。评价过程反复进行,使原型逐步完善,直至完全满足用户的需求为止,因此,原型在识别问题、减少风险、节约成本等方面有着不可替代的价值。
2.基于数据生命周期的智慧校园原型实现
依据上述基于数据生命周期的智慧校园设计思想,抓住智慧校园的管理与服务核心功能,对智慧校园原型进行建设实现,通过“数据说话”的方式找出学校教学、管理上存在的问题,便于后续的决策和改进。
经过调研,学校在智慧校园原型实现过程中,采用了广州瑾祺公司开发的AIC智能校园系统。该系统具有集教学、人事、学生、财务、后勤、资产、督导、招生、就业、实验、行政和移动应用等于一体的综合管理功能;涵盖智能教室、教学资源库、校园一卡通、校园监控、学生社区、学生服务大厅、数字图书馆、电子书包、教与学互动等综合服务;具有基础数据分析、督导数据分析、后勤数据分析、学生情况分析、教学数据分析、课时数据分析、教职工数据分析、平台使用情况分析、新闻数据分析、培养计划数据分析等数据监测、预警和分析功能。
该系统采用基于标准.Net三层架构的SSJ模式、B/S结构和UML进行开发,按照RUP方法管理开发过程,后台数据库管理系统采用SQL Server 2008。
系统部署采用服务器虚拟化技术,通过六台四路10核Intel XeonE7—4820v4/6.4GT/25ML3处理器、256GB内存的高性能物理服务器和虚拟化软件搭建了云计算物理服务器集群;通过两台两路8核Intel XeonE5-2620v4/8GT/20ML3处理器构建了64GB内存的双机热备共享存储数据库服务器;通过两台100TB双活光纤云存储、两台16Gb FC光纤通道交换机构建FCSAN网络。系统部署拓扑如图5所示。
部署后的AIC智能校园系统正在全校范围内推进应用,图6是AIC自我诊改中专业诊改信息的统计。
3.基于数据生命周期的智慧校园原型完善与扩建
我校的智慧校园原型实现不是定制开发,而是通过采购实现,因此在推广使用的过程中,要不断对其进行评价,提出改进意见,对原型进行修改,并统一使用。评价过程反复进行,原型逐步完善的过程会延续很长一段时间。
就高校智慧校园建设来说,AIC智能校园系统数据中心支撑平台只有部分数据交换、汇总与分析功能,距离教育信息化2.0时代需要的具有数据治理、数据安全管理、数据质量提升和数据决策支持的支撑平台还有很大差距。数据中台建设是解决上述问题的有效途径之一。
四、结语
智慧校园建设是一项复杂的系统工程,可带动体制机制的改革、业务流程的优化、信息化服务的深入,以及人才培养、学术研究、 公共服务、学校治理、内部保障等方面的协同创新发展。通过对数据生命周期进行梳理,分析智慧校园各组成部分之间的数据关联、各应用系统之间业务关联,实现流程、服务、数据的贯通融合和流程优化,以稳定、安全、泛在的网络为依托,充分运用大数据、移动互联等信息技术,构建高校管理一体化和整合协同的信息化支撑体系,实现高校一站式服务。本文以教育信息化2.0为大背景,依据数据在智慧校园系统中的产生、存储、应用和消亡过程,提出基于数据生命周期的智慧校园设计。我校对基于数据生命周期的智慧校园原型进行了部署及应用。
参考文献:
[1]韩泉叶,刘清毅,王庆辉.基于大数据的高职院校信息化建设框架体系研究[J],电子测试,2020(8):118-119.
[2]佚名.智慧校园的数据驱动与流程驱动[EB/OL].https://www.sohu.com/a/252490964_734486.
[3]全国信息技术标准化技术委员会.智慧校园总体框架:GB/T 36342-2018[S].北京:中国标准出版社,2018.6.
[4]顾军,钮新颜.人工智能时代教育系统疫情防控技术的智慧实践[J],中国教育信息化,2020(21):43-47.
[5]全国信息安全标准化技术委员会.信息安全技术—网络安全等级保护基本要求:GB/T 22239-2019[S].北京:中国标准出版社,2019.5.
[6]全国信息安全标准化技术委员会.信息安全技术—网络安全等级保护安全设计技术要求:GB/T 25070-2019[S].北京:中国标准出版社,2019.6.
[7]全国信息安全标准化技术委员会.信息安全技术—网络安全等级保护测评要求:GB/T 28448-2019[S].北京:中国标准出版社,2019.8.
(编辑:王晓明)