马 亮 ,袁 芳 ,王袆平
(1.教育部教育管理信息中心,北京 100816;2.清华大学,北京 100084)
《国家中长期教育改革和发展规划纲要 (2010-2020年)》中明确提出要构建国家教育管理信息系统,加快教育信息化进程。小金教工程是构建国家教育管理信息系统的第一个重大项目,具有基础性地位,包括“建立教育基础信息数据库、国家级教育管理信息化支撑平台、国家教育管理公共服务平台”三项建设内容。教育基础信息数据库建设是其中的基础和重点。
教育基础信息数据库建设全面贯彻落实国家对教育管理信息化的要求,以提升教育监管能力与服务水平为目标,以教育管理信息系列标准为依据,根据教育事业管理业务的需求,整合教育基础信息数据资源,构建统一的基础数据环境,健全教育基础信息管理与运行机制,为推动各级各类教育的管理现代化、科学化与规范化,为教育改革和发展提供有力支撑。
教育基础信息数据库建设以学校、学生、教职工为对象整合分散在国家、省、学校等各级教育机构的教育基础信息数据资源,统一规划内容、统一设计结构、统一制定技术架构,建立健全教育基础信息管理规章制度和技术规范。
业务上:形成教育基础信息数据库概念模型,确定覆盖业务范围、内容组成、层次结构,以及与关联信息系统的关系。
技术上:设计教育基础信息数据库的逻辑架构和部署架构,提出海量数据存储、并发访问等关键技术解决方案。
管理上:建立教育基础信息数据库管理工作体系,形成管理、业务和技术相互配合的工作模式以及相应的管理流程和规范。
教育基础信息数据库覆盖各级各类教育的基础信息,按照教育服务和监管业务的三个对象:学校、教职工、学生为线索进行组织。
在各级各类教育中,除对教职工统筹管理外,对学校、学生的管理在学前、中小学、中职、高校四个教育层次中各有特点。因此,形成学前教育学校、学生,中小学教育学校、学生,中职教育学校、学生,高等教育学校、学生以及教职工九个教育基础信息主题数据库。同时,基于教育事业管理业务的需要,还有若干业务管理主题数据库。图1描述了教育基础信息数据库的逻辑架构。
教育基础信息数据库中各主题数据库通过统一的学校编码、教职工编码、学生编码建立联系。纵向贯穿各级各类教育层次形成全局集成的学校、教职工、学生基础信息数据库;横向打通学校、教职工、学生关系形成全面整合的学前教育、中小学教育、中职教育和高等教育基础信息数据库。形成的若干逻辑数据库如图1虚线所示。
图1 教育基础信息数据库逻辑架构
在教育基础信息数据库中,学校、教职工、学生三个管理对象的基本信息是国家教育管理信息系统信息关联、业务衔接和数据分析、挖掘的基础。因此,重点对这三类信息进行了详细设计。
(1)学校基础信息数据库
学校基础信息数据库内容包括:基本信息、经费信息、教学信息、科研信息、资产信息等,不同教育阶段内容依据管理特点有所侧重。具体如表1所示。
(2)教职工基础信息数据库
学前教育、中小学教育、中等职业教育、高等教育四个教育阶段的教职工基础信息数据库内容包括:基本信息、资质信息、任职信息、异动信息等,不同教育阶段内容依据管理特点有所侧重。具体如表2所示。
表1 学校基础信息数据库
表2 教职工基础信息数据库
(3)学生基础信息数据库
学生基础信息数据库内容包括:基本信息、学籍信息、结业信息等,不同教育阶段内容依据管理特点有所侧重。具体如表3所示。
教育基础信息数据库其数据来源还是国家教育管理信息系统产生的业务数据,因此需要明确教育基础信息数据库和国家教育管理信息系统的关联结构。重点解决数据由谁生成、由谁维护、由谁管理、由谁使用等问题,满足国家教育管理信息系统建设的需要。
表4采用C-U矩阵描述教育基础信息数据库与国家教育管理信息系统的关系。
教育基础信息数据库的数据架构要考虑数据构成、数据标准、数据采集、数据交换、数据存储和数据安全等内容,如图2所示。
(1)数据维护按照“谁提供,谁负责”的原则进行,数据只能在一处进行维护,必须保证提供唯一的数据管理和访问接口。
(2)数据采集支持开放的、标准化的文件格式,并能实现数据的自动汇总。
表3 学生基础信息数据库
表4 教育基础信息数据库与国家教育管理信息系统C-U矩阵
(3)数据交换时充分考虑海量数据交换的方式和效率,尽量在数据库层直接进行传输;在不能实现数据库访问的情况下可通过服务层进行交换。
教育基础信息数据库涉及到各级各类教育机构的基础信息,数据量较大、数据交换频繁,在实际部署上,采用“物理集中、逻辑独立”为主的方式:结构化数据集中在国家(教育部)、省(只含本省数据)两级建立统一的数据库服务器平台集中物理部署,非结构化数据由内容管理软件统一管理。即形成国家级、省级两级教育基础信息数据库。其中国家级教育基础信息数据库实际物理部署,省级可以根据情况确定是否单独部署。图3描述了国家、省两级教育基础信息数据库的部署架构。
图2 教育基础信息数据库数据架构
目前全国有70万左右的教育机构,每年在校学生3亿多,毕业生超过3000万,数据量比较庞大。在部、省两级的部署模式下,在建设中需要考虑数据库的设计、数据共享交换、海量数据存储和并发访问控制等问题。
其中,针对海量数据采用“化大为小、活跃分级”的基本思想。将数据分成一个个小的单元,并对数据活跃度进行分级,然后根据不同的策略处理。在此基础上,充分应用并行计算、负载均衡等技术手段,同时配套高性能的硬件基础设施做保障。
图3 教育基础信息数据库部署架构
教育基础信息数据库的建成将会为教育改革和发展提供有力的基础数据支撑。然而,教育基础信息数据库建设是一项系统工程,不是一蹴而就的。在教育基础信息数据库规划完成的基础上,还需要落实、遵循规划指导国家教育管理信息系统建设,并通过有效的手段和机制对教育基础信息数据库进行持续、有效的管理。
本文是作者根据教育基础信息数据库规划与建设实际工作总结提炼的粗浅认识,怎样做好这项工作是一项难度很大的任务,希望同行专家不吝指正。