数据仓库在高校师资队伍建设中的应用*

2013-03-27 03:15高亮
中国教育信息化 2013年2期
关键词:决策支持系统数据仓库师资队伍

高亮

(上海财经大学信息化办公室,上海200433)

一、引言

教学和科研是高等学校建设中最重要的两项内容,这两项重要内容都由教师来承担完成。一支师德高尚、业务精湛、结构合理的高素质师资队伍对高校的建设将起到关键核心作用。[1]越来越多的高校已经认识到师资队伍建设的重要性,越来越多的领导层把师资队伍建设作为高校建设的一项重要工作。为了做好这项工作,各高校都建立了相应的管理制度,如人才引进、人才培养、奖励机制等,也借助了信息技术手段如各高校的人事管理系统。这些措施对高校师资队伍的建设和管理起到了一定作用,但还是无法精确、量化地满足师资队伍建设的需求。人事管理系统属于联机事务处理系统,主要用于管理教师的个人基本信息及完成一些基本业务,系统只能做一些简单的教师信息查询统计,无法完成全面的多角度交叉分析,想要分析师资队伍结构随时间的变化情况几乎更是无法完成。因此产生了各高校面临的一个普遍问题,谁也说不清楚当前师资结构的详细情况,投入很大力量建设师资队伍,但效果不太理想。究其原因,是决策层无法从多个角度综合分析师资结构情况,无法得到准确详细的数字决策依据,也就无法对症下药。

数据仓库是为支持管理决策建立的、面向主题的、集成的、稳定的、随时间变化的数据集合。[2]它的这些特性非常适合决策支持系统的需要,成为结构化决策支持系统不可或缺的基础和核心。教师可以作为高校数据仓库中一个单独主题来建设,教师相关重要属性作为维度,这样就可以对师资结构进行多维交叉分析,如切片、切块、旋转、钻取,使用缓慢变化维来捕获教师基本信息的变化过程,将教师的历史信息保存下来,方便在不同时间对比分析,这些都是普通联机事务处理系统无法完成的。围绕教师主题建设这样一套决策支持系统,将会给高校师资队伍建设带来非常大的帮助,使决策不再停留在片面的分析结果或者是表面感觉。

二、校务决策支持系统体系结构

典型的校务决策支持系统体系结构如图1所示,主要包含业务数据层、数据仓库层和分析应用层。

1.业务数据层

高校业务涉及的数据比较广泛,数据源主要有教学系统、学生系统、人事系统、科研系统、财务系统、资产系统等,再加上校园网之外的一些其他外部数据源,合起来为高校决策支持系统提供一个庞大的数据基础,包含了时间跨度长且内容覆盖面广的海量数据。

2.数据仓库层

数据仓库层是分析应用层和业务数据层的桥梁。由于各个源系统业务处理的职能、分工不同,对数据关注的侧重点不同,数据库的异构性比较大。在形成数据仓库前要对业务系统中的原始数据进行抽取、清洗、转换,消除数据的不一致性,把数据转换为相同的结构和数据类,并加载到数据仓库,形成能够对决策提供支持的多重粒度级的数据库。同时,为分析应用层的各种应用提供接口,为了更好地进行决策支持分析,数据仓库中的数据可进行二次抽取,加载到具体分析主题的数据集市,[3]或者直接为通用联机分析平台提供数据支持。

3.分析应用层

分析应用层构成高校决策支持系统的门户和分析平台,通用联机分析平台指具有OLAP功能的工具,实现对数据多维度、多层次的分析和隐性知识的发掘,[3]包含了多维分析、数理统计、报表生产、即席查询、关键绩效指标监控和数据挖掘等功能,借助OLAP技术和数据挖掘技术,将分析结果以表格、直方图、饼图、曲线图等多种方式展现给用户。[4]

三、教师主题设计及实现

1.主题分析

主题是在较高层次上对数据进行综合归类的一个抽象概念,每一个主题对应一个宏观分析领域,具体来说就是确定决策涉及的范围和所要解决的问题。将教师相关内容抽象为一个主题,根据教师管理业务抽取分析维度,常用维度有籍贯、民族、国籍、政治面貌、行政部门、教学部门、学历、学位、获得学位国家、岗位、学科、导师类别、职称、职务、聘用方式、人员性质、人员状态。其中行政部门指教师隶属部门,教学部门指承担教学任务的部门,学科指教师所在研究学科。由于各高校教师管理业务有所区别,所以涉及到的维度会有所不同,同样的维度其结构和内容也有可能不一样。

2.数据模型设计

数据仓库常用建模方法有范式建模和维度建模,本文采用维度建模方法。维度建模法有星型模型、雪花模型和混合模型,教师主题采用星型模型设计。模型由事实表和相关维度构成,事实表与拟分析的数据表相对应,由维度键和用户希望了解的度量组成。维度与统计查询的参数相对应,是我们观察和分析数据的特定角度,通过把一个实体的多项重要属性定义为多个维度,能够使用户在不同维度上对数据进行分析比较。[3]维度的划分要有利于应用端分析查询,同时要简洁、清晰,便于最终用户理解。[5]维度的粒度及层次结构决定了分析数据的层次深度,因此设计维度应该尽可能充分地考虑层次结构并合理划分。不同维度的组合会构成不同的多维数据集,在多维数据集上进行切片、切块、钻取操作会得到意想不到的分析结果。

教师主题的主要作用是从不同教师属性角度去分析师资结构情况,同时为与教师有关的主题提供教师维度。本文根据上海财经大学教师管理业务为教师主题设计了17个常用维度和事实表,事实表中记录了教师的基本属性和各维度键,模型可以根据不同的业务情况进行扩展或修改。为了跟踪教师基本属性的变化过程,本文采用缓慢变化维的方法设计教师事实表以捕获变化数据。教师事实表中的版本、开始时间和结束时间三个字段是实现缓慢变化的核心,版本表示同一教师历史状态的顺序,开始时间和结束时间表示在该段时间内教师处于某一状态,每一条数据的结束时间等于新数据的开始时间,这样教师不同时间段的状态就分布在一条时间轴上,从而可以得到任一时间点教师的状态信息。使用Erwin设计的逻辑模型如图2所示。该模型是一个大的多维数据集,可以组合不同的维度去分析师资结构,如可以分析随着时间的变化教师职称和学历的关系、相邻两年教师职称结构、不同部门人员的组成结构等。

3.ETL设计及实现

本文使用开源ETL工具Kettle来设计并实现教师主题的ETL过程,人事系统提供的人员基本信息接口作为数据源,经过一系列的转换并关联相关维度最终得到教师事实表,ETL过程如图3所示。可以根据实际获取数据的频率来灵活设置ETL的调度执行周期,如我校数据仓库每天凌晨执行一次ETL。

使用Kettle中的维度查询/更新组件来实现教师事实表的缓慢变化,将业务系统中教师的工号作为自然关键字,根据捕获变化的需求将不同字段的更新类别设置为更新和插入,当需要捕获变化的属性在业务系统发生变化时,数据仓库的教师事实表中将插入一条新数据,不需要捕获变化的属性在业务系统发生变化时,数据仓库中教师事实表的该属性将更新为与业务系统数据一致。图4显示了某一教师状态缓慢变化过程。

四、应用实例

前端展示工具或者说报表系统在决策支持系统中占据着重要地位,系统建设的前期成果包括数据仓库、ETL等都需要由报表或仪表盘来体现,因此一个优秀的前端展示工具会决定决策支持系统的应用效果。我校购买了BI领域处于领先地位的工具MicroStrategy和Tableau,开发了大量师资结构统计分析报表和仪表盘,并且成功应用于我校决策支持系统。以近5年在职教学科研岗教师为统计范围,使用MicroStrategy开发教师主题报表,建立教师、部门、学科门类、学历、境内外获得学位、职称级别、年份实体,同时建立教师数量度量,图5是由这些实体和度量构建的师资结构统计报表。用户可以根据需要灵活调整不同实体的位置,从而可以从不同的分组角度去观察统计结果,还可以利用该工具在Web端非常丰富的交互功能去修改预定义的报表。通过这样一个统计报表,决策者就可以得到不同分组下教师的准确统计数据,也可以进行钻取操作查看教师详情,从而为师资队伍建设提供准确的数字依据。

以近3年在职教学科研岗教师为统计范围,利用Tableau强大的可视化功能开发一个教师主题仪表盘,内容包含职称结构、学位结构、导师结构和学科结构分布情况,仪表盘样式如图6。仪表盘主要用来观察师资结构的变化趋势,用户可以纵向对比不同年份教师数量的变化情况,也可以横向对比不同类别下教师的组成情况,还可以将具体统计数字显示在进度条上。通过这样一个仪表盘,决策者就可以从不同的角度去宏观分析师资的组成结构情况,从而可以有针对性地建设师资队伍。

五、结束语

本文描述了上海财经大学数据仓库中教师主题的模型设计,重点介绍使用缓慢变化维设计教师事实表以便跟踪历史变化数据,并使用Kettle实现数据ETL,同时用两种BI工具示例了教师主题的具体分析应用。由于篇幅有限,逻辑模型中只给出了关键属性字段和维度键,它可以作为高校数据仓库教师主题设计的规范和框架来参考。本文的数据仓库教师主题已经成功应用于我校决策支持系统,它能够灵活方便地分析师资结构,为师资队伍建设提供准确的数字决策依据,可以更加科学地制定相关师资队伍建设制度,已经成为我校师资队伍建设的重要参考依据,在今后的使用中可以充分挖掘该模型的潜在应用。

[1]刘江萍.关于加强高校师资队伍建设的探讨[J].价值工程,2011(23).

[2]Inmon W H.Building the data warehouse[M].Third Edition.New York:John Wiley and Sons,2003.

[3]陈俊,王蓖声.基于数据仓库的决策支持系统的设计与实现[J].计算机工程与设计,2008(20):5280-5283.

[4]贺一峰.基于商业智能的学生评教决策支持系统的研究与设计[J].新疆警官高等专科学校学报,2008(3):61-64.

[5]杜苏民.基于OLAP招生决策支持系统的应用研究[J].濮阳职业技术学院学报,2008(2):8-9.

猜你喜欢
决策支持系统数据仓库师资队伍
护理临床决策支持系统的理论基础
2022冬奥会背景下黑龙江省冰雪师资队伍建设研究
基于数据仓库的数据倾斜解决方案研究
汉语言文学专业师资队伍建设研究
面向知识转化的临床决策支持系统关键技术研究
中职师资队伍建设现状及策略分析
基于数据仓库的住房城乡建设信息系统整合研究
电务维修决策支持系统研究
探析电力系统调度中数据仓库技术的应用
基于数据仓库的数据分析探索与实践