高校师资数据联机分析处理系统设计与实现

2022-04-20 07:24孙思邈闫朝升
电子设计工程 2022年7期
关键词:服务端数据表集市

刘 鹏,李 丹,孙思邈,黄 新,闫朝升

(1.黑龙江中医药大学人事处,黑龙江哈尔滨 150040;2.黑龙江中医药大学现代教育技术与信息中心,黑龙江哈尔滨 150040;3.黑龙江中医药大学医学信息工程学院,黑龙江哈尔滨 150040)

教育大计,教师为本。全面加强教师队伍建设已成为一项重大政治任务和根本性民生工程[1]。高校师资管理工作在教师队伍建设中占有极其重要的地位。面对知识经济时代,对于高校师资管理,应积极运用现代信息技术,探寻师资管理决策支持的有效实现途径,为教师队伍建设提供科学依据。随着数据分析、数据挖掘、大数据等前沿信息技术的飞速发展及其应用日趋广泛,我国加大了师资管理信息化的重视度,为师资的管理工作及其队伍建设提出了更高要求[2]。目前,高校纷纷开展了人事管理信息化建设,应用了人事管理信息系统,提高了师资队伍管理工作水平,积累了大量历史性、细节性的师资建设数据[3-8]。在此基础上,面对师资管理决策支持需求,将数据仓库、数据挖掘等前沿信息技术应用于高校师资管理工作,旨在发现隐藏的、有价值的师资队伍信息,为科学决策提供可靠依据[9-12]。

联机分析处理(On-Line Analytical Processing,OLAP)利用上卷、下钻、切片、切块、旋转等操作,从数据仓库(或数据集市)中,快速、一致和交互地获取多维度、多层次的观测指标(即度量)数值,为用户提供隐藏的、有价值的信息,进一步为数据挖掘、机器学习等过程提供数据预处理结果,以便发现更深层次、更有价值的知识[13]。目前,一些研究者已将OLAP 技术应用到教学质量、学生行为、教学状况、招生就业等领域,验证了基于OLAP 数据分析处理的快速性、便捷性和互动性[13-18]。如何有效地利用OLAP 技术,从大量的师资管理事务数据中,快速、便捷地发现隐藏的、有价值的师资队伍信息,深度、全面、准确地把握师资队伍建设状况,支持科学、及时、准确的师资队伍建设决策,成为高校师资管理工作的重要任务。因此,文中提出了基于OLAP 的高校师资数据分析处理系统。该系统具有开发周期短、开发成本低、运行维护便捷等特点,为其他职能部门的OLAP 系统设计与实现提供一种可行高效的方案与途径。

1 系统设计

1.1 体系结构设计

该系统采用C/S(客户机/服务器,Client/Server)模式,设计了高校师资数据联机分析处理系统的体系结构,如图1 所示。选择C/S 模式的原因主要包括四方面。其一,系统用户范畴主要界定为校领导、人事管理部门领导以及师资管理干事等三类人员,重点解决师资数据的多维分析需求。其二,基于C/S 模式的系统具有开发周期短、调试容易、网络依赖度低等优势。其三,系统的数据存储环境易在局域网内进行部署。其四,系统属于分析型系统,其使用的频繁度低于操作型事务系统。

图1 系统体系结构

由图1 可知,系统的体系结构包括3 个层次,即客户端、应用服务端和数据服务端。作为用户与系统交互的前台接口,客户端提供前端界面,调用应用服务端的功能模块。其中,多维分析界面用于生成和发送多维分析要求以及显示分析结果信息,主要包括分析要求生成和分析结果显示两个子区域。上述两个子区域分别对应着“维度和度量”选择区和“多维数据表”显示区。用户利用多维分析要求生成子区域,选定维度、层次和度量,生成分析要求并将其发送给应用服务端。分析结果显示子区域能够多维多层地显示应用服务端返回的结果信息,并进一步生成和发送分析要求(即用户可以在分析结果显示子区域中,通过鼠标的单击操作,快速生成新的分析要求)。应用服务端是后台数据服务端和前端界面之间的沟通桥梁,主要包括多维分析、结果输出、数据加载和系统维护等功能模块。作为系统的后台数据存储环境,数据服务端存储着数据集市,为应用服务端提供多维度、综合、紧凑的数据源。另外,为了支持系统管理,数据集市存储着系统维护的相关数据,如用户基本信息、数据加载日志等。

1.2 功能模块设计

系统功能模块主要包括多维分析模块、结果输出模块、数据加载模块和系统维护模块等。

1)多维分析模块:用于接收客户端的分析要求,调用上卷、下钻、切片、切块、旋转等OLAP 操作子模块,生成查询要求并将其发送给数据服务端,以及接收数据服务端返回的结果(即多维数据集)并将其发送至客户端,显示多维分析结果。

2)数据加载模块:用于将外部数据源(如人事管理系统的后台数据库、Excel 数据文件等)的数据,通过抽取、转换和载入(Extract-Transform-Load,ETL)过程,生成多维度、多层次的聚合数据,存入数据服务端的数据集市,生成数据加载日志。

3)结果输出模块:用于接收客户端的输出要求,生成Excel 文件,导出分析结果。

4)系统维护模块:用于管理用户基本信息、查阅数据加载日志、备份与恢复后台数据等。

2 后台数据存储环境设计

作为决策支持后台的两类数据存储环境,数据仓库(Data Warehouse)和数据集市(Data Mart)在信息需求和开发方法等方面存在着区别[13]。文中采用独立数据集市,构建系统的后台数据环境。上述选择的主要原因在于:一方面,数据集市的多维结构能够保证OLAP 操作与后台数据存储环境之间的有效衔接[19];另一方面,独立数据集市可以由特定部门直接创建,而无需以数据仓库为前提,降低了数据存储环境构建费用,缩短了系统开发周期,有助于快速、高效地构建后台数据存储环境。

2.1 维度设计

为了保障师资(尤其专任教师)队伍建设决策的科学性、合理性和可行性,高校师资管理决策者所需进行的多维分析主要包括以专任教师数量和比例为目标值(即度量值),在年龄、学历、职称、学缘等基本要素维度上的分布情况分析以及多维组合分析,在教师状态、学科、系列、性别等开放性维度上的变化情况分析以及多维组合分析,在时间维度上的多层次(如近1 年、3 年、5 年等)变化情况分析以及基于基本要素维度、开放性维度和时间维度的组合分析。依据上述的高校师资管理决策多维分析特点,文中设计了3 类维度,如表1 所示。

表1 高校师资数据分析的维度设计表

2.2 数据模型设计

在上述的维度设计基础上,该系统设计了基于星形模型的师资数据集市多维数据结构,如图2 所示。该模型以事实表为中心,包含职称、学历、系列、学缘、年龄、学科、状态、性别、时间9 个维度表。每一个维度表对应一个维度。事实表由每个维度表的外键(包括职称码、学历码、系列码、学缘码、年龄码、学科码、状态码、性别码、时间码等)和度量(包括人数和百分比)组成,支撑师资数据分析的多维性、多层性和快速性。其中,外键能够连接维度表和事实表,支撑多维度、多层次的师资数据访问。

图2 数据集市的星形模型

图3 给出了部分维度的层次设计情况。以“学科”维度为例,该维度分为三层,依次为顶层(即学科维度)、学科门类层和一级学科层。“系列”、“性别”和“时间”维度未进行分层处理。其中,“系列”维度具体包括教师、卫生、研究、实验技术、工程技术、图书资料、出版、档案、会计、审计、统计等成员;“性别”维度包括男和女两个成员;“时间”维度包括近10 年的具体年份。

图3 部分维度的层次设计

通过上述设计,师资数据集市能够支持9 个维度及其不同层次的度量值存储和访问,满足多维度、多层次的数据分析需求。

2.3 数据加载设计

为降低系统存储空间消耗和系统维护复杂度,数据服务端不负责存储细节性师资历史数据。根据数据集市的多维数据模型,该系统利用人事管理系统的后台数据库、Excel 数据文件等外部数据源,通过数据抽取、转换和载入,完成数据集市的数据加载。

针对职称、学历、系列、学缘、年龄、学科、状态、性别、时间9 个维度,该系统调用与人事管理系统之间的接口程序,访问人事管理系统的后台数据库,获取相应字段的师资数据(见表2),生成细节性数据集,完成数据抽取。之后,根据维度表的内容以及事实表的外键和度量,聚合细节性数据,生成多维度、多层次的汇总性数据集,完成数据转换。最后,将上述汇总性数据集存入数据集市的事实表,完成数据载入。

表2 维度与源字段的对应关系表

上述数据加载可以采用定期增量加载和事件触发加载两种模式。前者是指在特定时间(如一年)自动(或管理员手动)调用数据加载功能,利用外部数据源生成汇总性数据,并载入数据集市。后者是指通过在人事管理系统后台数据库的关系上定义触发器,针对数据更新和插入操作(分别对应着更新触发器和插入触发器),在职称晋升、新教师入职等事务发生时,执行数据加载,更新数据集市。后一种模式需要完善现有人事管理系统。因此,该系统采用定期增量加载模式。

3 系统实现

该系统的实现采用了Visual Basic 6.0和Microsoft SQL Server 2008。

图4 给出了“师资数据多维分析”界面,包含“维度和度量”选择区和“多维数据表”显示区。用户在“维度和度量”选择区,选定维度层次以及度量,并单击【分析】按钮。之后,系统将调用“维度显示顺序设置”界面,用于确定所选维度在多维数据表中的先后次序,如图5 所示。根据显示顺序的选定情况,多维数据表将依次显示学历维、职称维以及人数、百分比。最后,用户单击【确定】按钮,获取多维分析结果,详见图4 所示的多维数据表。该多维数据表呈现了“学历维的一级层次→职称维的二级层次”、近1年的专任教师人数和百分比情况。其中,在多维数据表的度量值中,“—”用于表示0 和0%状态下的人数和百分比。通过图4 所示的多维数据表,用户可以获取“研究生学历→具体职称级”的人数与百分比情况,如近1 年的“研究生→正高”和“研究生→副高”专任教师人数226 和326 以及百分比20.58%和29.69%。

图4 系统多维分析界面(1)

图5 维度显示顺序设置界面

在多维数据表中,维度项前面的“+”和“-”表征用户可以在该维度项上进行下钻和上卷操作,获取更为丰富的分析结果。例如,在图4 所示的多维数据表中,用户可以分别单击“+研究生”和“+非研究生”项,进行“学历”维的下钻操作,获取“学位→具体职称”的人数和百分比结果,如图6 所示;或者用户可以分别单击“-高级”和“-非高级”,进行“职称”维的上卷操作,获取“研究生”和“非研究生”学历维度层次上的“高级”和“非高级”职称的人数与百分比汇总情况。

图6 系统多维分析界面(2)

通过图4 和图6 对比,用户可以根据近1 年的“研究生→正高”专任教师人数226 进一步发现,近1年的“博士→正高”、“硕士→正高”专任教师人数分别为158 和68,且前者是后者的两倍以上。借助图6 用户可以发现,百分比居前三的分别是“博士→副高”(22.22%)、“硕士→中级”(21.31%)、“博士→正高”(14.39%)。

另外,“维度显示顺序设置”界面可以用于实现旋转操作。在“维度和度量”选择区结果未变化情况下,用户可以利用“维度显示顺序设置”界面,调整维度先后次序,形成旋转要求。例如,针对图6 的多维数据表,用户能够发现“博士→正高”、“硕士→正高”、“学士→正高”的专任教师人数分布差异。鉴于上述的多维分析顺序导致三项度量值过于分散而不利于结果的观察,用户可以利用“维度显示顺序设置”界面,调整维度显示顺序(即“职称→学历”),集中“正高→博士”、“正高→硕士”、“正高→学士”的度量值,提高多维度、多层次分析结果观察的便捷性,有助于发现更有价值的师资队伍信息。

4 结论

师资队伍建设是高校高质量发展的基石。文中针对高校师资管理决策支持工作,提出了基于C/S 模式和独立数据集市的高校师资数据联机分析处理系统设计方案,形成了实现途径。该系统能够快速、便捷地发现隐藏的、有价值的师资队伍信息,为高校师资队伍建设提供可靠的科学决策依据,并为部门级的联机分析处理系统及其分析型数据环境的构建提供有益借鉴。

猜你喜欢
服务端数据表集市
热闹的集市
湖北省新冠肺炎疫情数据表(2.26-3.25)
湖北省新冠肺炎疫情数据表
湖北省新冠肺炎疫情数据表
探访于山“相亲集市”
新时期《移动Web服务端开发》课程教学改革的研究
热闹的集市
QH165点焊机器人数据库开发技术
摸清黑客套路防范木马侵入
热闹的集市