数据仓库和OLAP技术在高校教学决策系统中的应用研究

2015-03-11 06:40
关键词:数据仓库

占 小 忆

(安徽三联学院 计算机工程学院,安徽 合肥 230601)



数据仓库和OLAP技术在高校教学决策系统中的应用研究

占 小 忆

(安徽三联学院 计算机工程学院,安徽 合肥 230601)

摘要:借助某高校教务系统中的教学数据,使用ETL(Extract-Transform-Load)技术把适合主题分析的数据抽取到目的数据仓库,并使用OLAP(Online Analytical Process)技术对这些数据进行多角度分析,从而找出成绩变化的趋势,成功地分析了变化的原因,为该校的管理者提供了有效的决策依据和初步的决策建议。

关键词:数据仓库;教学决策;联机分析处理;多维分析

计算机技术的发展使各大高校的教学管理基本完全走向信息化[1]。他们的管理系统大多是建立在面向事务的基础上的,基本上能够满足日常教学的需求,如对学生成绩的管理,对教学的安排,对考试的管理等等。但这种管理系统往往只是停留在管理的层面上,对于教学管理过程中出现的一些问题,比如同一个专业多个平行班成绩出现较大的差距,再比如同一个专业不同年级的学生成绩出现的下滑或上升的趋势,学生报到人数在地区上有着什么样的分布趋势等等。类似这样的问题通过管理系统是解决不了的,对于以上这些问题,可以通过建立相应的数据仓库[2],然后利用OLAP[3]分析工具对隐藏在系统中的海量数据进行分析,找出其中的规律,从而帮助教学管理人员更好的作出决策。本文就是针对某高校近几年积累下来的学生某些课程的成绩数据,首先构建学生成绩数据仓库,然后利用OLAP工具对其进行多角度的分析,找出其中的规律,并发现了一些问题,供管理者参考。

1成绩管理数据仓库的设计

1.1分析需求,确定主题域

根据调查结果整理出以下几个方面的分析需求:希望对全校的公共课做成绩分析,如大学英语B级和计算机基础这两门公共课;希望能分析成绩变化的趋势。通过对以上需求进行归纳,发现分析的角度可以分为教师、课程、时间和班级四大类,而此需求所涉及的主题域实际上只有一个——成绩。

1.2ETL的具体实现

数据抽取。确定了主题域后,接下来就从操作型数据库中提取分析所需的数据[4]。在此只提取原教务管理系统中与成绩主题相关的数据,源数据中的数据有可能会出现错误,根据不同的错误类型,在提取数据时要采取相应的手段来处理这些错误数据;对于原数据中部分记录中的某些数据项出现空值或不规范值,可以利用系统的数据筛选功能将这些数据筛选出来再进行手工处理;对于一些可疑数据,则要看具体情况,如某个学生的学期平均成绩,则要查询该学生的所有课程成绩,如有部分课程成绩为空,则可认为该同学部分课程缺考,当以零分参加计算平均值,如果该同学所有成绩都为空,则可认为该同学在该学期发生变更(如休学或退学),此时应当删除该无效记录;另外,抽取后的各表数据要保持一致性,如发现抽取后的学生信息表中的人数和成绩表的人数不一致,即一张表中的记录在另一张表中没有对应的数据,则应删除这些记录,以免对后续的分析造成麻烦。

数据汇总和加载。从源数据库抽取的数据大多是细节数据,如学生的成绩数据存储的是每学期每门课程的成绩,而管理者在对基础课成绩做趋势分析时需要的是每学期或每学年的成绩数据,因此,还需要对抽取的数据在不同的维度层次上进行汇总。接下来将以上经过处理的数据加载到数据仓库,本系统采用MicrosoftSQL Server中的DTS功能将数据导入目的数据仓库。

1.3构建成绩管理数据仓库

维表和事实表的设计和事务型数据库设计没有区别,在此就不叙述维表和事实表的设计过程。星型模型是最流行的数据仓库导出数据层的设计结构。星型模型通过使用一个包含主题的事实表和多个包含事实的非规范化描述的维度表来执行典型的决策支持查询[5]。根据维表和事实表的设计,本系统采用星型架构。图1是教学管理系统的维表和事实表的星型结构图。

图1 成绩管理系统星型模型

2数据展示及分析

2.1学生维成绩分析

学生维成绩分析就是针对某个学生单科成绩在不同学期所发生的变化或某个班级所有学生成绩的分布趋势。由于本课题主要针对实用英语和计算机两门课程的成绩分析,对学生维的成绩分析没有实际意义。因此,在此暂不做分析。

2.2教师维成绩分析

教师维成绩分析主要是把教师作为维度,从专业维、班级维和学年学期维来观察分析成绩的差异。例如,可以针对同一教师所授的不同班级学生做成绩分析,虽然入学时各班级学生并没有按照成绩好坏来分班,各班的成绩相差不大,后来可能受其它因素的影响导致同一门课程同一个授课老师,但是成绩却相差很大;还可以针对同一教师,将不同时期所带班级的学生成绩进行比较,找出差异,对于成绩较好的学期可以总结出在这一段时间内教师的授课优点,对于成绩较差的学期可以总结该段时间授课的缺点和影响成绩的因素,例如是否有些学期教学周数较多,而有些学期周数较少造成课时的差异或者是否有不同专业该课程开设在不同学期造成的成绩差异。图2是教师维的分析。

图2教师维成绩分析

从图2可以看出以下两点:

第一,在平行班的教学中,10级计应1班和10级计应3班成绩竟然相差十几分,而这些班级是由同一教师授课的。究其原因,这些班级中是由不同的班主任管理的。不同的班主任,他们管理方式不同,班级文化不同,学生的学习氛围不同,学习效果也就不同。如10级计算机应用专业3个班中2班的成绩较低而3班的成绩最高。经调查发现,3班的班主任对学生要求非常严格,不允许学生无故旷课,不随意批请假条,还经常给同学召开班会,这样,学生的学习氛围很好,都愿意去学,自然成绩就好。而作为平行班的10级2班班主任是另外一个老师,该班的管理较松散,学生的学习积极性很差,还有些学生经常旷课,整个班级的学习风气很差,因此学习效果也就很差。针对此现象,学校应采取一定的措施综合对班主任进行考评,而考评结果可以与待遇或年终奖金挂钩,从而健全学校教职工的激励机制。

第二,对于相同专业不同班级,不同老师所授课程的成绩有时也有很大的差距。例如,同是10级郭常根老师所带班级的平均分要比杜林老师的高出10多分,分析原因,原来是郭常根老师带这门课程已有几年的教学经验,而杜林老师带这门课程时间较短。此时学校要考虑在教学安排上对于课程安排尽量让同一个老师带相同的课程。同时学校在教学安排中要综合考虑班级学生自身的素质、班主任和授课教师的因素。

2.3学年学期维分析

从学年学期维可以分析所有课程在不同时间的成绩趋势。图3是所有学生的计算机基础和实用英语B级在每学年的成绩比较。可以看出,计算机基础的成绩在不同学年呈上升趋势,而实用英语B级在2011-2012学年的成绩较低。经过进一步分析,计算机基础在2011-2012学年以后采取了激励机制,授课老师比以前更加尽心尽责辅导学生操作。而实用英语B级2011-2012学年调换了几个年轻老师授课导致成绩下降。作为学院教学管理者,要想提高基础课的成绩就要进一步采取一些措施,例如将激励机制同时应用到实用英语上,同时加强对年轻老师的培训,使他们尽快成长起来,以提高基础课成绩。

图3学年学期维切块分析结果

3结束语

本文从某高校近几年的部分学生成绩相关数据出发,使用OLAP技术对该部分数据进行分析,从而找出成绩变化的趋势,成功地分析变化的原因,最终为该校的管理者提供了有效的决策依据和初步的决策建议。在此,该系统只是提供了少量的数据分析结果,我们可以将此方法推广到其它课程,甚至是整个学校的教务系统,这将会更加有效地保障教学效果。

参考文献:

[1] 张雪. 数据仓库技术在高校信息系统中的应用[J]. 电子技术与软件工程, 2014(21): 212.

[2] 何玉洁, 张俊超. 数据仓库与OLAP实践教程[M]. 北京: 清华大学出版社, 2008: 5.

[3] 夏火松. 数据仓库与数据挖掘技术[M]. 北京: 清华大学出版社, 2011.

[4] 马春艳, 曲伟峰, 化松收. 基于数据仓库、OLAP和数据挖掘的智能决策支持系统研究[J]. 无线互联科技, 2013(3): 132, 154.

[5] 陈志泊. 数据仓库与数据挖掘[M]. 北京: 清华大学出版社, 2009: 43.

Applied Research of Data Warehouse and OLAP in the Decision-making System of Teaching in Universities

ZHAN Xiao-yi

(Anhui Sanlian University, Computer Engineering Department, Hefei 230601, China)

Abstract:In this paper, with the aid of a university educational administration system of teaching data, using the ETL (Extract-Transform-Load) technology to Extract suitable for the analysis of the theme data in data warehouse, and using OLAP technology to multi-angle analyses on these data thus we find out the performance change trend, analyses the reasons of the change successfully, in the end, provide effective decision-making basis and preliminary decision-making advice for the school managers.

Key words:data warehouse, teaching decisions, OLAP, multi-dimensional analysis

文章编号:1007-4260(2015)03-0117-03

中图分类号:TP392

文献标识码:A

DOI:10.13757/j.cnki.cn34-1150/n.2015.03.031

作者简介:占小忆,女,安徽怀宁人,硕士,安徽三联学院计算机工程学院讲师,研究方向为数据仓库和数据挖掘。

基金项目:安徽三联学院项目(2012012)。

收稿日期:2015-06-09

网络出版时间:2015-8-25 15:40网络出版地址:http://www.cnki.net/kcms/detail/34.1150.N.20150825.1540.031.html

猜你喜欢
数据仓库
基于数据仓库的数据倾斜解决方案研究
地理信息数据仓库的技术研究
七大云计算数据仓库
基于数据仓库的住房城乡建设信息系统整合研究
页岩气工程大数据仓库建设与管理系统开发
基于数据仓库的商务智能经营系统设计与实现
探析电力系统调度中数据仓库技术的应用
数据仓库系统设计与实现
基于数据仓库的数据分析探索与实践
数据复用在存储数据仓库中的运用