课程教学质量分析系统的研究与实现

2012-04-29 00:44黄雁
电脑知识与技术 2012年5期
关键词:数据仓库

黄雁

摘要:基于数据仓库的数据挖掘是涉及人工智能、机器学习和数据库等多学科的一个相当活跃的研究领域。随着技术发展,如何更好地将数据仓库和数据挖掘技术应用于教育领域,进行针对教学质量测评系统数据仓库、教学质量相关主题数据立方体的数据挖掘,已成为目前教育领域应用研究的重点问题。论文参照学校教务部门对教学质量的评价体系,重点研究以考试成绩为主线的课程教学质量的分析方案,以Delphi为开发平台设计和实现了一个“课程教学质量分析系统”。论文在介绍了对数据仓库、联机分析处理(OLAP)等相关概念之后;给出了课程教学质量分析系统的分析模型和数据模型的设计;展示了课程教学质量信息的联机分析处理结果。

关键词:数据仓库;OLAP;课程教学质量;多维数据模型

中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)05-0977-07

Research and Implementation of Course Teaching Quality Analysis System

HUANG Yan

(Jiangsu Radio & TV University, NanJing 210036, China)

Abstract: Data Mining, based on Data Warehouse, is a quite active research field which deals with a wide range of disciplines including Ar? tificial Intelligence, Machine Learning, and Database etc. Along with the development of techniques, how to apply the techniques of Data Mining and Data Warehouse to the education and implement the data mining on the data warehouse of the teaching quality evaluation sys? tem and subject-related data cube has become the key question of application research in the current educational field. This paper focuses on the research of the grade-centered course teaching quality analysis scheme which references the teaching quality evaluation system ad? opted by Educational Administration Office, designs and implements a“Course Teaching Quality Analysis System”based on Delphi. After briefly introducing the conception of Data Warehouse and OLAP, this paper describes the design of the analysis model and data model of the system, and shows the results of OLAP on information of course teaching quality analysis.

Key words: data warehouse; OLAP; course teaching quality; multidimensional data model

当前社会对人才需求的数量及程度越来越高,高等院校的招生规模不断扩大,学校之间的竞争也日益加俱,由此也产生了一些新的问题,比如学校的生源问题、专业课程建设等问题,都是学校急于解决的问题,特别是社会对毕业学生能力的认可度,直接反映了学校的教学质量和生存能力。

学校对教学质量进行监督、检查,一般是采用以下方法:1)通过对教师进行测评打分,评价教师的教学水平及课程教学质量;2)通过对课程考试的成绩进行分析,从宏观到微观地进行总结,通过对考试结果的分析,获得相关因素对教学的影响。

以上方法,尤其是在对课程成绩分析的过程中,需要对与课程成绩相关的各种实际因素进行分析处理,产生的数据量非常大,大多数学校一般都是采用电子表格软件或一个简单的数据库管理系统来完成,在处理过程中,需要对大量的数据进行收集、录入、处理,由此产生的工作量是十分繁重的。当然目前市场上也有一些教学管理软件,但主要是侧重于日常的管理工作,一般只能完成简单的统计功能,不能够利用以往积累的大量数据进行分析,对教学质量的评价功能相对较弱。

因此,一个良好的教学质量测评软件系统应综合联机事务处理(OLTP)和数据仓库中的联机分析处理(OLAP)、数据挖掘(Data Mining)等技术,来解决高等院校中教学管理中的教学质量测评难题。

1数据仓库与OLAP

1.1数据仓库的概念

数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。它从历史的角度组织和存储数据,并能集成地进行数据分析。数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时变性。

一个完整的数据仓库系统的体系结构包含了数据源、数据存储与管理、联机分析处理服务器和前端工具四个层次,其中数据源是基础,数据存储与管理是核心。如图1所示。

数据仓库的基本功能包含:数据抽取,数据筛选、清理,清理后的数据加载,设立数据集市,完成数据仓库的查询、决策分析和知识的挖掘等操作。

1.2多维数据模型的概念

多维数据模型是为了满足用户从多角度多层次进行数据查询和分析的需要而建立起来的基于事实和维的数据库模型,其基本的应用是为了实现联机数据分析。它包含事实表和维表两个部分。事实表用来记录具体的事件,包含每个事件的具体要素及基体发生的事情;维表则是对事实表中事件的要素的描述信息。基于事实表和维表,就可以构建出多种多维模型。

多维数据模型主要采用的是星型模型和雪花模型。其中星型模型结构比较简单,它以事实表为中心,周围链接维表而构成星型的结构,特点是设计简单、便于建模,容易理解和使用。雪花模型则是星型模型的扩展,它在星型模型的基础上,将维表分解成主维表和次维表,其中主维表与事实表直接关联,而次维表是与主维表关联。其特点在于减少了数据的存储量,但增加了查询的复杂性。

1.3 OLAP的基本概念

联机分析处理(OLAP- On Line Analytical Processing)是共享多维信息的、针对特定问题的联机数据访问和分析的快速软件技术。它通过多种可能的观察角度对多维数据进行快速、稳定一致和交互性的存取,它允许决策人员和高层管理对数据进行深入地观察分析,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员。

联机分析处理的主要特点,是直接仿照用户的多角度思考模式,从用户的不同分析角度预先为用户组建多维的数据模型,再对数据进行切片、切块、旋转、挖掘等多种操作,让用户能从多角度多侧面观察数据,深入了解包含在各种数据中的信息。它具有分析的快速性、多维性、灵活性和信息性等特点。

图1数据仓库体系结构

2课程教学质量分析系统的系统设计

2.1数据仓库系统设计

数据仓库的系统设计大体上分为以下几个步骤:

2.1.1概念模型设计

概念模型设计所要完成的工作是:1)对系统进行边界界定;2)对系统的主要主题及其内容进行确定。概念模型通常用实体-联系法(E-R法)的形式表示,其结果在于在原有的数据库的基础上建立了一个较为稳固的概念模型。由于概念模型的设计是在较高的抽象层次上进行的设计,因此建立概念模型时可以不用考虑具体技术条件的限制。

2.1.2技术准备工作

该阶段的工作包括:技术评估,技术环境准备。成果是形成技术评估报告、软硬件配置方案、软硬件系统总体设计方案。

2.1.3逻辑模型设计

逻辑模型设计是数据仓库设计中的重要一环,因为它能直接反映用户的需求,同时对系统的物理实施有着重要的指导作用。其主要工作有:1)分析并确定装载的主题域;2)粒度层次划分;3)数据分割策略;4)关系模式定义;5)记录系统定义。其结果是对每个当前要装载的主题的逻辑实现进行定义,并将相关内容记录在数据仓库的元数据中。

2.1.4物理模型设计

物理模型设计所做的工作是确定数据的存储结构,确定索引策略,确定数据存放位置,确定存储分配,是逻辑模型在数据仓库中的具体实现。

2.1.5生成数据仓库

这一步所要做的工作是在具体环境下进行数据接口的编程,并装入数据。其结果就是形成一个具有相对完整数据的数据仓库,以便提供在其上的各种数据操作。

2.2课程教学质量分析系统的结构设计

2.2.1系统功能层次结构

从对课程质量分析的需求角度出发,整个系统按其实现功能的层次进行设计,主要分为基础数据的采集、数据归纳与管理、数

1)基础数据的采集

这部分数据是系统分析所需的基本数据信息,涉及课程质量评价体系的各个方面,主要包括针对学生、教师、专业及课程等方面的数据。采集到的数据经过筛选、归纳、整理和传输,加入到数据仓库的数据库中。同时通过特定的数据抽取机制收集和截取在评测系统、教学管理系统、教师管理系统等子系统中发生变化的数据,并将这些数据更新补充到数据仓库的数据库中。

2)数据归纳管理

对数据仓库中的数据进行分析归纳,通过确定的分析主题建立相应的多维数据模型,同时设置刷新的机制,及时更新数据。本系统主要建立了以学生考试成绩为分析主题的多维模型,同时采用了定时(按学期)、增量更新的机制来更新数据仓库,最大程度地保证数据的完整性。

3)数据联机分析处理

按照确定的分析指标,通过对数据仓库中的多维数据进行相关的分析、挖掘处理,得到相应的分析结果。本系统主要从影响课程质量的几个主要方面(课程、时间、教师、学生、地区等)入手,分析影响课程教学质量的主要原因,从而找出其中的规律。

4)展示应用

将前面的分析处理结果,通过直观的图形、表格或其他方式进行展示,为分析者提供相关反馈信息。

图2系统功能结构图

2.2.2应用系统总体架构

整个系统按层次化结构方式进行设计,以数据仓库为核心,集成各种数据采集、归纳、分析、管理、更新、展示应用等模块。系统总体框架如图3所示。

图3应用系统总体架构

系统的最下层由基础数据源(各种数据信息库)、数据抽取器和数据源监视器三部分构成,它是为整个系统提供数据的部分。系统中间层以数据仓库为中心,集成数据集成器和数据管理两大模块,是整个应用系统的数据核心。系统的最上层是面向最终应用的部分,主要由多维数据建模、联机数据分析和结果展示三大部分构成,它是整个系统的重点,是直接面对用户、满足用户需求而设计的部分。

2.2.3课程教学质量分析系统的模型设计

1)概念模型设计

课程教学质量分析系统的需求主要是以课程的学生考试成绩为依据,结合课程、时间、班级、地区、教师、学生情况等多角度进行分析,从而得到不同的因素对课程质量的影响程度,以达到分析改进课程教学质量的目的。概念模型设计结果如图4所示。①分析的主题

本次概念模型的设计原则是以学生成绩分析为主题。

学生成绩分析主题:课程的考试成绩是反映课程教学质量的一个有效的评价标准,主要从学生的考试成绩这一角度入手,分析课程、时间、教师、学生以及地区等各方面因素对课程教学的影响程度。

图4学生成绩分析主题的分析模型

②维度与指标

针对该分析主题的维度与指标的设计结果见表1。

表1维度与指标

2)逻辑模型设计

本系统采用星型模型图来构造学生成绩分析主题的逻辑模型。

星型模型图包括维度、指标和详细类别三种逻辑实体。星的中心是指标实体,也是用户查询的中心。在学生成绩分析这一分析主题中,指标实体就是学生的考试成绩。

维度实体可以使数据仓库的用户从不同的角度浏览指标数据,在实际设计中还可以帮助用户减少指标实体内数据的行数。我们根据考试成绩这一指标实体,定义了课程、时间、教师、班级、学生、地区等维度实体。通过将E-R图转换成星型图,完成了概念模型到逻辑模型的转换(见图5)。

图5星型图中的指标实体和维度实体

为学生成绩分析主题确定的事实表和维表的属性如下:

学生成绩事实表:学号、专业代码、课程代码、班级代码、教师代码、地区代码、考试时间、考试性质、成绩学生维表:学号、姓名、性别、出生年月、专业代码、班级代码、地区代码、联系方式

课程信息维表:课程代码、课程名称、课程性质、专业代码、总学时、理论学时、实践学时

教师维表:教师代码、教师姓名、性别、年龄、职称、部门代码、学历、毕业专业

时间维表:年、月、考试时间、学期、周

地区维表:地区编号、地区名称

班级维表:班级编号、班级名称、专业、班级人数、班主任姓名

3)物理模型设计

逻辑模型设计完毕后,可以进行多维数据库的物理模型设计。其设计过程与关系数据模型的方法相类似。通过对事实表和维表进行分析、定义,确定其数据标准、定义实体及特征、数据容量及更新频率等相关内容,完成物理模型的设计。

以学生成绩为分析主题的物理模型设计结果见图6。图中同时列出了主要字段的类型,主、外键及不同表间的关联关系。

图6成绩分析主题的物理模型

3课程教学质量分析系统的实现

3.1开发环境与工具

本系统采用的开发环境为Delphi,它是一种方便、快捷的Windows应用程序开发工具。它使用了Microsoft Windows图形用户界面的许多先进特性和设计思想,采用了弹性可重复利用的完整的面向对象程序语言、当今世界上最快的编辑器、最为领先的数据库技术。

本系统的开发也采用了TeeChart控件,它是西班牙Steema SL公司开发的一个图表类控件,可以生成柱状图、折线图、饼图等形式的图表。

3.2用户分析界面

系统可采用单机运行的方式,用户在输入必要的数据后,即可进行分析,其主界面如图7。左边可以选择分析的维度,右边以图形的方式展示分析的结果,例如图8。

图7用户分析主界面

图8多维分析展示界面

3.3数据库的实现

在本系统中,共创建了以下几个数据表,各个数据表之间可通过关键字段相互关联。

图9数据表

3.4分析结果的实现与展示

本系统是从与课程质量分析关系比较密切的几个方面进行研究的,也就是从时间维、地区维、班级维、教师维、课程维和学生维这六个方面进行分析展示的,下面作简要说明。

1)时间维度分析(图10)

分析相同课程在不同的学期里成绩的变化。

2)地区维度分析(图11)

分析在相同学期里,不同地区的相同课程的成绩比较,从而得到课程教学质量在不同地区的差异情况。

3)教师维度分析(图12)

分析相同课程在不同教师教授过程中,学生成绩的比较,从而反应教师的教学质量。

4)学生维度表(图13)

分析在一个班级或整个地区中,相同课程男、女生成绩的比较,从而可以看出哪些课程对于男生相对容易,哪些课程对于女生相对容易。

5)课程维度分析(图14)

分析同一地区或同一班级中,不同课程成绩的比较,从而反应出哪些课程教学质量好,哪些质量差。

6)班级维度分析(图15)

主要从班级的角度出发,分析相同课程在不同班级中的考试成绩的比较。

图10

图11

图12

图13

图14

图15

4结束语

本文的工作是以笔者所在学校课程教学质量分析为实际应用目标的对数据仓库与联机分析处理系统实现的尝试。所开发的“课程教学质量分析系统”以课程的考试成绩分析为主线,结合本校的分层管理的特点,从时间、地区、学生基本情况、课程教师情况等影响课程成绩的主要因素入手,进行数据仓库和多维数据模型设计,并对数据进行切块、切片、旋转、钻取等联机分析处理操作,实现了对分析结果的图表化展示,基本达到了辅助教学质量测评的目的。但是,评价课程教学质量的因素是多方面的,本文仅仅是着重于课程成绩这一主要因素进行分析,因此,如何针对其它因素进行课程质量综合分析,还是以后需要继续补充和钻研的内容。

参考文献:

[1]康晓东.基于数据仓库的数据挖掘技术[M].北京:机械工业出版社,2004.

[2]曹煜.高校教学质量测评系统的开发及数据仓库与数据挖掘技术在其中的应用[D].沈阳:东北大学,2005.

[3 ]陈志泊.数据仓库与数据挖掘[M].北京:清华大学出版社,2009.

[4]张兴会.数据仓库与数据挖掘技术[M].北京:清华大学出版社,2011.

[5]吴建兰.基于数据仓库的教学质量监控系统[D].厦门:华侨大学,2005.

[6]雷松泽,李文轩.基于数据仓库的高校OLAP系统设计[J].现代电子技术,2005(20).

[7]童爱红,张琦,胡光兵.Delphi7应用教程[M].北京:清华大学出版社,北京交通大学出版社,2004.

[8]殷剑宏.TeeChart控件的应用[N].计算机世界,2001.

猜你喜欢
数据仓库
基于数据仓库的数据倾斜解决方案研究
地理信息数据仓库的技术研究
基于数据仓库的住房城乡建设信息系统整合研究
页岩气工程大数据仓库建设与管理系统开发
分布式存储系统在液晶面板制造数据仓库中的设计
探析电力系统调度中数据仓库技术的应用
数据仓库系统设计与实现
基于数据仓库的数据分析探索与实践
数据复用在存储数据仓库中的运用
论销售数据仓库的需求分析和概念模型设计