商务智能理论在高校信息化管理中的应用分析

2009-05-07 05:48陈树胜褚贵忠
中国教育信息化·高教职教 2009年4期
关键词:决策支持数据仓库数据挖掘

陈树胜 褚贵忠

摘要:本文介绍了商务智能理论的主要内容、关键技术和目前的应用,认为商务智能同样可以应用于教育领域的决策支持,并简要分析了在高校教务管理、人事管理和数字图书馆建设等几项工作中引入商务智能的可行性及应用思路。

关键词:商务智能 数据仓库 数据挖掘 决策支持

中图分类号:G203 文献标识码:B 文章编号:1673-8454(2009)07-0085-03

一、问题的提出

高等教育的快速发展和信息技术的广泛应用推动了高等教育信息化的发展,当前各高校基本都已建立了自己的门户网站和相应的管理信息系统,并运用于日常管理。这些管理信息系统的引入对各部门工作有积极作用,但也呈现出以下几个方面的问题:(1)这些管理信息系统最初都是基于本校内不同部门的业务流程来设计开发,以满足本部门管理信息化的需要为目的,不同部门都设计开发了自己的一套管理信息系统,各自为政,前台的数据操作和后台的数据管理环境也不尽一致,未能实现部门间横向的数据和信息共享。这也就是所谓的“信息孤岛”现象。(2)这些管理信息系统基于的都是传统的关系数据库系统,进行的都是日常的事务性处理,即主要是数据的录入、修改、查询,以及简单的统计、报表等,实际上只是部分代替了原来的手工管理工作,对数据的深层次分析功能尚显不足。(3)这些管理信息系统经过若干年的使用,都积累了大量的历史数据,这些历史数据对信息管理者来说却几乎成了“鸡肋”,弃之肯定舍不得,但似乎又不能从中再得到更多的东西。大量的历史数据被深埋于各个管理信息系统中,但这些数据的潜力和其中所蕴含的价值却不能或难以加以利用,反而在数据的维护上要花费大量的时间和精力,有研究者称之为“信息囚笼”。

以上这些就要求部门尤其是学校层面的管理者,对当前管理信息系统中的数据尤其是海量的历史数据加以整合利用,从中发现这些数据背后所隐藏的价值,以进一步改进管理工作,提高管理效率,尤其是对学校层面的决策工作起支持辅助作用。

到目前为止,还没有专门为教育领域量身定制的此类专用系统和工具,不过,近几年在商业领域风头正劲的商务智能理论却为这些问题提供了解决之道。尽管商务智能理论源于商业领域,最初是为解决商业领域中相关问题而提出的,但它的思想却同样适用于教育领域。本文就对商务智能理论在信息化背景下的高校管理中的应用作一分析。

二、商务智能理论的主要内容

商务智能(BI,Business Intelligence),也译为商业智能,其概念最早是Gartner Group的Howard Dresner于1996年提出的。当时将商务智能定义为一类由数据仓库(或数据集市)、查询报表、联机分析、数据挖掘、数据备份和恢复等部分组成的,以帮助企业决策为目的的技术及其应用。商务智能系统建设的目标就是要为企业提供一个统一的分析平台,充分利用原有系统中由业务处理所积累的宝贵数据,对其进行深层次的挖掘,并从不同的角度分析企业的各种业务指标和构建业务知识模型,进而满足决策的信息需求,实现通过技术辅助决策的功能。

1.商务智能的含义

在商务智能发展的进程中,企业界和学术界从不同视角形成了很多看法,有一个名为《ttnn BI观点》的电子期刊对比较典型的几种观点进行了研究,大致分为4类:

(1)BI是努力——Microsoft主张的;

(2)BI是智能和知识——SAS倡导的;

(3)BI是过程——DMReview定义的;

(4)BI是工具和技术的集合——以Gartner、IDC、IBM、SAP和MSRT代表的。

目前,商务智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。笔者以为,可以把BI理解为一种管理理念,一种管理思想,是一套完整的问题解决方案,它以现存的丰富的业务数据为基础,运用数据库管理手段,结合数据仓库、OLAP(On-Line Analytical Processing,联机分析处理)、数据挖掘等技术,从海量的历史数据中发现潜在的知识和价值,最后呈现在用户和管理者面前,运用于企业的决策,从而提高企业的智能和竞争力。基于此,BI应具有以下几项关键的支撑技术。

2.BI的四大关键技术

(1)数据仓库(Data Warehouse)和数据集市(Data Mart)

实施BI的前提就是要获得企业大量的内外部数据,这需要数据仓库和数据集市技术的支持。数据仓库是指把多个数据源的数据收集起来,以一种一致的存储方式保存所得到的数据集合。数据仓库创始人之一的W.H.Inmon将其定义为:“数据仓库是一个面向主题的、集成的、稳定的、包含历史数据的数据集合,它用于支持管理中的决策制定过程”。在构造数据仓库时,要经过数据的ETL过程,即抽取(Extraction)、转换(Transformation)和装载(Load)过程。通过这一过程,将业务系统中各种关系数据、外部数据、遗留数据和其他相关数据根据需求,以完整一致的形式放进中心数据仓库,再将这些数据以一定的数据模型加以组织,目前所使用的主要有星型模式和雪花模式两种。对数据仓库的研究主要就是数据模式的设计、数据清洗和数据转换、导入和更新等。

数据仓库通常是企业级应用,涉及的范围和投入的成本都非常大,实际应用中,也可以为某一部门建立一种适合自身应用的部门级数据仓库,称之为数据集市。数据集市着眼于特定的主题,可以理解为是整个企业数据仓库的子集。

(2)联机分析处理(OLAP,On-Line Analytical Processing)

联机分析处理又称多维分析,由Codd在1994年提出,它对数据仓库中的多维数据通过钻取、切片及旋转等操作,进行立体的多维分析和展现,从而使管理者能够从多种角度获得决策支持所需要的数据。理解OLAP,比较熟悉的一个例子就是Excel中的数据透视表。

(3)数据挖掘技术(Data Mining)

数据挖掘是指按照预定的规则对数据库和数据仓库中已有的数据进行信息开采、挖掘和分析,从中识别和抽取隐含的模式和规则,为决策者提供决策依据。这些模式和规则可以是预测型的,也可以是描述型的。在实际应用中,根据模式的实际作用,可以有分类模式、聚类模式、回归模式、关联模式、时间序列模式等,具体算法有聚类算法(Clustering)、回归算法(Regression)、神经网络(Neural Networks)、决策树(Decision Trees)、遗传算法(Genetic Analysis)、关联算法以及各种统计模型。

(4)BI的前端展示

为了使分析后的数据直观、简练地呈现在用户面前,需要采用一定的形式表示和发布出来,目前越来越多的分析结果是以可视化的形式表现出来。随着Web 应用的普及,商务智能的解决方案还应当能够提供基于Web 的应用服务,允许用户直接从浏览器端访问所需要的数据和信息。

3.我国目前商务智能的主要应用

商务智能的应用与行业信息化程度密切相关,当前商务智能的应用主要在商业领域。赛迪顾问调查显示, 2006年中国BI应用市场销售额达到15.87亿元(包括软件授权和服务), 市场份额占有依次为银行、保险、电信、能源、制造、政府、零售。这些领域的应用范畴主要集中在企业管理和客户关系管理(CRM)。如在企业管理中可进行销售分析、库存分析、采购分析、成本分析、人力资源规划分析等,在客户关系管理中可进行客户购买习惯分析(也称购物篮分析)、客户忠诚度分析、客户未来分析、客户欺诈风险分析等。

笔者以为,商务智能的应用具有普适性,不能也不应当只局限在商业领域内,只要一个企业(可以推广到任何组织)有大量的业务数据,积累了海量的历史数据,并且对这些数据有进行分析的需求,就可以引入商务智能,给各级管理者提供决策支持。教育领域也符合这些特征。以高校为例,随着高等教育全方位改革和信息化管理的推进,时下各高校的办学体制、办学模式、管理方式等都在发生着变化,高校在招生就业、教学、人事、数字化建设等各方面每天都有大量的日常业务,经过多年的信息化应用,也积累了海量的历史数据,而且这些方面的工作又直接关系到高校的办学质量和效益,关系到高校的未来发展。毫无疑问,这些数据对高校的部门管理和高层决策至关重要。如何有效地利用这些数据,从这些数据中发现挖掘出潜在的知识,提供决策支持,正是商务智能在高校应用的目的所在。

4.商务智能在高校管理中的应用分析

要想有效地运用商务智能方案,最关键的环节有两个:一是确定功能,明确要解决的问题,二是设计数据仓库。在数据仓库的设计上,关键点也有两个:确定主题和选择数据模型。一旦主题确定,不论是使用星形模式还是雪花模式,核心任务都是事实表和维度表的构造和确定,实际设计中星形模式使用的较多。这些工作完成以后,才可以考虑数据的来源、数据的ETL、采用何种分析和挖掘规则、算法以及最终的数据展示。对于以上所说的这些工作,很多软件厂商都提供了比较完整的方案,目前使用较多的是Microsoft推出的SQL Server,它的两个版本2000和2005都提供了BI的解决方案和相关工具,后者功能更多更强大一些。也就是说,工具的选择已不是问题,最主要的还是结合本身的实际,对实施BI的整体设计。下面就从前述的两个环节对高校管理中几个典型领域给以简单分析。

三、教务管理中的应用

教务管理是大学的主要日常管理工作之一,涉及学校、院系、教师、学生的诸多方面。随着教学体制的不断改革,尤其是学分制、选课制的展开和深入,教务日常管理工作日趋繁重复杂。教务管理工作需要处理大量的数据,如学生信息、课程信息、成绩信息、教师信息等。这些数据之间彼此存在联系,同时也隐含着一些重要信息。将商务智能应用于教务管理中,把这些重要的信息从数据库中抽取出来,可以为教务管理人员提供有力的信息支持和工作指导,提高工作效率。此外,对数据挖掘工具的有效利用,也能较客观地反映教学系统中存在的问题,为决策提供重要依据。

1.在高校的教务管理中

在高校的教务管理中,可以解决以下几方面的问题:(1)使用分类和回归方法运用于学生的个性化培养;(2)使用关联和时间序列运用于学生选课,以合理设置课程,寻求最佳的排课方式;(3)使用聚类和关联运用于学生的成绩分析,有效评价学生的学习效果。以教学为例,可将数据仓库的主题定为“教学分析”,以“成绩”为事实表,包括学号、课程号,成绩等相关字段,位于星形模型的中间。涉及的维表可有以下几个:

学生维表:学号,姓名,性别,年龄,生源地,专业,年级,培养方向等;

课程维表:课程号,课程名,课程类型,学时,学分,开课学期,考核类型等;

教师维表:教师编号,姓名,性别,年龄,学历,职称,研究方向等;

选课维表:学号,课程号,教师编号等。

时间维表:时间代码,学年,学期。

2.人事管理中的应用

高校人事信息资料数据量大,构成复杂,变动频繁,目前大部分用于人事信息的查询和统计,如果把这些大量的数据加以分析、挖掘,将对学校的人事考核、预测、培养、引进等各方面的管理规划起到重要的支持作用。

高校人事管理的主题可以有“绩效考核”、“人才引进”、“进修培养”等,涉及的维表主要有教师基本情况表、教学表、科研表、业务进修表等。再根据不同主题的需求组织数据来源,构造相应的数据模型。限于篇幅,不再具体给出。

这方面尤以关联规则结合时间序列最为合适,采用此规则对教师的年龄、学历、职称、专业、来源、研究方向、科研成果等因素进行分析,从中发现潜在的关联,将对学校的学科建设、师资队伍建设、优化学员结构、人才的引进和培养等各方面提供决策支持。

3.图书馆管理中的应用

目前各高校的图书馆管理信息化程度都比较高,纸质和数字资源丰富,借阅量大,流通快,每天都有大量的借还记录,从这一点说,高校的图书馆管理最符合商务智能的应用环境,相关研究也相对较多。利用商务智能,可以较好地解决以下几个方面的问题:(1)读者的需求分析和个性化服务:运用关联和聚类规则,按年龄、学历、专业等不同的因素,通过对读者的属性、特征、满意度等分析,挖掘读者的访问模式和借阅习惯,预测访问兴趣,从而有针对性地提供信息定制服务;(2)借阅规律分析:运用时间序列模式,分析读者借还图书的高峰和低谷,以此科学安排流通部门的工作,在人力、图书资源有限的情况下,为读者提供更多更优质的服务;(3)馆藏建设:运用回归和时间序列,分析不同专业、层次、研究方向学生的借阅历史,引导各类图书的采购、淘汰、书架布置等。完成以上任务所需要的数据主要涉及以下几个表:学生基本情况表、图书信息表、借还记录表、检索信息等,这些对实行信息化管理的各高校来说应是比较完备的。

四、结束语

以上只是对商务智能理论在高校管理中的几个典型应用作了简单的分析,限于篇幅,并未述及具体的问题解决步骤和相关的关键技术,有待于在实际的系统开发中具体实现。另外,以教育信息化带动教育现代化口号的提出,必将更进一步促进各高校的信息化管理水平,我们有理由相信,会有越来越多的高校管理工作可以运用商务智能,为各级管理提供决策支持,以全面提升高校的整体管理水平。

参考文献:

[1]朱德利.SQL Server 2005数据挖掘与商业智能完全解决方案[M].北京:电工工业出版社,2007.

[2]陆泉,陈静.决策支持系统实验教程[M].武昌:武汉大学出版社,2008.

[3]周瑾.我国商务智能研究[J].现代管理科学,2007(4).

[4]张小平,马垣,于淼.数据仓库在高校教务系统的应用研究[J].鞍山师范学院学报,2003(2).

[5]白菲,孟超英.数据挖掘技术在高校人事信息建设中的应用[J].教育信息化,2005(8).

[6]雷启明,周利平.数据仓库技术在高校图书馆管理中的应用研究[J].中国科技信息,2008(16).

猜你喜欢
决策支持数据仓库数据挖掘
基于数据仓库的住房城乡建设信息系统整合研究
基于并行计算的大数据挖掘在电网中的应用
分布式存储系统在液晶面板制造数据仓库中的设计
探析电力系统调度中数据仓库技术的应用
一种基于Hadoop的大数据挖掘云服务及应用
基于数据仓库的数据分析探索与实践
基于GPGPU的离散数据挖掘研究