基于商业智能构建高校智能体系的现状分析和研究技术

2014-11-26 12:06彭红利PENGHongli王艳WANGYan
价值工程 2014年5期
关键词:商业智能数据仓库数据源

彭红利PENG Hong-li;王艳WANG Yan

(①西安建筑科技大学,西安 710055;②西安航空职业技术学院,西安 710089)

(①Xi'an University of Architecture and Technology,Xi'an 710055,China;②Xi'an Aeronautical Polytechnic Institute,Xi'an 710089,China)

1 国内外研究开发现状和发展趋势

我国的高等教育研究从20 世纪90年代到现在,经过了信息时代开始走向一个新的阶段,更加的国际化,在教育研究方面表现出越来越多的技术化和专业化。现在的高等教育研究越来越多的使用到互联网和数据库,这就是研究技术化的集中体现。一些大学从很早的时候就开始基于计算机化和网络化开展各项事务,比如学生注册选课系统、交费系统、工资系统、财务系统等,这对于高等教育研究来说是前进的一大步。而且在大学管理的很多个领域都可以应用到这些理论和模式,比如规划研究、学生事务的研究、财政状况的研究、教师事务的研究等。这也是目前美国院校研究所涵盖的六个主要研究内容。

我国的商业智能技术要远远的落后于一些发达国家。与此有关的一些研究报告显示,在2006年,世界上的商业智能系统的市场规模已经达到了140 亿美元。这个商业智能系统在国外被应用的比较广,而且很成功,比如借助了商业智能系统的cadbury 巧克力公司,它的市场份额就在很短的时间内提升了2%等,还有很多这样成功的应用商业智能系统的案例。

现阶段我国的高等教育信息化主要体现在三个方面:一是包括档案、人事考勤等在内的行政管理类;二是包括教务系统、就业管理、新生入学管理等在内的教学教辅类;三是包括水电缴费、上机管理、门禁管理、校园网缴费在内的一卡通应用类。并且这每个系统之间都是一个独立的个体,它们的结构、分布情况都是不一样的,这无疑会给信息的整理工作带来很多的挑战。如果高校的领导想整体的了解一下高校的状况,没有的一个直接的途径,必须先进入每个系统,然后再通过手工整理每个系统中的信息和数据,最后汇总起来才可以。所以,现在很多的高校开始把各种应用系统整合在一起,建立一种统一的信息门户,实行单点登录,只有这样,数据的整合工作才能变得方便和快捷。

总之,虽然采用商业智能技术对高校的信息整合工作很有益处,但是现阶段在我国的普及面还不是很广,甚至一些高校还仅仅处在起步阶段。所以以高等教育院校积极的普及这种商业智能系统,为更多的用户提供决策支持。

2 项目研究内容、关键技术和研发目标

2.1 研究内容

2.1.1 学生事物的研究 按系部或二级学院按班级对学生个人全部信息,学生每学期所选课程,学生每学期各门功课考试成绩。

2.1.2 教师事物的研究 按系部或二级学院对教师个人信息,教师工资和课时费,教师每学期所上的课程,课程名称和课时,教师每年的科研项目,发表论文。

2.2 关键技术

2.2.1 数据仓库建立 数据仓库实际上是一个“以大型数据管理信息系统为基础、附加在这个数据库系统之上地、存储了从企业所有业务数据库中获取的综合数据的、并能利用这些综合数据为用户提供经过处理后的有用信息的应用系统”,它绝不仅仅是一个简单的信息库。

ETL (ExtractionTransformationLoading) 就是抽取、清洗、转换、装载,是数据仓库在实现过程中,将数据由数据源系统并向数据仓库系统加载的主要过程。ETL 过程关系勤数据地质量,这是非常重要的一个环节,它是数据整合的解决方案,也是建立数据仓库系统的关键一环。用户从数据源抽取出所需的数据以后,经过对数据清洗,最终按照预先定义好的数据仓库的模型,将数据加载到数据仓库中去。

2.2.2 联机分析处理 1993年关系数据库之父(EECodd)首先提出了联机分析处理 (on -LineAnalytiealProcessing,oLAp),这是一种能够为准确定义多维模型、操纵多维立方体提供技术基础。这项技术是孕育用户分析大型数据库对数据包含信息深入洞察的技术。OLAP 具有汇总、合并和聚集的功能,它还能够从不同的角度观察信息,它是一种分析技术。但是在采用OLAP 的工具的时候需要其他分析工具的辅助,它虽然支持多维分析和决策,也可以进行深层次的分析,但只是靠OLAP 是不能的。

2.2.3 数据挖掘 通过分析和分类大量的历史和存储数据,可以发现有效的数据模式与关系的过程就是数据挖掘(DataMining,DM),其中还包括过去和预测未来趋势的有用信息。数据挖掘是一门涉及面很广的交叉性学科,包括机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术,同时它也是一种发掘型的工具、是一种决策支持的过程。数据挖掘可以做到联机分析处理所不能做到的工作,它可以发现复杂精细的答案。

数据挖掘能够作为一种依据,利用预定的规则,它可以帮助挖掘和分析数据库和数据仓库中的已有数据,然后识别与抽取出隐含的模式和有趣的知识,决策者在决策时往往会参考此项数据。从数据中发现模式是数据挖掘的目的,模式按照功能的不同可以被分成两大类:预测型(Predictive)模式、描述型(Deseriptive)模式。

2.3 研发目标 在高等院校的校园网站上,根据用户的不同需求,可以直接抽取原始数据,生成相关的数据报表或者是数据分析图。

项目将采用商业智能将高校信息系统中的数据转化为知识,帮助学校高层领导做出一些重要决策。

3 技术方案及创新点

3.1 技术方案 本项目的研究工作主要包括商业智能理论分析,商业智能活动图如图1 所示,商业智能架构图如图2 所示。实现商业智能的步骤是建立数据仓库、根据主题建立数学模型,数据挖掘及产生数据分析结果。

①在进行商业智能系统的总体架构设计前,需要先进行需求分析。

②在数据仓库设计的过程中,应该注意一些问题。比如分析不同用户的主题时,应该先分析同类数据源和异类数据源的不同,并对用户的需求进行一个充分的掌握;建立面向主题的数据仓库时,应选择MicrosoftSQLServer2005数据库管理系统;海量的数据可能会对数据仓库的应用和性能带来一定的影响,这时可以采取分区表技术解决。

③设计ETL 程序包应该以SQLServer2005 的5515 服务为基础,然后创建一个中间数据库,对多个业务系统数据源进行抽取、清洗、转换、加载,在这个过程中也应该考虑到ETL 程序包的执行效率优化的问题。

图1 商业智能活动图

图2 商业智能架构图

④研究相关的OLAM 相应理论,在数据仓库的基础上,利用SQLserver2005 的SSAS 服务,创建了面对主题的多维分析模型,并对其进行了分析;以sQL server2005 数据挖掘的流程为指导,在多维分析模型的基础上创建了挖掘模型,面对探讨的问题,讨论了基于MierosoftsQLserver2005的决策树算法,实现了基于OLAM 技术的各类指标的查询、分析与挖掘。

⑤要想展现数据的多样化,那么系统前端数据展现平台应该采用SQLServer2005 Reportserviees。

3.2 创新点

①提出将商业智能应用于高校信息系统。目前商业智能系统已经随着高校校园信息化进程的推进而得到了广泛的应用,但是各应用系统的数据是分布的、异构的、彼此独立的,信息不能互通。本项目研究有效解决各种应用系统的数据整合问题。

②本项目提出了以数据仓库技术为核心、以联机分析处理技术和数据挖掘技术为手段的商业智能解决方案。它可以满足各种不同用户的需求,最终形在报表和统计分析图,也可以用于指导学校高层领导的重要决策。

[1]蒋萌.中职学校数字化校园建设的实践探索[J].浙江现代教育技术,2009(01).

[2]刘小波,陈志民,叶志婵,刘华日.无线网络在数字化校园中的应用[J].现代计算机(专业版),2010(04).

[3]杨福燕.多媒体网络教学之探讨[J].科技信息,2009(17).

猜你喜欢
商业智能数据仓库数据源
基于数据仓库的住房城乡建设信息系统整合研究
Web 大数据系统数据源选择*
什么是商业智能?它的定义和解决方案
基于不同网络数据源的期刊评价研究
分布式存储系统在液晶面板制造数据仓库中的设计
关于实时商业智能的文献综述
探析电力系统调度中数据仓库技术的应用
广东省高速公路联网综合信息商业智能系统
基于数据仓库的数据分析探索与实践
基于真值发现的冲突数据源质量评价算法