史松+冀亚林+蔡娜+王霞+马成龙
摘要: 当今正处于信息高速发展的时代,数据量高速膨胀,难以在以前的系统中进行交流、共享和融合。为了整合数据资源、消除“信息孤岛”、构建企业发展蓝图,人们逐渐意识到顶层设计的重要性。很多企业针对自身发展建立了自己的企业架构进行顶层设计,而作为其核心的数据架构模型形式也根据不同行业体现出不同发展。本文主要对数据架构模型进行研究,阐述数据架构模型的作用及其相互关系。
Abstract: Today is in the era of rapid development of information, data volume of high-speed expansion, it is difficult in the previous system for communication, sharing and integration. In order to integrate data resources, eliminate the "information island", build enterprise development blueprints, people gradually realize the importance of top design. Many enterprises for their own development establish their own enterprise architecture of the top design, and as its core data architecture model is also reflected in different industries according to different development. This paper mainly studies the data architecture model, expounds the role of data architecture model and its relationship.
关键词: 企业架构;数据架构;数据模型
Key words: enterprise architecture;data architecture;data model
中图分类号:F279.23 文献标识码:A 文章编号:1006-4311(2017)33-0054-03
0 引言
数据和信息是21世纪的经济命脉。在信息时代,数据被认为是一项重要的企业资产。通常一个企业长期以来会积累大量的需求、说明、数据库、数据模型、程序以及各种信息技术成品构件,但是却缺少一个“总体设计”。
这并不是说哪个信息系统、数据库或者数据库管理系统(DataBase Management System,DBMS)是错误或者被误导的,只是说当前产生了大量的信息技术(Information Technology,IT)构件,并且亟需建立一个“总体架构”对其进行规范、优化甚至标准化。
随着企业的发展或者重组,企业数据扮演着越来越重要的角色。有的企业业务范围广,部门多,各项数据种类繁多,信息来源广泛、内容重叠、数据分散,没有统一的企业数据架构,缺乏顶层设计,很难使企业的信息化建设与其发展战略相一致。而且当今信息飞速发展,数据量高速膨胀,那些旧的信息系统都是由不同厂商在不同时期分别开发,造成有价值的数据在旧系统间难以交流、共享和融合,加剧了数据的破碎性,系统间缺乏信息共享,业务数据独立存在,形成“数据孤岛”。
本文认为,企业信息化想要建设的成功很大程度上依赖于系统模型的合理性和不同系统间标准的一致性,而企业级数据架构模型是企业信息化的核心所在,建立企业级数据架构模型,能够定义和统一整个企业信息化体系的数据标准,合理规划企业信息化建设前景,管理所需资源建设。并且企业数据架构模型也会提高信息定义的一致性,全面性,从企业全业务的角度,全面、一致的定义信息需求,指导所有未来系统开发,设计实现数据需求的蓝图,全面提升经营决策、运营管理、业务拓展和客户服务等方面的支撑能力。
1 企业级数据架构模型的定义
1.1 数据架构模型基本定义
企业级数据架构模型,是一种用来定义信息常规表示的方法。通过使用信息模型,我们可以使用不同的应用程序对所管理的数据进行重用,变更以及分享。企业数据架构可以帮助企业消除信息孤岛,建立一个共享、通用、一致和广泛的企业数据基础平台。[1]
这里提的企业级数据架构模型并不是数据仓库模型,而是站在整个企业业务的视角,对企业所有数据整体性描述。企业级数据架构模型是业务人员和IT人员进行沟通的媒介,同时也是企业内外进行交流的纽带。
1.2 数据模型结构
一个企业的数据架构的参考模型包括:
数据元素模型;
概念数据模型;
数据库逻辑模型;
数据库物理模型;
连接物理数据库和应用信息系统的视图模型。
上述五个数据结构层次形成了一个核心,围绕这个核心大量信息技术支撑件可以互联、互操作,并且是非冗余的。
我们可以把全部的信息技术产品,包括数据结构参考模型中的那些,统一都画在一个图里面,就会得到如图1所示的图。[2]
然后我們需要一个具有“元数据库”核心的应用信息系统。这种“元数据库”是从脑力劳动者框架的主要产品延伸得来的,包含了数据结构参考模型中的核心模型。这种“元数据库”的数据模型是高度工程化的,它真正支持相互关联、互操作性、非冗余性。[3]
2 数据架构参考模型
一直以来企业的数据架构及其伴随的数据模型都被看作是重要的资产。前文的图1说明了这种资产是多么重要。这种重要性不仅体现在数据模型组成了企业策略阐述的基础,而且数据模型还是所有信息技术产品最终的“交汇”所在。[4]endprint
数据架构中单独的数据模型都是相互独立的,而且分别处理不同的数据。这些架构促进了模型的完整性、互操作型和非冗余性。此外,“更高级”的模型可被用作创建“低级”模型的模板。
一旦完成了数据架构的参考模型,就可以作为一个框架来帮助理解组件模型的范围和相互关系。
这样的模型对于数据架构模型中组件实例之间的通信很有帮助。
我们对数据的自然概念,数据库部署和业务信息系统的理解都经过了多年的发展,在此基础上,可以认为数据结构参考模型(参见图2)有6个单独的模型组成。[5]这6个模型分别是:
数据元素模型;
概念数据模型;
逻辑数据库模型;
物理数据库模型;
SQL视图模型;
XML文档结构模型。
3 数据架构参考模型中各模型的作用
3.1 数据元素模型
数据元素是企业的本质,被用作概念数据模型中实体属性的语义基础,支撑业务需要的数据库模型中表里面的列,并在数据库管理系统中实现,相应地被用在业务信息系统(视图数据模型)中,实现了企业资源所需的数据库对象,支撑了企业任务的完成。
3.2 概念数据库模型
概念数据模型,由主题,实体,属性和实体间的关系构成。关系可以体现实体间多个主题的相互联系。每个数据模型应该只对应一个概念,如人的名字或地址等。概念数据模型可在创建数据库模型(逻辑数據模型或物理数据模型)时当作模板。每一个实体属性都应该映射到其父数据元素。语义和数据使用修饰语可被归属于每个实体属性。其中关键的组件是主题、实体、属性和关系。
概念数据模型可表示为一个容器,比如学生、学校、组织、或是地址。这些容器(例如学生或学校)必需先进行具体化描述,然后才能在一个或多个不同的数据库表中实现,并最终成为可被Oracle等数据库管理系统操作的对象。
3.3 逻辑数据库模型
逻辑数据模型,是独立于数据库管理系统的数据库的数据模型。组成该模型的数据结构组件包括:模式、表、列和表之间的关系。关系被限定于单一模式的表中。尽管每个实现数据库模型可以对应多个描述数据模型,但是每个实现数据库模型应该只对应一个问题。表的每一列都应该映射到一个父属性。语义和数据使用修饰语可被归属于每一列。描述数据模型和实现数据库模型之间存在多对多的关系。其中关键的组件是模式、表、列和关系。
3.4 物理数据库模型
作数据模型是绑定到特定数据库管理系统的数据库的数据模型。组成该模型的数据结构组件包括:数据库管理系统模式、数据库管理系统表、数据库管理系统列以及数据库管理系统表之间的关系。数据库管理系统关系被限定于单一的模式的数据库管理系统表中。每个操作数据库模型可以对应多个实现数据库模型。数据库管理系统每一列都应该映射到一个父列。实现数据库模型和操作数据库模型之间存在多对多的关系。其中关键组件是数据库管理系统模式、数据库管理系统表、数据库管理系统列和数据库管理系统关系。[6]
如果数据模型是依赖于一个特定数据库管理系统和一个特定软件应用程序性能的状态,该数据模型就被称作“物理的”,这样的数据模型是通过视图数据模型绑定到应用程序业务信息系统的操作数据库模型。操作数据库模型里面数据库管理系统表中的列是实现数据库模型里面单一表中单一列的部署。
3.5 视图数据模型
视图数据模型表示的是物理数据库模型和业务信息系统之间的接口。视图和视图的列可被定性为输入/输出。此外,这些视图能以列为基础相互映射,过程可以被指定来定义任意数据值转换。
视图数据模型是通过其定义绑定到特定数据库管理系统的。视图数据模型使应用程序系统可以根据其物理数据模型来选择、应用或更新数据库系统,而不用在应用程序系统中包含物理数据模型的细节信息。[7-8]
4 结论与展望
企业架构是一种战略性的信息资产。它描述了一个组织机构的业务、使命、管理流程和支撑性基础设施之间当前和期望的关系。而数据架构作为企业架构中的核心,使业务或使命进化到一种效率更高、更加有效、更为通用流行的状态。同时,提升了互操作性、加强了信息流通共享、升级改进业务流程、促进重大决策规划。
许多企业系统有着相同的体系结构方法,虽然在企业数据架构的实施过程中,一个组织可以有很多不同的流派和做法进行选择。这说明独立于特定应用领域的各种技术模式和设计,能够有效产生反应迅速、可伸缩的、灵活的和可统一的企业应用。企业的发展壮大离不开企业数据架构,而合理数据架构应用或许会成为未来信息社会企业生存的关键所在。
参考文献:
[1]于海澜.企业架构[M].北京:东方出版社,2009.
[2]徐立波.图书连锁企业数据仓库的模型设计[J].沈阳:沈阳工程学院学报,2011,8:23-24.
[3]林成亮.供电企业数据模型的分析与设计[D].北京:华北电力大学.
[4]张根宝.企业信息化[M].北京:机械工业出版社,1999.
[5]企业架构.www.wiscorp.com/sp/sp08.pdf.
[6]杨吉江,贺炜,邢春晓.构建电子政务通用数据模型[J].电子政务,2007,1.
[7]工程和管理信息系统规划. www.wiscorp.com/sp/sp11.pdf.
[8]Adamson,Christopher and Michael Venerable.Data Warehouse Desgn Solutions.John Wiley&Sons,1998.ISBN 0-471-25195-X.544 pages.endprint