倪彬彬
摘要:数据建模是指对现实世界中各类信息的抽象组织,确定数据库所要管理的数据范围、数据的组织形式等,直至转化成现实的数据库[1]。数据模型是构建应用系统的核心。该文从数据建模的概念、意义、方法和评价等方面进行解析,阐述了如何成功构建高质量的数据模型。
关键词:数据模型;构建;数据库应用
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)30-0003-02
Abstract: Data modeling refers to the abstract organization of all kinds of information in the real world, it determines the data scope managed by the database and the organization form of the data and so on,until it is transformed into a real database[1]. Data model is the core of building application system. In this paper, the concept, significance, methods and evaluation of data modeling are analyzed, and how to successfully build a high-quality data model is expounded.
Key words: data model; construction; database application
数据建模是构建应用系统的核心,是尽可能精准地表示业务运转的概念性框架。数据模型定义了操作者、行为以及管理业务处理流程的规则,并将定义内容用人们和应用程序都能理解的标准语法进行描述。本质上,数据模型将业务中涉及的概念转换为计算机代码,以至于应用程序和计算机系统都能按设计者的意图处理各类信息。如果没有数据模型,就不可能实现信息的自动化处理。数据模型在应用系统开发过程中起着关键作用,能决定应用系统开发及使用效率,并担当着企业用户和信息技术专家之间的桥梁作用,有助于双方就业务运转达成共识。
1 数据建模的目的
数据模型是一组由符号、文本组成的集合,描述现实世界中的实体及其属性、实体间的联系,对复杂信息景观进行简化并准确表达,达到有效交流、沟通的目的。数据模型具有多种表现形式,最常见的并能得到广泛理解的形式为电子表格。本文所及数据模型这一术语是基于类型,包含相互作用和可扩展性。
数据建模是建立数据模型的过程,是为了明确某一组织结构及其操作,而使用一组技术和实施一些活动,提出一个信息解决方案,从而实现该组织的某些目标。在建模过程中,需分析数据和数据之间的关系,对所要模型化的内容具有清晰的认识。数据建模者要和各方涉众进行交流、沟通,以便构建的数据模型具有较高的精确性,在所有用户中达成共识。
2 数据模型的类型和创建
可以通过设置数据模型的格式来调整模型的细节水平,让模型呈现出宽泛、高层次的概念视图或能反映出更多细节的逻辑或物理视图,对应着三个不同层次的模型:概念、逻辑和物理。概念模型描述了业务需求,逻辑模型表示详细的业务解决方案,物理模型则表示详细的技术解决方案。对于不同细节层次的模型,可以有不同的建模模式——关系和维度。关系数据建模是通过准确的业务规则来描述业务如何运作的过程,维度数据建模则通过准确的导航来描述业务如何被监控的过程[2]。
2.1 概念模型的创建方法
概念数据模型展示了在特定领域下的关键概念及概念间的相互作用。创建概念模型的5步法如图1所示。
2.2 逻辑模型的创建方法
逻辑数据模型是为了解决特定业务需求而形成的业务解决方案。逻辑模型以业务需求为基础,忽略与软硬件环境等具体问题有关的模型实现的复杂性。
关系逻辑数据模型描述的是业务运转过程,构建关系逻辑数据模型的两种常用技术是规范化和抽象。被认可的完整规范化规则有:第一范式、第二范式、第三范式、Boyce/Codd范式、第四范式、第五范式,每个级别的标准化都包括该级别之前低级别的规则。通常情况下所说的规范化指的是第三范式。抽象是指通过重定义和将一些实体、属性、关系在模型范围内结合成更通用的条目,为数据模型注入灵活性。规范化是作用于关系逻辑模型上的强制性技术,而抽象是一项可选技术。
维度逻辑数据模型描述的是如何对业务实施监测,涉及如量度计、维度等一些特有的、重要的概念。量度计可被进一步划分聚集、量子、累积和快照4种类型,维度有固定维度、退化维度、多值维度、不齐整维度、收缩维度和渐变维度6种类型。
2.3 物理模型的创建方法
物理数据模型使用由逻辑数据模型定义的业务解决方案,构建下一层次的技术解决方案,是根据具体的软硬件环境对模型进行必要调整的折中方案。在高效的技术解决方案的创建过程中,采用的相关技术有反规范化、视图、索引和分区等。
反规范化是选择性地违反规范化规则并在模型(数据库)中重新引入冗余的过程,以实现降低数据检索时间,并有助于创建一个用户友好的模型。视图是一种虚拟表,是由SQL查询定义的作用于真正存储数据的表(或其他视图)之上的窗口视图。索引是一个值,是指向表中该值实例的指针。分区指一个表被划分为两个或多个表,有垂直分区和水平分区之分。
3 数据模型质量评价
高质量的数据模型是构架健壮性应用系统的基础。在实际工作过程中可以有选择性地使用一些工具,比如模板、概念列表、家族树等,不但可以节约建模的时间,而且能提高数据模型结果的精确性。
数据模型构建完成后,有必要采用一个客观的评测方法来判断数据模型的优劣。数据模型计分卡是一种积极、有效的数据模型质量评价方法,适用所有类型的模型,通过一个外部的、客观的视角,采用简单直观地审查方法,对数据模型指出需要改进的地方,同时也肯定数据模型的可取之处,用以说明最佳的建模策略和方法。
4 结语
要成功构建高质量的数据模型,数据建模师需要查阅现有模型,给出建模方法,评估建模工具,还要担任好为客户提供服务的咨询顾问,通过期望设置、工作推进、实现预期加强与项目涉众的关系,向业务人员、技术人员解释数据建模的价值,接近项目涉众并与他们保持有效的交流沟通[3],与数据库管理团队建立高效的工作关系,最终成功建造一个与建造目的相一致的数据模型。
参考文献:
[1]百度百科. https://baike.baidu.com/item/数据建模/720111?fr=aladdin.
[2] Steve Hoberman. 数据建模(第二版)[M]. 丁永军,译.人民邮电出版社 2017.6.
[3]俞如富.数据建模的設计研究[J].信息与电脑,2016(5):30-31.
【通联编辑:王力】