梅红
摘要:在数据库设计的过程中规范化理论是最为重要的部分,直接影响关系模式的设计与数据库设计的成功与否。基于此,为了保证研究效率,要重视结合数据库设计实际,有效的分析规范化理论,保障数据库设计符合系统应用需求,深入研究规范化理论在数据设计中的应用,以及规范化理论的重要作用是非常必要的。
关键词:规范化理论;数据库设计;重要作用
中图分类号:TP311.13 文献标识码:A 文章编号:1007-9416(2019)10-0217-02
0 引言
进行数据库设计需要从多个方面入手,包括需求分析、逻辑设计、概念设计等等。在进行概念设计的过程中,设计者要从多个角度入手,对实体以及相关属性进行抽取,这样才能够审计出不同的E-R图,再将E-R图进行数据表转换。在这个过程中,规范化理论的作用就凸显出来,规范化理论是未然范式建立的,是研究不合理的关系模式转化为合理的关系模式的理论,同时也与数据库设计紧密相关。下面通过实践,有效的对其进行深入探索。
1 关系数据库规范化
为了保障每个环节设计的顺利进行,需要对不同关系进行研究与定义,关系数据库规范化理论对“设计不合理的关系模式”向“合理的关系模式”转化进行研究,其具体的思路,以合理分解关系为基础,有效的消除相关数据依赖,从而解决数据冗余,从实际分析,其中的每一个关系都是在一定的制约条件下存在的,这种存在方式被称之为范式。较低范式关系可以通过转换,成为多个较高级的范式关系的集合,这种转换是通过无损分解实现的,这个转换的过程就是关系规范化。
2 关系模式规范化的重要性
关系模式是研究的重点,也是数据库设计过程重要研究内容。在应用的过程中,如果遇到关系规范化的问题,应该结合实际案例,开展实践设计,以提高数据库设计效率。如:有一个企业员工管理数据库,其中包括使用者(老板、员工等)的工作号、姓名、性别、工作科室、工作范围、考核成绩等,根据这些信息,要设计有效的系统关系模式,并结合关系模式,确定使用者的相关信息(工作号、姓名、性别、工作科室、工作范围、考核成绩)。在构建关系模式过程中,要进行有效分析,针对如下问题进行解决:
2.1 数据冗余度大
数据冗余是指数据之间的重复,也可以说是同一数据存储在不同数据文件中的现象。数据应该尽可能少地冗余,这意味着重复数据应该减少到最少。比如说,一个科室的工作人员的“工作范围”不应该被存储在不同的表中, 因为这里的“工作范围”是科室人员的一个属性。如果存在过多的冗余数据,这就意味着要占用了更多的物理空间,同时也对数据的维护和一致性检查带来了问题,当这个员工的“工作范围”变化时,冗余数据会导致对多个表的更新动作,如果有一个表不幸被忽略了,那么就可能导致数据的不一致性。
2.2 插入异常
数据插入异常是指应该插入数据的未被插入,这里的“未”并非指系统或代码异常,而是说数据库设计上有问题,某条记录在符合了所在领域的要求后仍无法存入,说明表中存在了非当前领域的属性。例如,“科室工作人员”表不应该存在“科室主任”这个属性,因为这会导致一个问题:如果这个科室新进入的工作人员没有科室主任的关联信息,就无法通过信息插入模式写入数据库。
2.3 删除异常
指的是当你需要删除的时候,数据不能被删除而导致的删除错误;或者是删除数据后导致数据库的某些关联错误。例如,如果一个科室的全部工作者都转去其他科室,同时,这个科室没有新的工作人员转入,那么可以采取删除模式。但是删除后,科室类型还在,数据库中却找不到相关科室信息。从实际分析,科室工作人员关系就不能与合理的数据库模式继续关联。为了构建合理的模式,必然要避免类似问题产生,以进一步提高工作效率。
3 规范化理论在数据库设计中的应用分析
规范化理论的进一步应用,有利于完善数据库设计,能够保证数据库设计效率和数据库的独立性和完善性,基于此,对于设计者来说,要注重结合需求实际,加强对于数据库规范化设计的认识。
3.1 第一范式(1NF)
如果一个关系模式中R的所有属性都是原子的,那么,从实际分析,该模式中的元素不可再分,这个关系模式被称为1NF关系模式。在这个关系模式中,不存在可分数据行,这样满足第一范式的要求,实体之间为一对一关系,否则实体在同一列中有多个值,1NF规范性不足,限制太少,信息过于复杂。
3.2 第二范式(2NF)
如果关系模式R(U,F)属于1NF,并且R中的每个非主属性都完全依赖于关系码,因此,R(U,F)属于2NF。
将1NF进行有效的转化,使其转化成2NF,其转化阶段就是利用投影分解法进行的。结合分解分析,两者之间的关系从属于2NF,若进一步分析,会得到以下问题,需要加强设计认识。
(1)数据冗余度过大,科室主任信息会出现重复储存的现象。(2)修改麻烦,如果一个科室换了主任,那么进行修改,就需要针对相应的工作者所对应的科室主任名字,如果忽视了其中一个修改,就会造成数据的不同。(3)插入异常,如果从新开设了一个新的科室,那么在没有招入新工作人员的情况下,不能插入相对应的信息。(4)删除异常,如果想要删除其中一名工作者的记录,比如李明,那么整个元组就都会消失,连同一个科室的信息都会被删除,这样就会出现大量信息丢失的情况。
3.3 第三范式(3NF)
若R(U,F)都从属于2NF,则需要依靠关系进行分析,要严格按关系进行设计。否则R(U,F)属于3NF。通过进一步分析,总结出的分解方式是:传递函数需要进行单独提取,可以分成基本信息与科室信息两部分,以两个关系模式进行体现,具体如下:
工作者基本信息(工作号、性别、科室);
科室信息(科室类型、科室主任);
这个时候,两个模式都属于3NF,也就是可以避免出现如上问题。再次对第一次分解后的工作者绩效成绩关系模式进行统计与研究,这样一来,满足了3NF,但实际过程,还存在一定不足:数据冗余量依旧很大,修改依旧比较麻烦,另外,其中还是存在插入异常以及删除异常的问题。
4 关系数据库规范化的原则研究
关系数据库规范化有两个重要原则:(1)无损连接。(2)保持函数依赖。无损连接过程以信息的安全为主,在此过程不能丢失信息,通过分解后,仍然可以回复到原来的关系,其作用是保证分解数据的价值。保持函数依赖原则是对关系进行分解后的要求,不能破坏数据信息,要保证必要的函数依赖,这样的分解模式是等價的。通过规范化管理,实现了无损连接,利于数据库运行,能够保证其运行效率与准确性。
5 结语
数据库构建过程中规范化设计具有明显的优势,但是,从本文所提出实际情况分析,若为了不断提高设计效率,要重视以规范化的模式研究,积极制定更加高效的数据库设计方案,并有效的进行实践运用,从而才能保证数据库运行质量,总之,本文的研究,旨在为相关设计者提供支持,希望能够更好的促进数据库建设完善。
参考文献
[1] 黄雅琼.数据库逻辑设计中的规范化[J].信息记录材料,2018,19(03):247-248.
[2] 杨靖祎.规范和设计技巧在数据库设计中的研究[J].中国卫生产业,2017,14(29):70-71.