缘奇科普-奇怪的知识又增加了

资料库範式_百科

原创版权 老爸评测作者: 字体大小选择: [ ]

资料库範式

资料库範式

设计关係资料库时,遵从不同的规範要求,设计出合理的关係型资料库,这些不同的规範要求被称为不同的範式,各种範式呈递次规範,越高的範式资料库冗余越小。

目前关係资料库有六种範式:第一範式(1NF)、第二範式(2NF)、第三範式(3NF)、巴斯-科德範式(BCNF)、第四範式(4NF)和第五範式(5NF,又称完美範式)。

基本介绍

  • 中文名:资料库标準化
  • 外文名:Database Normalization
  • 定义:减少资料库中数据冗余的过程
  • 种类:六种

範式简介

範式来自英文Normal form,简称NF。要想设计—个好的关係,必须使关係满足一定的约束条件,此约束已经形成了规範,分成几个等级,一级比一级要求得严格。满足这些规範的资料库是简洁的、结构明晰的,同时,不会发生插入(insert)、删除(delete)和更新(update)操作异常。反之则是乱七八糟,不仅给资料库的编程人员製造麻烦,而且面目可憎,可能存储了大量不需要的冗余信息。
目前关係资料库有六种範式:第一範式(1NF)、第二範式(2NF)、第三範式(3NF)、巴斯-科德範式(BCNF)、第四範式(4NF)和第五範式(5NF,又称完美範式)。满足最低要求的範式是第一範式(1NF)。在第一範式的基础上进一步满足更多规範要求的称为第二範式(2NF),其余範式以次类推。一般来说,资料库只需满足第三範式(3NF)就行了。

各类範式

1、第一範式(1NF):
所谓第一範式(1NF)是指在关係模型中,对于添加的一个规範要求,所有的域都应该是原子性的,即资料库表的每一列都是不可分割的原子数据项,而不能是集合,数组,记录等非原子数据项。即实体中的某个属性有多个值时,必须拆分为不同的属性。在符合第一範式(1NF)表中的每个域值只能是实体的一个属性或一个属性的一部分。简而言之,第一範式就是无重複的域。
说明:在任何一个关係资料库中,第一範式(1NF)是对关係模式的设计基本要求,一般设计中都必须满足第一範式(1NF)。不过有些关係模型中突破了1NF的限制,这种称为非1NF的关係模型。换句话说,是否必须满足1NF的最低要求,主要依赖于所使用的关係模型。
2、第二範式(2NF)
在1NF的基础上,非码属性必须完全依赖于候选码(在1NF基础上消除非主属性对主码的部分函式依赖)
第二範式(2NF)是在第一範式(1NF)的基础上建立起来的,即满足第二範式(2NF)必须先满足第一範式(1NF)。第二範式(2NF)要求资料库表中的每个实例或记录必须可以被唯一地区分。选取一个能区分每个实体的属性或属性组,作为实体的唯一标识。例如在员工表中的身份证号码即可实现每个一员工的区分,该身份证号码即为候选键,任何一个候选键都可以被选作主键。在找不到候选键时,可额外增加属性以实现区分,如果在员工关係中,没有对其身份证号进行存储,而姓名可能会在资料库运行的某个时间重複,无法区分出实体时,设计辟如ID等不重複的编号以实现区分,被添加的编号或ID选作主键。(该主键的添加是在ER设计时添加,不是建库时随意添加)
第二範式(2NF)要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性,如果存在,那幺这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关係。为实现区分通常需要为表加上一个列,以存储各个实例的唯一标识。简而言之,第二範式就是在第一範式的基础上属性完全依赖于主键。
3、第三範式(3NF)
在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)
第三範式(3NF)是第二範式(2NF)的一个子集,即满足第三範式(3NF)必须满足第二範式(2NF)。简而言之,第三範式(3NF)要求一个关係中不包含已在其它关係已包含的非主关键字信息。例如,存在一个部门信息表,其中每个部门有部门编号(dept_id)、部门名称、部门简介等信息。那幺在员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。如果不存在部门信息表,则根据第三範式(3NF)也应该构建它,否则就会有大量的数据冗余。简而言之,第三範式就是属性不依赖于其它非主属性,也就是在满足2NF的基础上,任何非主属性不得传递依赖于主属性。
资料库範式资料库範式
4、巴斯-科德範式(BCNF)
Boyce-Codd Normal Form(巴斯-科德範式)
在3NF基础上,任何非主属性不能对主键子集依赖(在3NF基础上消除对主码子集的依赖)
巴斯-科德範式(BCNF)是第三範式(3NF)的一个子集,即满足巴斯-科德範式(BCNF)必须满足第三範式(3NF)。通常情况下,巴斯-科德範式被认为没有新的设计规範加入,只是对第二範式与第三範式中设计规範要求更强,因而被认为是修正第三範式,也就是说,它事实上是对第三範式的修正,使资料库冗余度更小。这也是BCNF不被称为第四範式的原因。某些书上,根据範式要求的递增性将其称之为第四範式是不规範,也是更让人不容易理解的地方。而真正的第四範式,则是在设计规範中添加了对多值及依赖的要求。

目的原则

规範化目的是使结构更合理,消除存储异常,使数据冗余儘量小。便于插入、删除和更新。
遵从概念单一化“一事一地”原则,即一个关係模式描述一个实体或实体间的一种联繫。规範的实质就是概念的单一化。
一个关係模式接着分解可以得到不同关係模式集合,也就是说分解方法不是惟一的。最小冗余的要求必须以分解后的资料库能够表达原来资料库所有信息为前提来实现。其根本目标是节省存储空问,避免数据不一致性,提高对关係的操作效率,同时满足套用需求。实际上,并不一定要求全部模式都达到BCNF不可。有时故意保留部分冗余可能更方便数据查询。尤其对于那些更新频度不高,查询频度极高的资料库系统更是如此。

反範式

规範化的优点是明显的,它避免了大量的数据冗余,节省了存储空间,保持了数据的一致性。当一个库里的数据经常发生变化时,达到3NF的库可以使用户不必在超过两个以上的地方更改同一个值。那幺是不是只要把所有的表都规範为3NF后,资料库的设计就是最优的呢?这可不一定。範式越高意味着表的划分更细,一个资料库中需要的表也就越多,用户不得不将原本相关联的数据分摊到多个表中。当用户同时需要这些数据时只能採用连线表的形式将数据重新合併在一起。同时把多个表联接在一起的花费是巨大的,尤其是当需要连线的两张或者多张表数据非常庞大的时候,表连线操作几乎是一个噩梦,这严重地降低了系统运行性能。

发表评论 (已有 条评论)

  

评论列表

    快来评论,快来抢沙发吧~