
数据库范式1NF 2NF 3NF BCNF.doc
7页数据库范式 1NF 2NF 3NF BCNF范式是符合某一种级别的关系模式的集合构造数据库必须遵循一定的规则在关系数据库中,这种规则就是范式关系数据库中的关系必须满足一定的要求,即满足不同的范式目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式( 3NF)、第四范式(4NF)、第五范式(5NF)和第六范式(6NF)满足最低要求的范式是第一范式(1NF)在第一范式的基础上进一步满足更多要求的称为第二范式(2NF),其余范式以次类推一般说来,数据库只需满足第三范式(3NF)就行了1 第一范式(1NF)在任何一个关系数据库中,第一范式(1NF)是对关系模式的基本要求,不满足第一范式(1NF)的数据库就不是关系数据库所谓第一范式(1NF)是指数据库表的每一列都是不可分割的基本数据项,同一列中不能有多个值,即实体中的某个属性不能有多个值或者不能有重复的属性如果出现重复的属性,就可能需要定义一个新的实体,新的实体由重复的属性构成,新实体与原实体之间为一对多关系在第一范式(1NF)中表的每一行只包含一个实例的信息2 第二范式(2NF)第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。
第二范式(2NF)要求数据库表中的每个实例或行必须可以被惟一地区分为实现区分通常需要为表加上一个列,以存储各个实例的惟一标识这个惟一属性列被称为主关键字或主键、主码第二范式(2NF)要求实体的属性完全依赖于主关键字所谓完全依赖是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系为实现区分通常需要为表加上一个列,以存储各个实例的惟一标识简而言之,第二范式就是非主属性非部分依赖于主关键字3 第三范式(3NF)满足第三范式(3NF)必须先满足第二范式(2NF)简而言之,第三范式(3NF)要求一个数据库表中不包含已在其它表中已包含的非主关键字信息第三范式就是属性不依赖于其它非主属性数据库设计三大范式应用实例剖析 数据库的设计范式是数据库设计所需要满足的规范,满足这些规范的数据库是简洁的、结构明晰的,同时,不会发生插入(insert)、删除(delete)和更新(update)操作异常反之则是数据混乱,不仅给数据库的编程人员制造麻烦,而且面目可憎,可能存储了大量不需要的冗余信息范式说明第一范式(1NF):数据库表中的字段都是单一属性的,不可再分。
这个单一属性由基本类型构成,包括整型、实数、字符型、逻辑型、日期型等例如,如下的数据库表是符合第一范式的: 字段 1 字段 2 字段 3 字段 4 而这样的数据库表是不符合第一范式的:字段 1 字段 2 字段 3 字段 4 字段 3.1 字段 3.2 很显然,在当前的任何关系数据库管理系统(DBMS)中,都符合第一范式的数据库,因为这些 DBMS 不允许你把数据库表的一列再分成二列或多列因此,你想在现有的 DBMS 中设计出不符合第一范式的数据库都是不可能的第二范式(2NF):数据库表中不存在非关键字段对任一候选关键字段的部分函数依赖(部分函数依赖指的是存在组合关键字中的某些字段决定非关键字段的情况),也即所有非关键字段都完全依赖于任意一组候选关键字假定选课关系表为 SelectCourse(学号, 姓名, 年龄, 课程名称, 成绩, 学分),关键字为组合关键字(学号, 课程名称),因为存在如下决定关系:(学号, 课程名称) → (姓名, 年龄, 成绩, 学分) 这个数据库表不满足第二范式,因为存在如下决定关系:(课程名称) → (学分 )(学号) → (姓名, 年龄)即存在组合关键字中的字段决定非关键字的情况。
由于不符合 2NF,这个选课关系表会存在如下问题:(1) 数据冗余:同一门课程由 n 个学生选修,"学分"就重复 n-1 次;同一个学生选修了 m 门课程,姓名和年龄就重复了 m-1 次2) 更新异常:若调整了某门课程的学分,数据表中所有行的"学分" 值都要更新,否则会出现同一门课程学分不同的情况3) 插入异常:假设要开设一门新的课程,暂时还没有人选修这样,由于还没有"学号"关键字,课程名称和学分也无法记录入数据库4) 删除异常:假设一批学生已经完成课程的选修,这些选修记录就应该从数据库表中删除但是,与此同时,课程名称和学分信息也被删除了很显然,这也会导致插入异常 把选课关系表 SelectCourse 改为如下三个表: 学生:Student(学号, 姓名, 年龄);课程:Course(课程名称 , 学分);选课关系:SelectCourse( 学号, 课程名称, 成绩)这样的数据库表是符合第二范式的, 消除了数据冗余、更新异常、插入异常和删除异常另外,所有单关键字的数据库表都符合第二范式,因为不可能存在组合关键字第三范式(3NF):在第二范式的基础上,数据表中如果不存在非关键字段对任一候选关键字段的传递函数依赖则符合第三范式。
所谓传递函数依赖,指的是如果存在"A → B → C"的决定关系,则 C 传递函数依赖于 A因此,满足第三范式的数据库表应该不存在如下依赖关系:关键字段 → 非关键字段 x → 非关键字段 y 假定学生关系表为 Student(学号, 姓名, 年龄, 所在学院, 学院地点, 学院),关键字为单一关键字" 学号" ,因为存在如下决定关系: (学号) → (姓名, 年龄, 所在学院, 学院地点, 学院) 这个数据库是符合 2NF 的,但是不符合 3NF,因为存在如下决定关系: (学号) → (所在学院 ) → (学院地点, 学院) 即存在非关键字段"学院地点" 、"学院"对关键字段" 学号 "的传递函数依赖 它也会存在数据冗余、更新异常、插入异常和删除异常的情况把学生关系表分为如下两个表:学生:(学号, 姓名, 年龄, 所在学院); 学院:(学院, 地点, )这样的数据库表是符合第三范式的,消除了数据冗余、更新异常、插入异常和删除异常。












