⑴ 理解数据库中的第一第二第三范式有什么用谁能告诉我
比如你是班主任,要统计成绩了。有以下几项,考号,姓名,科目号,科目,成绩。如果没有理解第一范式,你就只能这么记录了:考号2010005001是张三,语文考了80分。但是理解了就不一样了,你就学会把这条信息抽象为5个属性了,可以用excel表格统计了!
你在录入成绩的过程中会发现,语文,数学之类的字粘贴了好多遍啊,能不能单独拿出来啊。当然可以。因为科目名只依赖于科目号,于是你可以把上述信息分成三个表:
考生表:考号(PK) + 姓名
科目表:科目号(PK) + 科目名
成绩表:考号(PK) + 科目号(PK) + 成绩
简单的说,第二范式消除了非主属性对主键的部分依赖。
第三范式的话,其实上面这么做就已经是第三范式了。为了便于理解,我们加一列 等级吧。比如60分以下C,60到80是B,80以上是A。
那么成绩表现在是这样:
成绩表:考号(PK) + 科目号(PK) + 成绩 + 等级
其实等级成绩有关,跟主键只有间接的决定关系,主键决定成绩,成绩决定等级,我们需要把它独立出来。
考生表:考号(PK) + 姓名
科目表:科目号(PK) + 科目名
成绩表:考号(PK) + 科目号(PK) + 成绩
等级表:等级(PK) + 成绩
简单的说,第三范式消除了非主属性对主键的传递依赖。
说了这么多,总结起来一句话:没啥鸟用。没上过学的,出来设计的表估计也是满足第三范式的。
⑵ 第二范式名词解释
第二范式(Second Normal Form,2nd NF)是指每个表必须有主关键字(Primary key),其他数据元素与主关键字一一对应。通常称这种关系为函数依赖(Functional dependence)关系,即表中其他数据元素都依赖于主关键字,或称该数据元素惟一地被主关键字所标识。第二范式是数据库规范化中所使用的一种正规形式。它的规则是要求数据表里的所有非主属性都要和该数据表的主键有完全依赖关系;如果有哪些非主属性只和主键的一部份有关的话,它就不符合第二范式。同时可以得出:如果一个数据表的主键只有单一一个字段的话,它就一定符合第二范式(前提是该数据表符合第一范式)
⑶ 数据库第二范式
第二范式(2NF)和第三范式(3NF)的概念很容易混淆,区分它们的关键点在于,2NF:非主键列是否完全依赖于主键,还是依赖于主键的一部分;3NF:非主键列是直接依赖于主键,还是直接依赖于非主键列。
第二范式(2NF):首先是 1NF,另外包含两部分内容,一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。考虑一个订单明细表OrderDetail其属性如下: (OrderID,ProctID,UnitPrice,Discount,Quantity,ProctName)。
因为我们知道在一个订单中可以订购多种产品,所以单单一个OrderID 是不足以成为主键的,主键应该是(OrderID,ProctID)。显而易见 Discount(折扣),Quantity(数量)完全依赖(取决)于主键(OderID,ProctID),而 UnitPrice,ProctName 只依赖于 ProctID。所以 OrderDetail 表不符合 2NF。不符合 2NF的设计容易产生冗余数据。
可以把OrderDetail表拆分为:
OrderDetail(OrderID,ProctID,Discount,Quantity)
Proct (ProctID,UnitPrice,ProctName)
来消除原订单表中UnitPrice,ProctName多次重复的情况。
第三范式(3NF):首先是 2NF,另外非主键列必须直接依赖于主键,不能存在传递依赖。即不能存在:非主键列 A 依赖于非主键列 B,非主键列 B 依赖于主键的情况。考虑一个订单表Order: (OrderID,OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity)主键是(OrderID)。
其中OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity
等非主键列都完全依赖于主键(OrderID),所以符合 2NF。
不过问题是CustomerName,CustomerAddr,CustomerCity 直接依赖的是
CustomerID(非主键列),而不是直接依赖于主键,它是通过传递才依赖于主键,所以不符合 3NF。
通过拆分Order为Order(OrderID,OrderDate,CustomerID)和Customer(CustomerID,CustomerName,CustomerAddr,CustomerCity)从而达到 3NF。
⑷ 数据库三大范式通俗理解是什么
1、第一范式(1NF):
所谓第一范式(1NF)是指在关系模型中,对于添加的一个规范要求,所有的域都应该是原子性的,即数据库表的每一列都是不可分割的原子数据项,而不能是集合,数组,记录等非原子数据项。
即实体中的某个属性有多个值时,必须拆分为不同的属性。在符合第一范式(1NF)表中的每个域值只能是实体的一个属性或一个属性的一部分。简而言之,第一范式就是无重复的域。
2、第二范式(2NF)
在1NF的基础上,非码属性必须完全依赖于候选码(在1NF基础上消除非主属性对主码的部分函数依赖)
第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实例或记录必须可以被唯一地区分。选取一个能区分每个实体的属性或属性组,作为实体的唯一标识。
3、第三范式(3NF)
在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)第三范式(3NF)是第二范式(2NF)的一个子集,即满足第三范式(3NF)必须满足第二范式(2NF)。简而言之,第三范式(3NF)要求一个关系中不包含已在其它关系已包含的非主关键字信息。
关系模型结构
1、单一的数据结构——关系(表文件)。关系数据库的表采用二维表格来存储数据,是一种按行与列排列的具有相关信息的逻辑组,它类似于Excel工作表。一个数据库可以包含任意多个数据表。在用户看来,一个关系模型的逻辑结构是一张二维表,由行和列组成。这个二维表就叫关系,通俗地说,一个关系对应一张表。
2、元组(记录)。表中的一行即为一个元组,或称为一条记录。
3、属性(字段)。数据表中的每一列称为一个字段,表是由其包含的各种字段定义的,每个字段描述了它所含有的数据的意义,数据表的设计实际上就是对字段的设计。创建数据表时,为每个字段分配一个数据类型,定义它们的数据长度和其他属性。字段可以包含各种字符、数字、甚至图形。
以上内容参考网络——数据库范式、网络——关系数据库
⑸ 举例说明一下怎么算是第一范式、第二范式、第三范式
1.第一范式:存在非主属性对码的部分依赖关系 R(A,B,C) AB是码 C是非主属性 B-->C B决定C C部分依赖于B。如果关系R 中所有属性的值域都是单纯域,那么关系模式R是第一范式的。
那么符合第一模式的特点就有:有主关键字、主键不能为空、主键不能重复,、字段不可以再分。例如:
StudyNo | Name | Sex | Contact
20040901 john Male Email:[email protected],phone:222456
20040901 mary famale email:[email protected] phone:123455
以上的表就不符合,第一范式:主键重复(实际中数据库不允许重复的),而且Contact字段可以再分
所以变更为正确的是:
StudyNo | Name | Sex | Email | Phone
20040901 john [email protected] 222456
20040902 mary [email protected] 123455
2.第二范式:存在非主属性对码的传递性依赖 R(A,B,C) A是码 A -->B ,B-->C。如果关系模式R是第一范式的,而且关系中每一个非主属性不部分依赖于主键,称R是第二范式的。所以第二范式的主要任务就是:满足第一范式的前提下,消除部分函数依赖。
StudyNo | Name | Sex | Email | Phone | ClassNo | ClassAddress
01 john [email protected] 222456 200401 A楼2
01 mary [email protected] 123455 200402 A楼3
这个表完全满足于第一范式,主键由StudyNo和ClassNo组成,这样才能定位到指定行。但是,ClassAddress部分依赖于关键字(ClassNo-〉ClassAddress,所以要变为两个表:
表一
StudyNo | Name | Sex | Email | Phone | ClassNo
01 john [email protected] 222456 200401
01 mary [email protected] 123455 200402
表二
ClassNo | ClassAddress
200401 A楼2
200402 A楼3
3.第三范式
不存在非主属性对码的传递性依赖以及部分性依赖 ,
StudyNo | Name | Sex | Email | bounsLevel | bouns
20040901 john [email protected] 优秀 $1000
20040902 mary [email protected] 良 $600
这个完全满足了第二范式,但是bounsLevel和bouns存在传递依赖,更改为:
StudyNo | Name | Sex | Email | bouunsNo
20040901 john [email protected] 1
20040902 mary [email protected] 2
bounsNo | bounsLevel | bouns
1 优秀 $1000
2 良 $600
这里可以用bounsNo作为主键,基于两个原因
(1)不要用字符作为主键。可能有人说:如果我的等级一开始就用数值就代替呢?
(2)但是如果等级名称更改了,不叫 1,2 ,3或优、良,这样就可以方便更改,所以一般优先使用与业务无关的字段作为关键字。
一般满足前三个范式就可以避免数据冗余。
(5)对数据库第二范式理解扩展阅读:
设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。
目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。
设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。
目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。满足最低要求的范式是第一范式(1NF)。在第一范式的基础上进一步满足更多规范要求的称为第二范式(2NF),其余范式以次类推。一般说来,数据库只需满足第三范式(3NF)就行了。
参考链接:
网络-数据库范式