数据库范式
一.什么是范式?
1.范式是一种离散数学的知识,是为了解决数据存储和优化的问题,保存数据的存储之后,凡是能通过关系寻找出来的数据,坚决不再重复存储:终极目标是减少数据的冗余(以最少的数据完成最大的存储)
2.范式是一种分层结构的规范
分为6层,1NF,2NF..6NF(6NF最高层,最严格)
每一层都比上一层更加严格,若要满足下一层范式,前提是要满足上一层范式.
二.为什么范式等级不是越高越好?
范式只是为了解决空间问题,而数据库不单是要解决空间问题,还要解决效率问题,所以数据库的设计不能完全按照范式要求实现,一般情况下只有前三种范式要满足
三.前三种范式
(1).第一范式(1NF)
第一范式:第一范式要求数据具有原子性
如上表中的代课时间,当需要取代课的开始时间,需要将字段拆分,不满足第一范式。解决方案是单独两个字段存储开始时间和结束时间
(2).第二范式(2NF)
第二范式:表中不允许出现部分依赖
出现部分依赖的原因是因为出现了复合主键,如下表中的讲师和班级才能组合成一个主键,但性别只依赖于讲师,教室只依赖于班级,出现了部分依赖
解决方案是使用逻辑主键(增加一个id做主键)
(3)第三范式(3NF)
第三范式:不允许出现传递依赖
下表中性别依赖讲师,讲师依赖主键。教室依赖班级,班级依赖主键。所以,教室和性别都存在传递依赖
解决方案:将存在依赖的字段取出,形成一个单独的表
注意:
永远不要将逻辑主键看作是真正的主键,比如讲师表中,真正的主键是讲师,如果把id当成真正的主键,永远会有依赖传递
而上面存在依赖传递的表中,真正的主键是(讲师+班级),所以才会存在性别依赖讲师,讲师依赖主键(id=讲师+班级)这种传递依赖
四.逆规范化
规范化程度较高的时候,我们可能需要做很多的关联查询,这样势必会导致效率的降低。所以有时设计表时,直接存储想要的信息,而不去存储id进行关联查询。这是一种磁盘利用率于效率的对抗