数据库范式设计 和 反范式化设计
三大范式设计
一
数据库表中的所有字段都只具有单一属性
单一属性的列是由基本数据类型所构成的
设计出来的表都是简单的二维表
二
要求表中只具有一个业务主键,也就是说符合第二范式的表不能存在非主键列只对部分主键的依赖关系
三
每一个非主属性既不部分依赖于也不传递依赖于业务主键,也就是在第二范式基础上相处于非主键对主键的传递依赖
优点
可以尽量减少数据冗余
范式化的更新操作比反范式化更快
范式化的表通常比反范式的小
缺点
对于查询需要对多个表进行关联
更难进行索引优化
反范式化设计
反范式化是为了性能和读取效率的考虑而适当对数据库设计范式的要求进行违反
允许存在少量的冗余,用空间来换取时间
优点
减少表的关联
可以更好的进行索引优化
缺点
存在数据冗余及数据维护异常
对数据的修改需要更对成本
物理设计
命名规范
数据库、表、字段的命名要遵守可读性原则
使用大小写来格式化的库对象名字以获得良好的可读性
例如:使用custAddress而不是custaddress来提高可读性。
数据库、表、字段的命名要遵守表意性原则
对象的名字应该能够描述它所表示的对象
例如:
对于表,表的名称应该能够体现表中存储的数据内容;对于存储过程
存储过程应该能够体现存储过程的功能。
数据库、表、字段的命名要遵守长名原则
尽可能少使用或者不使用缩写
数据类型选择
当一个列可以选择多种数据类型时
优先考虑数字类型
其次是日期、时间类型
最后是字符类型
对于相同级别的数据类型,应该优先选择占用空间小的数据类型
浮点类型
注意float 和double 是非精度类型,如果是和金额相关尽量用decimal
日期类型
面试经常问道 timestamp 类型 与 datetime区别
datetime类型在5.6中字段长度是5个字节
datetime类型在5.5中字段长度是8个字节
timestamp 和时区有关,而datetime无关