1.数据库范式
第一范式:数据库表中的字段都是不可以拆分的。单一属性的列都是又基本数据类型构成。
第二范式:不存在数据库表中的非主键列对主键列的部分函数依赖(简言之就是不存在部分函数依赖)
第三范式:在第二范式的基础上,不存在数据库表中的非主属性列对于主键的传递函数依赖(简言之就是不存在传递函数依赖)
如下图中就存在不符合第二范式的设计,该表的主键是学号的课程名称,但是学分却只对课程名称依赖。这就是非主属性列对于主键列的部分函数依赖。
数据库表示例
2.MySQL中范式化的数据库设计
反范式化的优点:可以减少表的关联,可以进行更好的索引优化
反范式化的缺点:存在数据冗余以及数据维护异常,对数据的修改需要更多的成本(因为需要修改更多地方)
过分的范式化会导致表中建立太多的列。由于MySQL插件式架构的原因,MySQL服务器和存储引擎是分离的。MySQL的API在工作时需要在服务器和存储引擎之间通过缓冲格式来拷贝数据,然后服务器层把缓冲的数据解析成一个一个的列,这个操作的成本特别高。特别是Innodb这个行结构在进行解析时需要进行转换,这个转换的成本就依赖于列的数量。所以一个表中如果有太多的列的话就会带来过多的额外CPU的消耗。
过分的范式画设计会导致MySQL中过多的表的关联,在MySQL中表的关联成本是比价高的,性能也会下降。
3.外键约束
还有就是使用外键约束会保证完整性会降低性能(因为每一次修改都会检查),但是建立关于键的索引还是有必要的。
4.如何为Innodb存储引擎选取主键
主键应该尽可能的小(因为其他非主键的索引在每次查询时都会带上主键)
主键应该是顺序增长的(主键如果是顺序增长的话会降低MySQL排序的I/O消耗)
Innodb主键和业务主键可以不一样
5.正确的选取字段类型
整形类型选取
正确的选取实数内型
6.如何选取CHAR和VARCHAR类型
varchar存储的特点
用于存储变长字符串,只占用必要的存储空间。列的长度小于255时则只占用一个额外字节作为记录字符串的长度。大于255时则占用两个字节用于记录长度。
varchar长度选择问题:使用追小的符合需求的长度。在MySQL中varchar(5)和varchar(200)性能是不一样的。(因为虽然是可变长度的,但是SQL为了查询优化,在内存使用固定的长度,也就是说varchar定义的越小性能越好)
varchar的使用场景
字符串最大长度比平均长度大很多
字符串列很少被更新(varchar类型由于字符串的长度是可变的,所以修改时可能会引起存储页的分裂,造成很多存储碎片)
使用了多字符集存储字符串
char类型的存储特点
char类型的字符串时定长的
字符串存储在char类型的列中会删除掉末尾的空格
最大宽度为255
char类型的使用场景
存储长度近似的值
存储短字符串
存储经常更新的字符串列
7.时间类型的选择
DATATIME类型的特点
TIMESTAMP类型的特点-1
TIMESTAMP类型的特点-2
date和time类型
time的格式
使用须知