MySQL 性能优化、优化设计及设计原则

转载

Hern宋兆恒 2021-08-07 09:28:26 博主文章分类：数据库SQL

数据库设计早期优化

1. 关系明确（理清表之间的关系，可以通过冗余的方式提高效率）
2. 节省空间（根据业务经验，设置字段长短）
3. 提高效率

数据库表开发流程

原型=>逐步完善（表的设计也是如此）

数据库种类

1. 层级数据库（注册表）如：Windows操作系统的核心就是一个注册表，由于配置项比较多，采用层级关系的数据存储
2. 关系型数据库如：MySQL
3. 时序数据库
4. 图数据库如：最短路径，地理信息
5. Key-value数据库如：Redis
6. 对象数据库
7. BigTable数据库

文件系统和数据库系统之间的区别

(1)文件系统用文件将数据长期保存在外存上，数据库系统用数据库统一存储数据;
(2)文件系统中的程序和数据有一定的联系，数据库系统中的程序和数据分离;
(3)文件系统用操作系统中的存取方法对数据进行管理，数据库系统用DBMS统一管理和控制数据;
(4)文件系统实现以文件为单位的数据共享，数据库系统实现以记录和字段为单位的数据共享。

MySQL 性能优化、优化设计及设计原则_字段

优化设计

第一步

想要在表设计中节省空间，就必须精通各种数据类型的特点（能用在什么业务上）、长度等。

int类型只增主键字段=>4字节=>每个字节8位=>32位，在CPU加载一条指令的时候，4字节是和CPU寄存器的运算有关，如：64位，由于直接的系统一般都是32位的，所以在运算4字节的数据是刚好的，效率最高，而现今我们系统基本都是64位的时候，其实没有更好的利用好CPU运算，所以在设计表字段建议，使用8字节的主键bigint，而不是直接使用int来做主键。

uuid做主键，字符类型做主键，在CPU的加载是需要消耗更多的运算过程

char(10) 不管该字段是否存储数据，都占10个字符的存储空间
char(10) 同时存在一个坑，就是存储abc数据后改数据库字段的值为“abc 7个空格 ”，在精准查询（where）就必须带上后面的7个空格

varchar 不存的时候不占空间，存多长数据就占多少空间

第二步

如何合理的设计出符合三范式数据库表?

1NF：列不可分。每一列都是不可分割的基本数据项，如这样的设计就不合理，姓名（王五，wangwu）

2NF：1NF的基础上面，非主属性完全依赖于主关键字，如学生姓名（非主属性）就是依赖于学号（主属性）的。

3NF：属性不依赖于其它非主属性 , 消除传递依赖，如这样的设计就不合理，学号做主键，学生课程表（学号=课程），当学号修改，对应的课程表也需要修改，这就是属于传递依赖

BCNF：符合3NF，每个表中只有一个候选键

4NF：没有多值依赖

由于学号不能做主键，那用什么做主键？首先就有这样的规则：不要用业务规则来做主键，主键就应该和业务无关。

如经常用的的order_no（业务订单号），即使是唯一的，也不建议做主键的，容易产生传递依赖的问题，这样就不符合第三范式了。

第三步

数据库优化策略

1、选择小的数据类型

2、单独设计主键，并考虑分布式扩展

3、外键设计（注意：学校实训的时候都是直接使用的弱外键来设置主外键关系，而实际项目中，如果要是删除了主键对应的记录后，外键表中的记录是没有删除的，这样对于数据库的数据是很容易混乱的，不便于维护，那我要是使用的是强外键的方式，这样直接删除主键记录，没有删除外键表中的记录，这样是要报错的，这样容易找到代码上的问题，外键的设计能对于数据完整性有一个好的约束，当你开发的系统已经完全不会出现数据不完整的问题的时候，你可以考虑使用弱外键来关联表操作，也同时会省去外键消耗，具体的设置外键方法查找：外键及其约束理解）
4、索引设计

5、关联关系表设计，多对一，多对多
6、读写频繁的信息，与不频繁的信息分开（如在设计支付系统的时候，会同时存在订单表和订单记录表，订单表读写频繁，而订单记录表就管理人员用，读写一般）
7、配置表，日志表，定时任务表等
8、汇总表设计（多表关联查询会很慢，还容易卡死的情况，可以考虑在业务上汇总，记录到汇总表）

第四步

经过业务的沉淀，积累出一些设计思路或抽取出多项目的共同点，减少开发成本

1、通用型设计，例：人员，部门，角色

2、特别设计，例：附件，日志，配置，监控等

3、存储设计，例：类型划分便于分区

4、一些附加字段，例：创建日期，修改日期，排序
5、流水表，例：类似于日志，但由业务处理结果组成，帐户变动或业务处理的中间值

设计原则

（一）降低对数据库功能的依赖（如在业务上使用了MySQL特性，且这个特性是只有MySQL存在的，对以后的数据库迁移会带来很大的麻烦）

（二）定义实体关系的原则

牵涉到的实体识别出关系所涉及的所有实体。

所有权考虑一个实体“拥有”另一个实体的情况。

基数考量一个实体的实例和另一个实体实例关联的数量。

（三）列意味着唯一的值，如果表示坐标（0,0），应该使用两列表示，而不是将“0,0”放在1个列中。

（四）列的顺序，可读性问题

（五）定义主键和外键，数据表必须定义主键和外键（如果有外键）。

（六）选择键

（七）是否允许NULL

任何值和NULL拼接后都为NULL。所有与NULL进行的数学操作都返回NULL。引入NULL后，逻辑不易处理。

（八）规范化——范式

1NF：包含分隔符类字符的字符串数据。名字尾端有数字的属性。没有定义键或键定义不好的表。
2NF：多个属性有同样的前缀。重复的数据组。汇总的数据，所引用的数据在一个完全不同的实体中。
BCNF： “每个键必须唯一标识实体，每个非键熟悉必须描述实体。”
4NF：三元关系（实体:实体:实体）。潜伏的多值属性。（如多个手机号。）临时数据或历史值。（需要将历史数据的主体提出，否则将存在大量冗余。）

（九）选择数据类型

（十）优化并行，设计DB时就应该考虑到对并行进行优化，比如，timestamp类型。

命名规则

表名规则

1、要用前缀，但不要用无意义的前缀

2、下划线分隔
3、全小写

列名规则

1、一般不用前缀（当和关键词冲突的可以考虑加前缀区别）

2、下划线分隔

3、全小写

注意：不管是表名设计还是列名设计，都不要使用拼音来命名，过一段时间就完全不记得了，就用英文，即使英语不好设计的时候也建议设置为英文。