一、案例概述
- 在实质际的生产环境中,对数据库的读和写都在同一个数据库服务器中,是不能满足实院需求的。
- 无论是在安全性、高可用性还是高并发等各个方面都是完全不能满足实际需求的。
- 因此,通过主从复制的方式来同步数据,再通过读写分离来提升数据库的并发负载能力。有点类似于rsync,但是不同的是rsync是对磁盘文件做备份,而mysql主从复制是对数据库中的数据、语句做备份。
二、Mysql 主从复制原理
Mysql 的主从复制和 MySQL 的读写分离两者联系紧密,先要部署主从复制,然后在此基础上进行数据的读写分离。
1、MySQL 支持的复制类型
- 基于语句的复制(STATEMENT)。在主服务器上执行的 SQL 语句,在从服务器上执行同样的语句。MySQL 默认采用基于语句的复制,效率比较高。
- 基于行的复制(ROW)。把改变的内容复制过去,而不是把命令在从服务器上执行一遍。
- 混合类型的复制(MIXED)。默认采用基于语句的复制,一旦发现基于语句无法精确复制时,就会采用基于行的复制。
2、MySQL主从复制的工作过程
3、MySQL支持的复制类型
(1)STATEMENT∶基于语句的复制。在服务器上执行SQL语句,在从服务器上执行同样的语句,mysgl默认采用基于语句的复制,执行效率高。
#虽然效率较高但是高并发情况下可能精确度不够
(2)ROW∶基于行的复制。把改变的内容复制过去,而不是把命令在从服务器上执行一遍
#虽然拥有很高的精确度,但是读写效率较低
(3)MIXED∶混合类型的复制。默认采用基于语句的复制,一旦发现基于语句无法精确复制时,就会采用基于行的复制
#结合前两种类型的优点,比较实用
4、主从复制的工作原理
(1)Master节点将数据的改变记录成二进制日志(Binary log),当Master上的数据发送改变时,则将其改变写入二进制日志中。
(2)Slave节点会在一定时间间隔内对Master的二进制日志进行探测其是否发生改变,如果发生改变,则开始一个I/O线程请求Master的二进制事件。
(3)同时Master节点为每个I/O线程启动一个dump线程,用于向其发送二进制事件,并保存至Slave节点本地的中继日志(Relay log)中,Slave节点将启动SQL线程从中继日志中读取二进制日志,在本地重放,即解析成sql语句逐一执行,使得其数据和Master节点的保持一致,最后I/O线程和SQL线程将进入睡眠状态,等待下一次被唤醒。
也就是说:
- 在每个事务更新数据完成之前,Master在二进制日志(Binary log)记录这些改变。写入二进制日志完成后,Master通知存储引擎提交事务。
- Slave将Master复制到其中继日志(Relay log) 。首先slave开始一个工作线程(I/O),I/0线程在Master上打开一个普通的连接,然后开始Binlog dump process。Binlog dump process 从Master的二进制日志中读取事件,如果已经跟上 Master ,它会睡眠并等待Master产生新的事件,I/O线程将这些事件写入中继日志(缓存中)。
- SQL slave thread (SQL从线程)处理该过程的最后一步,SQL线程从中继日志读取事件,并重放其中的事件而更新 Slave 数据,使其与Master 中的数据一致,只要该线程与I/O 线程保持一致,执行结束后I/O线程和SQL线程都会进行睡眠状态等待下一次操作的执行
注:
中继日志通常位于OS缓存中,所以中继日志的开销很小。
复制过程有一个很重要的限制,即复制在Slave上是串行化的,也就是说Master上的并行更新操作不能在Slave上并行操作。
5、MySQL主从复制延迟及解决思路
(1)master服务器高并发,形成大量事务
(2)网络波动,延迟
(3)主从硬件设备差异过大导致(如cpu主频、内存io、硬盘io)
(4)本来就不是同步复制、而是异步复制
解决方案:
(1)从库优化Mysql参数。比如增大Innodb_buffer_pool_size,该参数定义了InnoDB存储引擎的表数据和索引数据的最大内存缓冲区大小,让更多操作在Mysql内存中完成,减少磁盘操作。
(2)从库使用高性能主机。包括cpu强悍、内存加大。避免使用虚拟云主机,使用物理主机,这样提升了i/o方面性。
(3)从库使用SSD磁盘(固态硬盘)
(4)网络优化,避免跨机房实现同步(减小网络延迟)
三、MySQL 读写分离原理
1、什么是读写分离
基本的原理就是让主数据库处理事务性增、改、删操作(TNSEBT、UPDATE、DELETE),而从数据库处理SELECT查询操作。数据库复制被用来把事务性操作导致的变更同步到集群中的从数据库。
2、为什么要读写分离
因为数据库的"写"(写10000条数据可能要3分钟)操作是比较耗时的。
但是数据库的"读" (读10000条数据可能只要5秒钟)
所以读写分离,解决的是,数据库的写入,景响了查询的效率。
3、什么时候要读写分离
数据库不一定要读写分离,如果程序使用数据库较多时,而更新少,查询多的情况下会考虑使用。利用数据库主从同步,再通过读写分离可以分担数据库压力,提高性能。
4、读写分离的原理
读写分离基本的原理是让主数据库处理事务性增、改、删操作(INSERT、UPDATE、DELETE),而从数据库处理SELECT香询操作。数据库复制被用来把事务性操作导致的变更同步到集群中的从数据库。
5、常见的 MySQL 读写分离分为两种
1)基于程序代码内部实现
在代码中根据select、insert进行路由分类,这类方法也是目前生产环境应用最广泛的。
优点是性能较好,因为在程序代码中实现,不需要增加额外的设备为硬件开支; 缺点是需要开发人员来实现,运维人员无从下手。
但是并不是所有的应用都适合在程序代码中实现读写分离,像一些大型复杂的Java应用,如果在程序代码中实现读写分离对代码改动就较大。
2)基于中间代理层实现
代理一般位于客户端和服务器之间,代理服务器接到客户端请求后通过判断后转发到后端数据库,有以下代表性程序。
(1)MySQL-Proxy:MySQL-Proxy为MySQL开源项目,通过其自带的lua脚本进行SQL判断。
(2)Atlas:是由奇虎360的Web平台部基础架构团队开发维护的一个基于MySQL协议的数据中间层项目。它是在mysql-proxy0.8.2版本的基础上,对其进行了优化,增加了一些新的功能特性。360内部使用Atlas运行的mysgl业务,每天承载的读写请求数达几十亿条。支持事物以及存储过程。
(3)Amoeba:由陈思儒开发,作者曾就职于阿里巴巴。该程序由Java语言进行开发,阿里巴巴将其用于生产环境。但是它不支持事务和存储过程。
由于使用MySQL Proxy需要写大量的Lua脚本,这些Lua并不是现成的,而是需要自己去写。这对于并不熟悉MySQL Proxy内置变量和MySQL Protocol 的人来说是非常困难的。
Amoeba是一个非常容易使用、可移植性非常强的软件。因此它在生产环境中被广泛应用于数据库的代理层。
四、Mysql 主从复制和读写分离实验部署
实验拓扑图:
实验思路:
1、客户端访问代理服务器
2、代理服务器写入到主服务器
3、主服务器将增删改写入自己二进制日志
4、从服务器将主服务器的二进制日志同步至自己中继日志
5、从服务器重放中继日志到数据库中
6、客户端读,则代理服务器直接访问从服务器
7、降低负载,起到负载均衡作用
环境准备: