首先要准备两台服务器,一台主服务器(Master),另一台从服务器(Slave),然后要保证Master与Slave的版本要相同且Master不能高于Slave的版本,一般稳健的做法都是使其版本相同,因为MySQL不同版本之间的binlog(二进制日志)格式可能会不一样,最后会导致同步出现异常。

一、环境:

软件环境

系统:CentOS 6.* 或 7.* MySQL版本:5.7

主机设置:

IP 主机名 角色
192.168.1.101 MySQL-001 master
192.168.1.102 MySQL-002 slave

二、Mysql主从基本原理

Mysql的主从同步就是当master(主库)发生数据变化的时候,会实时同步到slave(从库)。 主从复制可以水平扩展数据库的负载能力,容错,高可用,数据备份。 不管是delete、update、insert,还是创建函数、存储过程,都是在master上,当master有操作的时候,slace会快速的接受到这些操作,从而做同步。

主要的实现原理

  • 在master机器上,主从同步时间会被写道特殊的log文件中(binary-log);
  • 在slave机器上,slave读取主从同步事件,并根据读取的事件变化,在slave库上做相应的更改。

详细的主从同步主要有三种形式:statement、row、mixed

  • statement:会将对数据库操作的sql语句写道binlog中
  • row:会将每一条数据的变化写道binlog中。
  • mixed:statement与row的混合。Mysql决定什么时候写statement格式的,什么时候写row格式的binlog。

在master机器上的操作:

当master上的数据发生变化的时候,该事件变化会按照顺序写入binlog中。当slave链接到master的时候,master机器会为slave开启binlog dunp线程。当master的binlog发生变化的时候,binlog dump线程会通知slave,并将相应的binlog内容发送给slave。

在slave机器上操作:

当主从同步开启的时候,slave上会创建两个线程:I\O线程。该线程连接到master机器,master机器上的binlog dump 线程会将binlog的内容发送给该I\O线程。该I/O线程接收到binlog内容后,再将内容写入到本地的relay log;sql线程。该线程读取到I/O线程写入的ralay log。并且根据relay log。并且根据relay log 的内容对slave数据库做相应的操作。

三、主从配置

1、master配置文件设置

一般mysql配置文件在/etc/my.cnf

(如果找不到的话也有可能在这些目录下:/etc/mysql/my.cnf,/usr/local/mysql/etc/my.cnf,~/.my.cnf)

[root@MySQL-001 ~]# vim /etc/my.cnf
[mysqld]
basedir=/usr/local/mysql
datadir=/data/mysqldata
socket=/tmp/mysql.sock
user=mysql
port=3306

# master的配置
server-id=1             # 服务器id (设置唯一标识)
binlog-do-db=employees  # 要给从机同步的库
binlog-ignore-db=mysql  # 不给从机同步的库(多个写多行)
binlog-ignore-db=information_schema
binlog-ignore-db=performance_schema
binlog-ignore-db=sys
log-bin=mysql-bin           # 打开日志(主机需要打开),可以指定绝对路径;
expire_logs_days=90     # 自动清理 90 天前的log文件,可根据需要修改

重启数据库使配置生效:

CentOS 6.*:
[root@MySQL-001 ~]# service mysqld restart 
[root@MySQL-001 ~]# service mysqld status
 SUCCESS! MySQL running (15607)
CentOS 7.*:
 [root@MySQL-001 ~]# systemctl restart  mysqld.service
 [root@MySQL-001 ~]# systemctl status mysqld.service
	mysqld.service - MySQL Server
 Loaded: loaded (/usr/lib/systemd/system/mysqld.service; enabled)
 Active: active (running) since 四 2018-05-17 11:42:02 CST; 2h 5min ago
   Docs: man:mysqld(8)
      http://dev.mysql.com/doc/refman/en/using-systemd.html
	 Main PID: 29959 (mysqld)
 CGroup: /system.slice/mysqld.service
     └─29959 /opt/mysql/bin/mysqld --defaults-file=/etc/my.cnf

	5月 17 11:42:02 tcloud-118 systemd[1]: Started MySQL Server.
测试log_bin是否成功开启
[root@MySQL-001 ~]# mysql -uroot -p
mysql> show variables like '%log_bin%';
+---------------------------------+---------------------------------+
| Variable_name                   | Value                           |
+---------------------------------+---------------------------------+
| log_bin                         | ON                              |
| log_bin_basename                | /opt/mysql/logs/mysql-bin       |
| log_bin_index                   | /opt/mysql/logs/mysql-bin.index |
| log_bin_trust_function_creators | ON                              |
| log_bin_use_v1_row_events       | OFF                             |
| sql_log_bin                     | ON                              |
+---------------------------------+---------------------------------+
6 rows in set (0.00 sec)

mysql>

可以看到log_bin为ON;

2、master的数据库中建立主从同步账号backup:

backup为用户名,192.168.1.%表示只允许192.168.1网段的客户端连接,123456为密码;

mysql> grant replication slave on *.* to 'backup'@'192.168.1.%' identified by '123456';   # 创建同步账户
mysql> flush privileges;                                                                  # 刷新权限
mysql> select Host,User,authentication_string from mysql.user;                            # 检查是否创建
+--------------+---------------+-------------------------------------------+
| Host         | User          | authentication_string                     |
+--------------+---------------+-------------------------------------------+
| localhost    | root          | *6C362347EBEAA7DF44F6D34884615A35095E80EB |
| localhost    | mysql.session | *THISISNOTAVALIDPASSWORDTHATCANBEUSEDHERE |
| localhost    | mysql.sys     | *THISISNOTAVALIDPASSWORDTHATCANBEUSEDHERE |
| 192.168.1.%  | backup        | *9BB58B7F11A03B83C396FF506F3DF45727E79614 |
+--------------+---------------+-------------------------------------------+
5 rows in set (0.00 sec)

mysql>

backup@192.168.1.%账户已建立;

3、Master锁表

重启MySQL服务并设置读取锁定,读取锁定的意思是只能读取,不能更新,以便获得一个一致性的快照;

mysql> flush table with read lock;     # 主库锁表;默认28800秒,即8小时自动解锁;
mysql> show master status \G
*************************** 1. row ***************************
			 File: mysql-bin.000002
		 Position: 1621
	 Binlog_Do_DB:
 Binlog_Ignore_DB: mysql
Executed_Gtid_Set: 1d3d078c-59a7-11e8-9a08-00163e000b3f:1-7
1 row in set (0.00 sec)

mysql>

查看主服务器上当前的二进制日志名和偏移量值这里的file 和position 要和上面的一致; 导出master(192.168.1.101)上的数据,然后导入slave 中

4、拷贝数据库至从库(slave)

master:

格式:mysqldump -uUSER -pPASSWORD DATABASE TABLE > NAME.sql

[root@MySQL-001 ~]# mysqldump -uroot -p employees > /opt/employees.sql    # 假如employees为主库已经存在的库
[root@MySQL-001 ~]# yum install openssh-clients -y                        # 可选
[root@MySQL-001 ~]# scp /opt/employees.sql root@192.168.1.102:/opt/

slave:

[root@MySQL-002 ~]# yum install openssh-clients -y                        # 可选

5、配置slave(192.168.1.102)

[root@MySQL-002 ~]# vim /etc/my.cnf
[mysqld]
basedir=/usr/local/mysql    # mysql程序路径
datadir=/data/mysqldata     # mysql数据目录
socket=/tmp/mysql.sock
user=mysql
port=3306

# slave配置
server-id=2                 # MySQLid 后面2个从服务器需设置不同
skip_slave_start=1          # 复制进程不会随着数据库的启动而启动,重启数据库后需手动启动;
#加上以下参数可以避免更新不及时,SLAVE 重启后导致的主从复制出错。
read_only = 1               # 从库普通账户只读;
master_info_repository=TABLE
relay_log_info_repository=TABLE
#relay_log_recovery=1       # 从机禁止写
#super_read_only=1          # 从机禁止写

重启数据库

CentOS 6.*:

[root@MySQL-002 ~]# service mysqld restart 
[root@MySQL-002 ~]# service mysqld status
 SUCCESS! MySQL running (15604)

CentOS 7.*:

[root@MySQL-002 ~]# systemctl restart mysqld.service
[root@MySQL-002 ~]# systemctl status mysqld.service
mysqld.service - MySQL Server
   Loaded: loaded (/usr/lib/systemd/system/mysqld.service; enabled)
   Active: active (running) since 四 2018-05-17 11:42:02 CST; 2h 5min ago
     Docs: man:mysqld(8)
        http://dev.mysql.com/doc/refman/en/using-systemd.html
 Main PID: 29959 (mysqld)
   CGroup: /system.slice/mysqld.service
       └─29959 /opt/mysql/bin/mysqld --defaults-file=/etc/my.cnf

5月 17 11:42:02 tcloud-118 systemd[1]: Started MySQL Server.

然后导入到mysql数据库中,slave上的employees数据库不存在则先创建,然后再导入

[root@MySQL-002 ~]# mysql -uroot -p
mysql> create database employees;        # 新建这个库
[root@MySQL-002 ~]# mysql -uroot -p employees < /opt/employees.sql

登录slave数据库,并做如下设置

[root@MySQL-002 ~]# mysql -uroot -p
mysql> stop slave;                  # 关闭slave同步,第一次可略过;
mysql> change master to
-> master_host='192.168.1.101',     # master的ip
-> master_user='backup',            # 备份用户名
-> master_password='123456',        # 密码
-> master_log_file='mysql-bin.000002',    # 三.3,且要与master的参数一致
-> master_log_pos=1621;              # 三.3,且要与master的参数一致

合写为:

mysql> change master to master_host='192.168.1.101', master_user='backup', master_password='123456', master_log_file='mysql-bin.000002', master_log_pos=1621;
mysql> start slave;                 # 启动同步
mysql> show slave status \G         # 查看slave从机的状态
*************************** 1. row ***************************
			   Slave_IO_State: Waiting for master to send event
				  Master_Host: 192.168.1.101
				  Master_User: backup
				  Master_Port: 3306
				Connect_Retry: 60
			  Master_Log_File: mysql-bin.000002
		  Read_Master_Log_Pos: 1621
			   Relay_Log_File: relay-bin.000002
				Relay_Log_Pos: 320
		Relay_Master_Log_File: mysql-bin.000002
			 Slave_IO_Running: Yes
			Slave_SQL_Running: Yes
			  Replicate_Do_DB:
		  Replicate_Ignore_DB: mysql
		   Replicate_Do_Table:
	   Replicate_Ignore_Table:
	  Replicate_Wild_Do_Table:
  Replicate_Wild_Ignore_Table:
				   Last_Errno: 0
				   Last_Error:
				 Skip_Counter: 0
		  Exec_Master_Log_Pos: 1621
			  Relay_Log_Space: 521
			  Until_Condition: None
			   Until_Log_File:
				Until_Log_Pos: 0
		   Master_SSL_Allowed: No
		   Master_SSL_CA_File:
		   Master_SSL_CA_Path:
			  Master_SSL_Cert:
			Master_SSL_Cipher:
			   Master_SSL_Key:
		Seconds_Behind_Master: 0
Master_SSL_Verify_Server_Cert: No
				Last_IO_Errno: 0
				Last_IO_Error:
			   Last_SQL_Errno: 0
			   Last_SQL_Error:
  Replicate_Ignore_Server_Ids:
			 Master_Server_Id: 101
				  Master_UUID: 1d3d078c-59a7-11e8-9a08-00163e000b3f
			 Master_Info_File: mysql.slave_master_info
					SQL_Delay: 0
		  SQL_Remaining_Delay: NULL
	  Slave_SQL_Running_State: Slave has read all relay log; waiting for more updates
		   Master_Retry_Count: 86400
				  Master_Bind:
	  Last_IO_Error_Timestamp:
	 Last_SQL_Error_Timestamp:
			   Master_SSL_Crl:
		   Master_SSL_Crlpath:
		   Retrieved_Gtid_Set:
			Executed_Gtid_Set: 5037e479-59a7-11e8-a35b-00163e000402:1-3
				Auto_Position: 0
		 Replicate_Rewrite_DB:
				 Channel_Name:
		   Master_TLS_Version:
1 row in set (0.00 sec)

mysql>

下面对应参数相同代表设置成功,0延时;

Slave_IO_Running: Yes

Slave_SQL_Running: Yes

Seconds_Behind_Master: 0

参数说明:

  • Master_Log_File: SLAVE中的I/O线程当前正在读取的主服务器二进制日志文件的名称
  • Read_Master_Log_Pos: 在当前的主服务器二进制日志中,SLAVE中的I/O线程已经读取的位置
  • Relay_Log_File: SQL线程当前正在读取和执行的中继日志文件的名称
  • Relay_Log_Pos: 在当前的中继日志中,SQL线程已读取和执行的位置
  • Relay_Master_Log_File: 由SQL线程执行的包含多数近期事件的主服务器二进制日志文件的名称
  • Slave_IO_Running: I/O线程是否被启动并成功地连接到主服务器上
  • Slave_SQL_Running: SQL线程是否被启动
  • Seconds_Behind_Master: 从属服务器SQL线程和从属服务器I/O线程之间的时间差距,单位以秒计。

关闭主数据库的读锁定

mysql> unlock tables;

四、测试主从复制

1、在marster中创建一个新表再查看slave中是否有数据

master:

mysql> use employees;
mysql> create table test001(id int auto_increment primary key,name varchar(20) not null);
mysql> insert into test001 values(null,'will');
mysql> insert into test001 values(null,'jim');
mysql> insert into test001 values(null,'tom');
mysql> select * from employees.test001;
+----+------+
| id | name |
+----+------+
|  1 | will |
|  2 | jim  |
|  3 | tom  |
+----+------+
3 rows in set (0.01 sec)

slave:

mysql> use employees;
mysql> select * from employees.test001;
+----+------+
| id | name |
+----+------+
|  1 | will |
|  2 | jim  |
|  3 | tom  |
+----+------+

2、重启关闭从数据库,主删除test001表,然后主从数据库都重启看是否正常

master:

mysql> drop table employees.test001;

slave:

mysql> use employees;
mysql> show tables;

以上实验证明主从同步成功!!!

五、mysql数据库从库同步的延迟问题

1、从库同步延迟一般出现的情况

1、show slave status 显示参数 Seconds_Behind_Master不为0,这个数值可能会很大 2、show slave status 显示参数 Relay_Master_Log_File和Master_Log_File显示bin-log的编号相差很大,说明bin-log在从库上没有及时同步,所以近期执行的bin-log和当前IO线程所读的bin-log相差很大 3、mysql的从库数据目录下存在大量mysql-relay-log日志,该日志同步完成之后就会被系统自动删除,存在大量日志,说明主从同步延迟很厉害

2、MySQL数据库主从同步延迟原理

mysql主从同步原理: 主库针对写操作,顺序写binlog,从库单线程去主库顺序读”写操作的binlog”,从库取到binlog在本地原样执行(随机写),来保证主从数据逻辑上一致。 mysql的主从复制都是单线程的操作,主库对所有DDL和DML产生binlog,binlog是顺序写,所以效率很高,slave的Slave_IO_Running线程到主库取日志,效率比较高,下一步,问题来了,slave的Slave_SQL_Running线程将主库的DDL和DML操作在slave实施。DML和DDL的IO操作是随即的,不是顺序的,成本高很多,还可能可slave上的其他查询产生lock争用,由于Slave_SQL_Running也是单线程的,所以一个DDL卡主了,需要执行10分钟,那么所有之后的DDL会等待这个DDL执行完才会继续执行,这就导致了延时。 有朋友会问:“主库上那个相同的DDL也需要执行10分,为什么slave会延时?”,答案是master可以并发,Slave_SQL_Running线程却不可以。

3、MySQL数据库主从同步延迟是怎么产生的?

当主库的TPS并发较高时,产生的DDL数量超过slave一个sql线程所能承受的范围,那么延时就产生了,当然还有就是可能与slave的大型query语句产生了锁等待。 首要原因:数据库在业务上读写压力太大,CPU计算负荷大,网卡负荷大,硬盘随机IO太高 次要原因:读写binlog带来的性能影响,网络传输延迟。

可以通过mysqlbinlog具体查看在哪个语句卡住,

mysqlbinlog --no-defaults -v -v --base64-output=DECODE-ROWS  /usr/local/mysql/log/relay-bin.004764 --start-position=94813395  |more

其中:

  • 主从状态查询"show slave status \G;"语句中的Relay_Log_File显示从库执行到的日志文件:/usr/local/mysql/log/relay-bin.004764
  • 主从状态查询"show slave status \G;"语句中的Relay_Log_Pos显示从库执行到的日志语句:94813395

查询当前正在写入的binlog里哪个表调用的次数最多

mysqlbinlog mysql-bin.001314 | awk '/Table_map/{print $11}'|sort |uniq -c|sort -n

4、MySQL数据库主从同步延迟解决方案。

架构方面

1.业务的持久化层的实现采用分库架构,mysql服务可平行扩展,分散压力。 2.单个库读写分离,一主多从,主写从读,分散压力。这样从库压力比主库高,保护主库。 3.服务的基础架构在业务和mysql之间加入memcache或者redis的cache层。降低mysql的读压力。 4.不同业务的mysql物理上放在不同机器,分散压力。 5.使用比主库更好的硬件设备作为slave

总结,mysql压力小,延迟自然会变小。

硬件方面

1.采用好服务器,比如4u比2u性能明显好,2u比1u性能明显好。 2.存储用ssd或者盘阵或者san,提升随机写的性能。 3.主从间保证处在同一个交换机下面,并且是万兆环境。 总结,硬件强劲,延迟自然会变小。一句话,缩小延迟的解决方案就是花钱和花时间。

5、mysql主从同步加速方法

1、sync_binlog在slave端设置为0 2、–logs-slave-updates 从服务器从主服务器接收到的更新不记入它的二进制日志。 3、直接禁用slave端的binlog 4、slave端,如果使用的存储引擎是innodb,innodb_flush_log_at_trx_commit =2

6、sync_binlog与innodb_flush_log_at_trx_commit参数

主库是写,对数据安全性较高,比如sync_binlog=1,innodb_flush_log_at_trx_commit = 1 之类的设置是需要的 而slave则不需要这么高的数据安全,完全可以讲sync_binlog设置为0或者关闭binlog,innodb_flushlog也可以设置为0来提高sql的执行效率

sync_binlog

MySQL提供一个sync_binlog参数来控制数据库的binlog刷到磁盘上去。 默认,sync_binlog=0,表示MySQL不控制binlog的刷新,由文件系统自己控制它的缓存的刷新。这时候的性能是最好的,但是风险也是最大的。一旦系统Crash,在binlog_cache中的所有binlog信息都会被丢失。 如果sync_binlog>0,表示每sync_binlog次事务提交,MySQL调用文件系统的刷新操作将缓存刷下去。最安全的就是sync_binlog=1了,表示每次事务提交,MySQL都会把binlog刷下去,是最安全但是性能损耗最大的设置。这样的话,在数据库所在的主机操作系统损坏或者突然掉电的情况下,系统才有可能丢失1个事务的数据。 但是binlog虽然是顺序IO,但是设置sync_binlog=1,多个事务同时提交,同样很大的影响MySQL和IO性能。 虽然可以通过group commit的补丁缓解,但是刷新的频率过高对IO的影响也非常大。对于高并发事务的系统来说, “sync_binlog”设置为0和设置为1的系统写入性能差距可能高达5倍甚至更多。 所以很多MySQL DBA设置的sync_binlog并不是最安全的1,而是2或者是0。这样牺牲一定的一致性,可以获得更高的并发和性能。 默认情况下,并不是每次写入时都将binlog与硬盘同步。因此如果操作系统或机器(不仅仅是MySQL服务器)崩溃,有可能binlog中最后的语句丢失了。要想防止这种情况,你可以使用sync_binlog全局变量(1是最安全的值,但也是最慢的),使binlog在每N次binlog写入后与硬盘同步。即使sync_binlog设置为1,出现崩溃时,也有可能表内容和binlog内容之间存在不一致性。

innodb_flush_log_at_trx_commit

抱怨Innodb比MyISAM慢100倍?那么你大概是忘了调整这个值。 默认值1的意思是每一次事务提交或事务外的指令都需要把日志写入(flush)硬盘,这是很费时的。特别是使用电池供电缓存(Battery backed up cache)时。 设成2对于很多运用,特别是从MyISAM表转过来的是可以的,它的意思是不写入硬盘而是写入系统缓存。日志仍然会每秒flush到硬盘,所以你一般不会丢失超过1-2秒的更新。 设成0会更快一点,但安全方面比较差,即使MySQL挂了也可能会丢失事务的数据。而值2只会在整个操作系统 挂了时才可能丢数据。

7、从文件系统本身属性角度优化

master端 修改linux、Unix文件系统中文件的etime属性, 由于每当读文件时OS都会将读取操作发生的时间回写到磁盘上,对于读操作频繁的数据库文件来说这是没必要的,只会增加磁盘系统的负担影响I/O性能。可以通过设置文件系统的mount属性,组织操作系统写atime信息,在linux上的操作为: 打开/etc/fstab,加上noatime参数

/dev/sdb1 /data reiserfs noatime 1 2

然后重新mount文件系统

	mount -oremount /data

参考

http://www.cnblogs.com/zhoujinyi/p/5704567.html?tdsourcetag=s_pcqq_aiomsg