如果是线上环境升级,常规来说分为以下几个步骤:
从库先升级
业务迁移,从库上若有只读业务或者其他,迁移到其他DB实例
从库备份
从库停止复制
升级
从库恢复复制(升级后主库仍是5.6版本,从库是5.7版本,注意是否有异常)
主从恢复正常
主从切换
新从库升级
新从库停止复制
新从库备份
升级
新从库恢复复制
主从恢复正常
恢复相关业务
本文主要记录升级的详细步骤、主库5.6从库5.7有哪些问题以及如何从传统模式转变为GTID模式。
回到顶部(go to top)
1 MySQL5.6升级到5.7版本
升级步骤简要如下:
安装新版本mysql,从库服务器安装5.7版本mysql
修改安装目录配置参数,修改从库的mysql配置文件,把 mysql 安装目录修改为 5.7版本的安装目录
关闭从库mysql服务
新版本mysql启动实例,使用5.7版本mysql启动待升级实例
升级字典,使用mysql_upgrade升级字典
检查,查看mysql log日志
复制代码
1 安装新版本mysql
下载mysql5.7.17,拷贝到server下的/opt文件目录下
解压,创建软连接,授权
tar zvxf mysql-5.7.17-linux-glibc2.5-x86_64.tar.gz
ln -s /opt/mysql-5.7.17-linux-glibc2.5-x86_64 /usr/local/mysql57
chown -R mysql:mysql /usr/data/mysql57
2 修改配置参数
检查配置文件中那些配置是使用到了 安装目录,把使用到底都修改
旧:
basedir = /usr/local/mysql56
plugin-dir = /usr/local/mysql56/lib/plugin/
新:
basedir = /usr/local/mysql
plugin-dir = /usr/local/mysql/lib/plugin/
3 关闭mysql
[root@sutest244 mysqlup]# /usr/local/mysql56/bin/mysqladmin --socket=/tmp/mysql3399.sock -uroot -p shutdown
Enter password:
[root@sutest244 mysqlup]# ps axu | grep mysql3399 | grep mysqld
[root@sutest244 mysqlup]#
4 新版本启动mysql
[root@sutest244 mysqlup]# /usr/local/mysql/bin/mysqld --defaults-file=/data/mysqlup/mysql3399.cnf &
[1] 15477
[root@sutest244 mysqlup]# ps axu | grep mysql3399 | grep mysqld
mysql 15477 37.1 26.7 11931672 1037520 pts/4 Sl 03:34 0:05 /usr/local/mysql/bin/mysqld --defaults-file=/data/mysqlup/mysql3399.cnf
[root@sutest244 mysqlup]#
[root@sutest244 mysqlup]# vim /data/mysqlup/data/error.log
4.1 检查
检查启动后的错误日志,看下是否有配置参数报错,如果有,修改
错误日志会有大量的字典信息报错,这个暂不处理,下个步骤修复
5 升级字典
[root@sutest244 bin]# /usr/local/mysql/bin/mysql_upgrade --socket=/tmp/mysql3399.sock -uroot -p
Enter password:
Checking if update is needed.
Checking server version.
Running queries to upgrade MySQL server.
Checking system database.
mysql.columns_priv OK
mysql.db OK
mysql.engine_cost OK
mysql.event OK
mysql.func OK
mysql.general_log OK
mysql.gtid_executed OK
mysql.help_category OK
mysql.help_keyword OK
mysql.help_relation OK
mysql.help_topic OK
mysql.innodb_index_stats OK
mysql.innodb_table_stats OK
mysql.ndb_binlog_index OK
mysql.plugin OK
mysql.proc OK
mysql.procs_priv OK
mysql.proxies_priv OK
mysql.server_cost OK
mysql.servers OK
mysql.slave_master_info OK
mysql.slave_relay_log_info OK
mysql.slave_worker_info OK
mysql.slow_log OK
mysql.tables_priv OK
mysql.time_zone OK
mysql.time_zone_leap_second OK
mysql.time_zone_name OK
mysql.time_zone_transition OK
mysql.time_zone_transition_type OK
mysql.user OK
Upgrading the sys schema.
Checking databases.
sys.sys_config OK
省略...
检查用户数据库及表格
省略...
Upgrade process completed successfully.
Checking if update is needed.
6 检查日志
查看log日志正常。
复制代码
回到顶部(go to top)
2 主库5.6从库5.7存在问题
由于从库是5.7版本,mysql、performance、sys等一些系统数据库对象有发生变化,同时一些SQL也有所变动。
2.1 修改用户密码失败
1). 问题
主库修改用户密码,update mysql.user set password=password('newpasswd') where ...
2018-03-29T01:22:45.058927Z 12 [ERROR] Slave SQL for channel '': Column 1 of table 'mysql.user' cannot be converted from type 'char(16)' to type 'char(32)', Error_code: 1677
2018-03-29T01:22:45.059066Z 12 [ERROR] Error running query, slave SQL thread aborted. Fix the problem, and restart the slave SQL thread with "SLAVE START". We stopped at log 'bin_log.000003' position 3208
2). 分析
修改导致从库复制异常停止,因为 5.6版本mysql.user表格的password字段,在5.7没有该字段,修改为 authentication_string
3). 处理
方案1:事先处理,执行update password 的前,配置会话不记录binlog:set session sql_log_bin=off,然后单独到主从执行该SQL
方案2:事后处理,如果已经出现这个错误,则在从库跳过该sql然后再开启复制同步,最后从库修改密码
set global sql_slave_skip_counter=1;
start slave sql_thread;
show slave status;
set session sql_log_bin=off;
alter user suuser@'%' identified by 'newpassword';
flush privileges;
set session sql_log_bin=on;
2.2 SQL语法问题
1). 问题
SELECT字段超过GROUP BY字段报错
select id,name,age,count(*) from tbuser group by name;
其他一些SQL语法问题
2).分析
5.7跟5.6默认的sql_mode配置不一样,如果mysql配置文件中没有说明sql_mode,升级后sql_mode将从NO_ENGINE_SUBSTITUTION修改为ONLY_FULL_GROUP_BY,STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION,该模式下会导致部分在5.6支持的SQL在5.7报语法错误。
3). 处理
方案1:事先处理,在测试环境中,详细测试程序代码在新版本数据库上的兼容性,若有异常,则修复程序代码中的SQL操作逻辑。
方案2:事先处理,mysql配置文件中,指定sql_mode与5.6版本一致。
方案3:事后处理,如果已经在出现这个错误,有需要快速响应处理,可以把sql_mode修改为跟5.6版本默认的sql_mode一致即可。
回到顶部(go to top)
3 切换GTID模式
3.1 何为GTID
Global Transaction ID,全局唯一标识,简称GTID,一个GTID 代表在 某个实例上发生的一个事务。
GTID = source_id:transaction_id,其中source_id代表执行该事务的实例的server_uuid,transaction_id是自增值,从1开始,故GTID实际表示为:在 source_id 实例上面发生的 第 transaction_id 个事务。
3.2 GTID相关配置参数
ENFORCE_GTID_CONSISTENCY
warn
如果出现GTID不兼容的语句用法,在错误日志会记录相关信息,那么需要调整应该程序避免不兼容的写法,直到完全没有产生不兼容的语句,可以通过应该程序去排查所有的sql,也可以设置后观察错误日志一段时间,这一步非常重要。
on
启动强制GTID一致性
GTID_MODE
说明
OFF
新事务是非GTID, Slave只接受不带GTID的事务,传送来GTID的事务会报错
OFF_PERMISSIVE
新事务是非GTID, Slave只接受不带GTID的事务也接受带GTID的事务
ON_PERMISSIVE
新事务是GTID, Slave只接受不带GTID的事务也接受带GTID的事务
ON
新事务是GTID, Slave只接受带GTID的事务
切换顺序
需要严格按照以下顺序,不可跳跃
OFF <= => OFF_PERMISSIVE <= => ON_PERMISSIVE <= => ON
3.3 传统复制切换GTID复制
复制代码
step 1
修改 ENFORCE_GTID_CONSISTENCY 为 warn ,运行一段时间,检查错误日志里边是否存在于GTID不兼容的语句用法,并尽快修复
主从都执行,先后顺序不要求
set @@global.enforce_gtid_consistency=warn;
step 2
修改 ENFORCE_GTID_CONSISTENCY 为 on ,确定没有不兼容语法后,可以修改为ON
主从都执行,先后顺序不要求
set @@global.enforce_gtid_consistency=on;
step 3
设置GTID_MODE为off_permissiv
主从都执行,先后顺序不要求
SET @@GLOBAL.GTID_MODE = OFF_PERMISSIVE;
step 4
设置GTID_MODE为off_permissiv=on_permissiv
主从都执行,先后顺序不要求
SET @@GLOBAL.GTID_MODE = ON_PERMISSIVE;
step 5
检查全部实例 正在进行的匿名交易数目,也就是非GTID事务有没有都传送到从库上了,需要等到这个变量为 0 才是可以进行下面操作
主从都执行,先后顺序不要求
SHOW STATUS LIKE 'ONGOING_ANONYMOUS_TRANSACTION_COUNT';
step 6
检查所有实例上面的slave的非GTID是否都执行完了
show master status;#取file跟pos到从库去执行查看
SELECT MASTER_POS_WAIT('bin_log.000003', 88748605); #返回结果大于等于0则说明事务已经完全复制完成
step 7
清理binlog,切换到新的binlog上面
主从都执行,先后顺序不要求
flush logs;
step8
启动GTID
主从都执行,先后顺序不要求
SET @@GLOBAL.GTID_MODE = ON;
step 9
修改cnf文件
主从都执行,先后顺序不要求
gtid_mode=on
enforce-gtid-consistency=on
binlog_gtid_simple_recovery=1
复制代码
3.4 GTID复制切换传统复制
复制代码
step 1
停止从库
所有从库都执行,先后顺序不要求
stop slave;
step 2
重置chanage master to语句,关闭 master_auto_position
所有从库都执行,先后顺序不要求
show slave status \G; #取sql_thread的file跟position位置,Relay_Master_Log_File Exec_Master_Log_Pos
change master to master_log_file='mysql-bin.000003',master_log_pos=4563,master_auto_position=0;
step 3
测试同步是否正常
主库对数据进行操作,看从库的position有没有变化,同时看数据是否变更
step 4
修改GTID_MODE 为 ON_PERMISSIVE
主从都执行
SET @@GLOBAL.GTID_MODE = ON_PERMISSIVE;
step 5
修改GTID_MODE 为 OFF_PERMISSIVE
主从都执行
SET @@GLOBAL.GTID_MODE = OFF_PERMISSIVE;
step 6
修改GTID_MODE 为 OFF
主从都执行
SET @@GLOBAL.GTID_MODE = OFF;
step 7
清理binlog,切换到新的binlog上面
主从都执行,先后顺序不要求
flush logs;
step8
禁用GTID,其中enforce-gtid-consistency可以不关闭,还是进行 GTID的一致性检查
主从都执行,先后顺序不要求
SET @@GLOBAL.GTID_MODE = OFF;
step9
检验同步情况
10
修改cnf文件,注释GTID的参数
主从都执行,先后顺序不要求
gtid_mode=on
enforce-gtid-consistency=on
binlog_gtid_simple_recovery=1