MHA配置安装包下载地址
1.
https://github.com/yoshinorim?tab=repositories
2.
mha4mysql-manager/releases/tag/v0.58
https://github.com/yoshinorim/mha4mysql-manager/releases/tag/v0.58
3.mha4mysql-node/releases/tag/v0.58
https://github.com/yoshinorim/mha4mysql-node/releases/tag/v0.58
4.perl-Config-Tiny-2.23-2.3.noarch.rpm 下载地址
ftp://ftp.pbone.net/mirror/ftp5.gwdg.de/pub/opensuse/repositories/home:/tomasl/CentOS_7/noarch/perl-Config-Tiny-2.23-2.3.noarch.rpm
5. 配置脚本
[server default] manager_log=/var/log/mha/app1/manager.log manager_workdir=/var/log/mha/app1 master_binlog_dir=/usr/local/mysql/data user=mha password=mha ping_interval=2 repl_password=123456 repl_user=rep ssh_user=root [server1] hostname=10.10.10.81 port=3306 [server2] candidate_master=1 check_repl_delay=0 hostname=10.10.10.82 port=3306 [server3] hostname=10.10.10.83 port=3306
6. failover配置脚本
my $vip = '10.10.10.85/24'; #需要修改成你自己的IP my $key = '0'; #设置0 后 ens37:0 eth0:0 当然也可以是1 一定要一致 my $ssh_start_vip = "/sbin/ifconfig ens37:$key $vip"; #需要确定网卡名字 ens37 还是eth0 my $ssh_stop_vip = "/sbin/ifconfig ens37:$key down"; #需要确定网卡名字 ens37 还是eth0
[root@mysql-db03 bin]# ll total 4 -rwxr-xr-x 1 root root 2170 Jan 23 23:34 master_ip_failover [root@mysql-db03 bin]# more master_ip_failover #!/usr/bin/env perl use strict; use warnings FATAL => 'all'; use Getopt::Long; my ( $command, $ssh_user, $orig_master_host, $orig_master_ip, $orig_master_port, $new_master_host, $new_master_ip, $new_master_port ); my $vip = '10.10.10.85/24'; my $key = '0'; my $ssh_start_vip = "/sbin/ifconfig ens37:$key $vip"; my $ssh_stop_vip = "/sbin/ifconfig ens37:$key down"; GetOptions( 'command=s' => \$command, 'ssh_user=s' => \$ssh_user, 'orig_master_host=s' => \$orig_master_host, 'orig_master_ip=s' => \$orig_master_ip, 'orig_master_port=i' => \$orig_master_port, 'new_master_host=s' => \$new_master_host, 'new_master_ip=s' => \$new_master_ip, 'new_master_port=i' => \$new_master_port, ); exit &main(); sub main { print "\n\nIN SCRIPT TEST====$ssh_stop_vip==$ssh_start_vip===\n\n"; if ( $command eq "stop" || $command eq "stopssh" ) { my $exit_code = 1; eval { print "Disabling the VIP on old master: $orig_master_host \n"; &stop_vip(); $exit_code = 0; }; if ($@) { warn "Got Error: $@\n"; exit $exit_code; } exit $exit_code; } elsif ( $command eq "start" ) { my $exit_code = 10; eval { print "Enabling the VIP - $vip on the new master - $new_master_host \n"; &start_vip(); $exit_code = 0; }; if ($@) { warn $@; exit $exit_code; } exit $exit_code; } elsif ( $command eq "status" ) { print "Checking the Status of the script.. OK \n"; exit 0; } else { &usage(); exit 1; } } sub start_vip() { `ssh $ssh_user\@$new_master_host \" $ssh_start_vip \"`; } sub stop_vip() { return 0 unless ($ssh_user); `ssh $ssh_user\@$orig_master_host \" $ssh_stop_vip \"`; } sub usage { print "Usage: master_ip_failover --command=start|stop|stopssh|status --orig_master_host=host --orig_master_ip=ip --orig_master_port=port --new_master_host=host --new_master_ip=ip --new_master_port=port\n"; }
6.
#主机的IP配置
[root@mysql-db03 bin]# cat /etc/hosts 127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4 ::1 localhost localhost.localdomain localhost6 localhost6.localdomain6 10.10.10.81 mysql-db01 10.10.10.82 mysql-db02 10.10.10.83 mysql-db03 10.10.10.85 mysql-vip
主库操作
#修改配置文件
#编辑mysql配置文件
[root@mysql-db01 ~]# vim /etc/my.cnf #在mysqld标签下配置 [mysqld] #主库server-id为1,从库不等于1 server_id =1 #开启binlog日志 log_bin=mysql-bin #创建主从复制用户 #登录数据库 [root@mysql-db01 ~]# mysql -uroot -p123456 #创建rep用户 三个节点都配置上,否则MHA配置时候会报错 mysql> grant replication slave on *.* to rep@'10.10.10.%' identified by '123456'; 从库操作 修改配置文件 #修改mysql-db02配置文件 [root@mysql-db02 ~]# vim /etc/my.cnf #在mysqld标签下配置 [mysqld] #主库server-id为1,从库必须大于1 server_id =5 #开启binlog日志 log_bin=mysql-bin #重启mysql [root@mysql-db02 ~]# /etc/init.d/mysqld restart #修改mysql-db03配置文件 [root@mysql-db03 ~]# vim /etc/my.cnf #在mysqld标签下配置 [mysqld] #主库server-id为1,从库必须大于1 server_id =10 #开启binlog日志 log_bin=mysql-bin #重启mysql [root@mysql-db03 ~]# /etc/init.d/mysqld restart
注:在以往如果是基于binlog日志的主从复制,则必须要记住主库的master状态信息。
mysql> show master status; +------------------+----------+ | File | Position | +------------------+----------+ | mysql-bin.000002 | 120 | +------------------+----------+ 开启GTID #没开启之前先看一下GTID的状态 mysql> show global variables like '%gtid%'; +--------------------------+-------+ | Variable_name | Value | +--------------------------+-------+ | enforce_gtid_consistency | OFF | | gtid_executed | | | gtid_mode | OFF | | gtid_owned | | | gtid_purged | | +--------------------------+-------+ #编辑mysql配置文件(主库从库都需要修改) [root@mysql-db01 ~]# vim /etc/my.cnf #在[mysqld]标签下添加 [mysqld] gtid_mode=ON log_slave_updates enforce_gtid_consistency #重启数据库 [root@mysql-db01 ~]# /etc/init.d/mysqld restart #检查GTID状态 mysql> show global variables like '%gtid%'; +--------------------------+-------+ | Variable_name | Value | +--------------------------+-------+ | enforce_gtid_consistency | ON | #执行GTID一致 | gtid_executed | | | gtid_mode | ON | #开启GTID模块 | gtid_owned | | | gtid_purged | | +--------------------------+-------+ 注:主库从库都需要开启GTID否则在做主从复制的时候就会报错: [root@mysql-db02 ~]# mysql -uroot -p123456 mysql> change master to -> master_host='10.10.10.51', -> master_user='rep', -> master_password='123456', -> master_auto_position=1; ERROR 1777 (HY000): CHANGE MASTER TO MASTER_AUTO_POSITION = 1 can only be executed when @@GLOBAL.GTID_MODE = ON. 配置主从复制 #登录数据库 [root@mysql-db02 ~]# mysql -uroot -p123456 #配置复制主机信息 mysql> change master to #主库IP -> master_host='10.10.10.81', #主库复制用户 -> master_user='rep', #主库复制用户的密码 -> master_password='123456', #GTID位置点 -> master_auto_position=1; #开启slave mysql> start slave; #查看slave状态 mysql> show slave status\G *************************** 1. row *************************** Slave_IO_State: Waiting for master to send event Master_Host: 10.10.10..51 Master_User: rep Master_Port: 3306 Connect_Retry: 60 Master_Log_File: mysql-bin.000003 Read_Master_Log_Pos: 403 Relay_Log_File: mysql-db02-relay-bin.000002 Relay_Log_Pos: 613 Relay_Master_Log_File: mysql-bin.000003 Slave_IO_Running: Yes Slave_SQL_Running: Yes Replicate_Do_DB: Replicate_Ignore_DB: Replicate_Do_Table: Replicate_Ignore_Table: Replicate_Wild_Do_Table: Replicate_Wild_Ignore_Table: Last_Errno: 0 Last_Error: Skip_Counter: 0 Exec_Master_Log_Pos: 403 Relay_Log_Space: 822 Until_Condition: None 从库设置 #登录从库 [root@mysql-db02 ~]# mysql -uroot -p123456 #禁用自动删除relay log 功能 mysql> set global relay_log_purge = 0; #设置只读 mysql> set global read_only=1; #编辑配置文件 [root@mysql-db02 ~]# vim /etc/my.cnf #在mysqld标签下添加 [mysqld] #禁用自动删除relay log 永久生效 relay_log_purge = 0 环境准备(所有节点) #安装依赖包 [root@mysql-db01 ~]# yum install perl-DBD-MySQL -y #进入安装包存放目录 [root@mysql-db01 ~]# cd /home/tools/ #上传mha安装包 [root@mysql-db01 tools]# rz -be mha4mysql-node-0.58-0.el7.centos.noarch.rpm mha4mysql-manager-0.58-0.el7.centos.noarch.rpm #安装node包 [root@mysql-db01 tools]# mha4mysql-node-0.58-0.el7.centos.noarch.rpm Preparing... ########################################### [100%] 1:mha4mysql-node ########################################### [100%] #登录数据库 [root@mysql-db01 tools]# mysql -uroot -p123456 #添加mha管理账号 mysql> grant all privileges on *.* to mha@'10.0.0.%' identified by 'mha'; #查看是否添加成功 mysql> select user,host from mysql.user; #主库上创建,从库会自动复制(在从库上查看) mysql> select user,host from mysql.user; 命令软连接(所有节点) #如果不创建命令软连接,检测mha复制情况的时候会报错 [root@mysql-db01 ~]# ln -s /usr/local/mysql/bin/mysqlbinlog /usr/bin/mysqlbinlog [root@mysql-db01 ~]# ln -s /usr/local/mysql/bin/mysql /usr/bin/mysql 部署管理节点(mha-manager) 在mysql-db03上部署管理节点 #使用epel源 [root@mysql-db03 ~]# wget -O /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo #安装manager依赖包 [root@mysql-db03 ~]# yum install -y perl-Config-Tiny epel-release perl-Log-Dispatch perl-Parallel-ForkManager perl-Time-HiRes #安装manager包 [root@mysql-db03 tools]# rpm -ivh mha4mysql-manager-0.58-0.el7.centos.noarch.rpm Preparing... ########################################### [100%] 1:mha4mysql-manager ########################################### [100%] #编辑配置文件 #创建配置文件目录 [root@mysql-db03 ~]# mkdir -p /etc/mha #创建日志目录 [root@mysql-db03 ~]# mkdir -p /var/log/mha/app1 #编辑mha配置文件 [root@mysql-db03 ~]# vim /etc/mha/app1.cnf [server default] manager_log=/var/log/mha/app1/manager manager_workdir=/var/log/mha/app1 master_binlog_dir=/application/mysql/data user=mha password=mha ping_interval=2 repl_password=123456 repl_user=rep ssh_user=root [server1] hostname=10.10.10.81 port=3306 [server2] candidate_master=1 check_repl_delay=0 hostname=10.10.10.82 port=3306 [server3] hostname=10.10.10.83 port=3306 注意dos2unix app1.cnf
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
【配置文件详解】
[server default] #设置manager的工作目录 manager_workdir=/var/log/masterha/app1 #设置manager的日志 manager_log=/var/log/masterha/app1/manager.log #设置master 保存binlog的位置,以便MHA可以找到master的日志,我这里的也就是mysql的数据目录 master_binlog_dir=/data/mysql #设置自动failover时候的切换脚本 master_ip_failover_script= /usr/local/bin/master_ip_failover #设置手动切换时候的切换脚本 master_ip_online_change_script= /usr/local/bin/master_ip_online_change #设置mysql中root用户的密码,这个密码是前文中创建监控用户的那个密码 password=123456 #设置监控用户root user=root #设置监控主库,发送ping包的时间间隔,尝试三次没有回应的时候自动进行failover ping_interval=1 #设置远端mysql在发生切换时binlog的保存位置 remote_workdir=/tmp #设置复制用户的密码 repl_password=123456 #设置复制环境中的复制用户名 repl_user=rep #设置发生切换后发送的报警的脚本 report_script=/usr/local/send_report #一旦MHA到server02的监控之间出现问题,MHA Manager将会尝试从server03登录到server02 secondary_check_script= /usr/local/bin/masterha_secondary_check -s server03 -s server02 --user=root --master_host=server02 --master_ip=192.168.0.50 --master_port=3306 #设置故障发生后关闭故障主机脚本(该脚本的主要作用是关闭主机放在发生脑裂,这里没有使用) shutdown_script="" #设置ssh的登录用户名 ssh_user=root [server1] hostname=10.10.10.81 port=3306 [server2] hostname=10.10.10.82 port=3306 #设置为候选master,如果设置该参数以后,发生主从切换以后将会将此从库提升为主库,即使这个主库不是集群中事件最新的slave candidate_master=1 #默认情况下如果一个slave落后master 100M的relay logs的话,MHA将不会选择该slave作为一个新的master,因为对于这个slave的恢复需要花费很长时间,通过设置check_repl_delay=0,MHA触发切换在选择一个新的master的时候将会忽略复制延时,这个参数对于设置了candidate_master=1的主机非常有用,因为这个候选主在切换的过程中一定是新的master check_repl_delay=0
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
配置ssh信任(所有节点)
#创建秘钥对
[root@mysql-db01 ~]# ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa >/dev/null 2>&1
#发送公钥,包括自己
[root@mysql-db01 ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@10.10.10.81
[root@mysql-db01 ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@10.10.10.82
[root@mysql-db01 ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@10.10.10.83
启动测试
#测试ssh
[root@mysql-db03 ~]# masterha_check_ssh --conf=/etc/mha/app1.cnf
#看到如下字样,则测试成功
- [info] All SSH connection tests passed successfully.
#测试复制
[root@mysql-db03 ~]# masterha_check_repl --conf=/etc/mha/app1.cnf
#看到如下字样,则测试成功
MySQL Replication Health is OK.
4.6启动MHA
#启动
[root@mysql-db03 ~]# nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/mha/app1/manager.log 2>&1 &
IP漂移的两种方式
通过keepalived的方式,管理虚拟IP的漂移
通过MHA自带脚本方式,管理虚拟IP的漂移
#MHA脚本方式
#修改配置文件
#编辑配置文件
[root@mysql-db03 ~]# vim /etc/mha/app1.cnf
#在[server default]标签下添加
[server default]
#使用MHA自带脚本
master_ip_failover_script=/usr/local/bin/master_ip_failover
#编辑脚本
#根据配置文件中脚本路径编辑
[root@mysql-db03 ~]# vim /etc/mha/master_ip_failover
#修改以下几行内容
my $vip = '10.10.10.85/24';
my $key = '0';
my $ssh_start_vip = "/sbin/ifconfig ens37:$key $vip";
my $ssh_stop_vip = "/sbin/ifconfig ens37:$key down";
#添加执行权限,否则mha无法启动
[root@mysql-db03 ~]# chmod +x /etc/mha/master_ip_failover
5.2.3手动绑定VIP
#绑定vip
[root@mysql-db01 ~]# ifconfig ens37:0 10.10.10.85/24
#查看vip
[root@mysql-db01 ~]# ip a |grep ens37
2: ens37: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
inet 10.10.10.81/24 brd 10.10.10.255 scope global ens37
inet 10.10.10..85/24 brd 10.10.10.255 scope global secondary ens37:0
注意点:
主节点停掉后 ,MHA会停掉
旧主节点要启动后通过查询以下内容可以找到 文件号以及地址
grep -i "change master to " /var/log/mha/app1/manager.log
可以找到信息,修改下密码,然后start slave,旧主库就会恢复
注意
/etc/mha/app1.cnf文件内容会改变,启动前应该加上
[server default] manager_log=/var/log/mha/app1/manager.log manager_workdir=/var/log/mha/app1 master_binlog_dir=/usr/local/mysql/data user=mha password=mha ping_interval=2 repl_password=123456 repl_user=rep ssh_user=root [server1] hostname=10.10.10.81 port=3306 [server2] candidate_master=1 check_repl_delay=0 hostname=10.10.10.82 port=3306 [server3] hostname=10.10.10.83 port=3306 如果用了failover了 [root@mysql-db03 bin]# more /etc/mha/app1.cnf [server default] manager_log=/var/log/mha/app1/manager.log manager_workdir=/var/log/mha/app1 master_binlog_dir=/usr/local/mysql/data master_ip_failover_script=/usr/local/bin/master_ip_failover ---这个需要放在这里 password=mha ping_interval=2 repl_password=123456 repl_user=rep ssh_user=root user=mha [server1] hostname=10.10.10.81 port=3306 [server2] candidate_master=1 check_repl_delay=0 hostname=10.10.10.82 port=3306 [server3] hostname=10.10.10.83 port=3306
然后再启动mgr
nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/mha/app1/manager.log 2>&1 &
优秀的mha文档
https://www.cnblogs.com/keerya/p/7883766.html