MHA配置安装包下载地址

1.

https://github.com/yoshinorim?tab=repositories


2.

mha4mysql-manager/releases/tag/v0.58
https://github.com/yoshinorim/mha4mysql-manager/releases/tag/v0.58



3.mha4mysql-node/releases/tag/v0.58


https://github.com/yoshinorim/mha4mysql-node/releases/tag/v0.58


4.perl-Config-Tiny-2.23-2.3.noarch.rpm 下载地址

ftp://ftp.pbone.net/mirror/ftp5.gwdg.de/pub/opensuse/repositories/home:/tomasl/CentOS_7/noarch/perl-Config-Tiny-2.23-2.3.noarch.rpm



5. 配置脚本


[server default]
manager_log=/var/log/mha/app1/manager.log
manager_workdir=/var/log/mha/app1
master_binlog_dir=/usr/local/mysql/data
user=mha
password=mha
ping_interval=2
repl_password=123456
repl_user=rep
ssh_user=root
[server1]
hostname=10.10.10.81
port=3306
[server2]
candidate_master=1
check_repl_delay=0
hostname=10.10.10.82
port=3306
[server3]
hostname=10.10.10.83
port=3306


6. failover配置脚本



my $vip = '10.10.10.85/24';      #需要修改成你自己的IP
my $key = '0';                   #设置0 后  ens37:0  eth0:0  当然也可以是1  一定要一致
my $ssh_start_vip = "/sbin/ifconfig ens37:$key $vip";     #需要确定网卡名字  ens37 还是eth0
my $ssh_stop_vip = "/sbin/ifconfig ens37:$key down";      #需要确定网卡名字  ens37 还是eth0




[root@mysql-db03 bin]# ll
total 4
-rwxr-xr-x 1 root root 2170 Jan 23 23:34 master_ip_failover
[root@mysql-db03 bin]# more master_ip_failover 
#!/usr/bin/env perl
use strict;
use warnings FATAL => 'all';
use Getopt::Long;
my (
    $command,          $ssh_user,        $orig_master_host, $orig_master_ip,
    $orig_master_port, $new_master_host, $new_master_ip,    $new_master_port
);
my $vip = '10.10.10.85/24';
my $key = '0';
my $ssh_start_vip = "/sbin/ifconfig ens37:$key $vip";
my $ssh_stop_vip = "/sbin/ifconfig ens37:$key down";
GetOptions(
    'command=s'          => \$command,
    'ssh_user=s'         => \$ssh_user,
    'orig_master_host=s' => \$orig_master_host,
    'orig_master_ip=s'   => \$orig_master_ip,
    'orig_master_port=i' => \$orig_master_port,
    'new_master_host=s'  => \$new_master_host,
    'new_master_ip=s'    => \$new_master_ip,
    'new_master_port=i'  => \$new_master_port,
);
exit &main();
sub main {
    print "\n\nIN SCRIPT TEST====$ssh_stop_vip==$ssh_start_vip===\n\n";
    if ( $command eq "stop" || $command eq "stopssh" ) {
        my $exit_code = 1;
        eval {
            print "Disabling the VIP on old master: $orig_master_host \n";
            &stop_vip();
            $exit_code = 0;
        };
        if ($@) {
            warn "Got Error: $@\n";
            exit $exit_code;
        }
        exit $exit_code;
    }
    elsif ( $command eq "start" ) {
        my $exit_code = 10;
        eval {
            print "Enabling the VIP - $vip on the new master - $new_master_host \n";
            &start_vip();
            $exit_code = 0;
        };
        if ($@) {
            warn $@;
            exit $exit_code;
        }
        exit $exit_code;
    }
    elsif ( $command eq "status" ) {
        print "Checking the Status of the script.. OK \n";
        exit 0;
    }
    else {
        &usage();
        exit 1;
    }
}
sub start_vip() {
    `ssh $ssh_user\@$new_master_host \" $ssh_start_vip \"`;
}
sub stop_vip() {
     return 0  unless  ($ssh_user);
    `ssh $ssh_user\@$orig_master_host \" $ssh_stop_vip \"`;
}
sub usage {
    print
    "Usage: master_ip_failover --command=start|stop|stopssh|status --orig_master_host=host --orig_master_ip=ip --orig_master_port=port --new_master_host=host --new_master_ip=ip --new_master_port=port\n";
}

6. 


#主机的IP配置


[root@mysql-db03 bin]#  cat /etc/hosts
127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
10.10.10.81  mysql-db01
10.10.10.82  mysql-db02
10.10.10.83  mysql-db03
10.10.10.85  mysql-vip


主库操作

#修改配置文件

#编辑mysql配置文件

[root@mysql-db01 ~]# vim /etc/my.cnf
#在mysqld标签下配置
[mysqld]
#主库server-id为1,从库不等于1
server_id =1
#开启binlog日志
log_bin=mysql-bin
#创建主从复制用户
#登录数据库
[root@mysql-db01 ~]# mysql -uroot -p123456
#创建rep用户  三个节点都配置上,否则MHA配置时候会报错
mysql> grant replication slave on *.* to rep@'10.10.10.%' identified by '123456';
从库操作
修改配置文件
#修改mysql-db02配置文件
[root@mysql-db02 ~]# vim /etc/my.cnf
#在mysqld标签下配置
[mysqld]
#主库server-id为1,从库必须大于1
server_id =5
#开启binlog日志
log_bin=mysql-bin
#重启mysql
[root@mysql-db02 ~]# /etc/init.d/mysqld restart
#修改mysql-db03配置文件
[root@mysql-db03 ~]# vim /etc/my.cnf
#在mysqld标签下配置
[mysqld]
#主库server-id为1,从库必须大于1
server_id =10
#开启binlog日志
log_bin=mysql-bin
#重启mysql
[root@mysql-db03 ~]# /etc/init.d/mysqld restart

注:在以往如果是基于binlog日志的主从复制,则必须要记住主库的master状态信息。

mysql> show master status;
+------------------+----------+
| File             | Position |
+------------------+----------+
| mysql-bin.000002 |      120 |
+------------------+----------+
开启GTID
#没开启之前先看一下GTID的状态
mysql> show global variables like '%gtid%';
+--------------------------+-------+
| Variable_name            | Value |
+--------------------------+-------+
| enforce_gtid_consistency | OFF   |
| gtid_executed            |       |
| gtid_mode                | OFF   |
| gtid_owned               |       |
| gtid_purged              |       |
+--------------------------+-------+ 
#编辑mysql配置文件(主库从库都需要修改)
[root@mysql-db01 ~]# vim /etc/my.cnf
#在[mysqld]标签下添加
[mysqld]
gtid_mode=ON
log_slave_updates
enforce_gtid_consistency
#重启数据库
[root@mysql-db01 ~]# /etc/init.d/mysqld restart
#检查GTID状态
mysql> show global variables like '%gtid%';
+--------------------------+-------+
| Variable_name            | Value |
+--------------------------+-------+
| enforce_gtid_consistency | ON    | #执行GTID一致
| gtid_executed            |       |
| gtid_mode                | ON    | #开启GTID模块
| gtid_owned               |       |
| gtid_purged              |       |
+--------------------------+-------+
注:主库从库都需要开启GTID否则在做主从复制的时候就会报错:
[root@mysql-db02 ~]# mysql -uroot -p123456
mysql> change master to
-> master_host='10.10.10.51',
-> master_user='rep',
-> master_password='123456',
-> master_auto_position=1;
ERROR 1777 (HY000): CHANGE MASTER TO MASTER_AUTO_POSITION = 1 can only be executed when @@GLOBAL.GTID_MODE = ON.
配置主从复制
#登录数据库
[root@mysql-db02 ~]# mysql -uroot -p123456
#配置复制主机信息
mysql> change master to
#主库IP
-> master_host='10.10.10.81',
#主库复制用户
-> master_user='rep',
#主库复制用户的密码
-> master_password='123456',
#GTID位置点
-> master_auto_position=1;
#开启slave
mysql> start slave;
#查看slave状态
mysql> show slave status\G
*************************** 1. row ***************************
               Slave_IO_State: Waiting for master to send event
                  Master_Host: 10.10.10..51
                  Master_User: rep
                  Master_Port: 3306
                Connect_Retry: 60
              Master_Log_File: mysql-bin.000003
          Read_Master_Log_Pos: 403
               Relay_Log_File: mysql-db02-relay-bin.000002
                Relay_Log_Pos: 613
        Relay_Master_Log_File: mysql-bin.000003
             Slave_IO_Running: Yes
            Slave_SQL_Running: Yes
              Replicate_Do_DB: 
          Replicate_Ignore_DB: 
           Replicate_Do_Table: 
       Replicate_Ignore_Table: 
      Replicate_Wild_Do_Table: 
  Replicate_Wild_Ignore_Table: 
                   Last_Errno: 0
                   Last_Error: 
                 Skip_Counter: 0
          Exec_Master_Log_Pos: 403
              Relay_Log_Space: 822
              Until_Condition: None
从库设置
#登录从库
[root@mysql-db02 ~]# mysql -uroot -p123456
#禁用自动删除relay log 功能
mysql> set global relay_log_purge = 0;
#设置只读
mysql> set global read_only=1;
#编辑配置文件
[root@mysql-db02 ~]# vim /etc/my.cnf
#在mysqld标签下添加
[mysqld]
#禁用自动删除relay log 永久生效
relay_log_purge = 0
环境准备(所有节点)
#安装依赖包
[root@mysql-db01 ~]# yum install perl-DBD-MySQL -y
#进入安装包存放目录
[root@mysql-db01 ~]# cd /home/tools/
#上传mha安装包
[root@mysql-db01 tools]# rz -be
mha4mysql-node-0.58-0.el7.centos.noarch.rpm
mha4mysql-manager-0.58-0.el7.centos.noarch.rpm
#安装node包
[root@mysql-db01 tools]# mha4mysql-node-0.58-0.el7.centos.noarch.rpm
Preparing...                ########################################### [100%]
   1:mha4mysql-node         ########################################### [100%]
#登录数据库
[root@mysql-db01 tools]# mysql -uroot -p123456
#添加mha管理账号
mysql> grant all privileges on *.* to mha@'10.0.0.%' identified by 'mha';
#查看是否添加成功
mysql> select user,host from mysql.user;
#主库上创建,从库会自动复制(在从库上查看)
mysql> select user,host from mysql.user;
命令软连接(所有节点)
#如果不创建命令软连接,检测mha复制情况的时候会报错
[root@mysql-db01 ~]# ln -s /usr/local/mysql/bin/mysqlbinlog /usr/bin/mysqlbinlog
[root@mysql-db01 ~]# ln -s /usr/local/mysql/bin/mysql /usr/bin/mysql
部署管理节点(mha-manager)
在mysql-db03上部署管理节点
#使用epel源
[root@mysql-db03 ~]# wget -O /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo
#安装manager依赖包
[root@mysql-db03 ~]# yum install -y perl-Config-Tiny epel-release perl-Log-Dispatch perl-Parallel-ForkManager perl-Time-HiRes
#安装manager包
[root@mysql-db03 tools]# rpm -ivh   mha4mysql-manager-0.58-0.el7.centos.noarch.rpm
Preparing...                ########################################### [100%]
1:mha4mysql-manager       ########################################### [100%]
#编辑配置文件
#创建配置文件目录
[root@mysql-db03 ~]# mkdir -p /etc/mha
#创建日志目录
[root@mysql-db03 ~]# mkdir -p /var/log/mha/app1
#编辑mha配置文件
[root@mysql-db03 ~]# vim /etc/mha/app1.cnf
[server default]
manager_log=/var/log/mha/app1/manager
manager_workdir=/var/log/mha/app1
master_binlog_dir=/application/mysql/data
user=mha
password=mha
ping_interval=2
repl_password=123456
repl_user=rep
ssh_user=root
[server1]
hostname=10.10.10.81
port=3306
[server2]
candidate_master=1
check_repl_delay=0
hostname=10.10.10.82
port=3306
[server3]
hostname=10.10.10.83
port=3306
注意dos2unix app1.cnf



+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

【配置文件详解】

[server default]
#设置manager的工作目录
manager_workdir=/var/log/masterha/app1
#设置manager的日志
manager_log=/var/log/masterha/app1/manager.log 
#设置master 保存binlog的位置,以便MHA可以找到master的日志,我这里的也就是mysql的数据目录
master_binlog_dir=/data/mysql
#设置自动failover时候的切换脚本
master_ip_failover_script= /usr/local/bin/master_ip_failover
#设置手动切换时候的切换脚本
master_ip_online_change_script= /usr/local/bin/master_ip_online_change
#设置mysql中root用户的密码,这个密码是前文中创建监控用户的那个密码
password=123456
#设置监控用户root
user=root
#设置监控主库,发送ping包的时间间隔,尝试三次没有回应的时候自动进行failover
ping_interval=1
#设置远端mysql在发生切换时binlog的保存位置
remote_workdir=/tmp
#设置复制用户的密码
repl_password=123456
#设置复制环境中的复制用户名 
repl_user=rep
#设置发生切换后发送的报警的脚本
report_script=/usr/local/send_report
#一旦MHA到server02的监控之间出现问题,MHA Manager将会尝试从server03登录到server02
secondary_check_script= /usr/local/bin/masterha_secondary_check -s server03 -s server02 --user=root --master_host=server02 --master_ip=192.168.0.50 --master_port=3306
#设置故障发生后关闭故障主机脚本(该脚本的主要作用是关闭主机放在发生脑裂,这里没有使用)
shutdown_script=""
#设置ssh的登录用户名
ssh_user=root 
[server1]
hostname=10.10.10.81
port=3306
[server2]
hostname=10.10.10.82
port=3306
#设置为候选master,如果设置该参数以后,发生主从切换以后将会将此从库提升为主库,即使这个主库不是集群中事件最新的slave
candidate_master=1
#默认情况下如果一个slave落后master 100M的relay logs的话,MHA将不会选择该slave作为一个新的master,因为对于这个slave的恢复需要花费很长时间,通过设置check_repl_delay=0,MHA触发切换在选择一个新的master的时候将会忽略复制延时,这个参数对于设置了candidate_master=1的主机非常有用,因为这个候选主在切换的过程中一定是新的master
check_repl_delay=0

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++



配置ssh信任(所有节点)

#创建秘钥对

[root@mysql-db01 ~]# ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa >/dev/null 2>&1

#发送公钥,包括自己

[root@mysql-db01 ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@10.10.10.81

[root@mysql-db01 ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@10.10.10.82

[root@mysql-db01 ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@10.10.10.83




启动测试

#测试ssh

[root@mysql-db03 ~]# masterha_check_ssh --conf=/etc/mha/app1.cnf

#看到如下字样,则测试成功

 - [info] All SSH connection tests passed successfully.

#测试复制

[root@mysql-db03 ~]# masterha_check_repl --conf=/etc/mha/app1.cnf

#看到如下字样,则测试成功

MySQL Replication Health is OK.

4.6启动MHA

#启动

[root@mysql-db03 ~]# nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/mha/app1/manager.log 2>&1 &






IP漂移的两种方式

通过keepalived的方式,管理虚拟IP的漂移

通过MHA自带脚本方式,管理虚拟IP的漂移

#MHA脚本方式

#修改配置文件

#编辑配置文件

[root@mysql-db03 ~]# vim /etc/mha/app1.cnf

#在[server default]标签下添加

[server default]

#使用MHA自带脚本

master_ip_failover_script=/usr/local/bin/master_ip_failover

#编辑脚本

#根据配置文件中脚本路径编辑

[root@mysql-db03 ~]# vim /etc/mha/master_ip_failover

#修改以下几行内容

my $vip = '10.10.10.85/24';

my $key = '0';

my $ssh_start_vip = "/sbin/ifconfig ens37:$key $vip";

my $ssh_stop_vip = "/sbin/ifconfig ens37:$key down"; 

#添加执行权限,否则mha无法启动

[root@mysql-db03 ~]# chmod +x /etc/mha/master_ip_failover

5.2.3手动绑定VIP

#绑定vip

[root@mysql-db01 ~]# ifconfig ens37:0 10.10.10.85/24

#查看vip

[root@mysql-db01 ~]# ip a |grep ens37

2: ens37: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000

    inet 10.10.10.81/24 brd 10.10.10.255 scope global ens37

inet 10.10.10..85/24 brd 10.10.10.255 scope global secondary ens37:0







注意点:


主节点停掉后 ,MHA会停掉


旧主节点要启动后通过查询以下内容可以找到 文件号以及地址


grep -i "change master to "  /var/log/mha/app1/manager.log

可以找到信息,修改下密码,然后start slave,旧主库就会恢复


注意

/etc/mha/app1.cnf文件内容会改变,启动前应该加上

[server default]
manager_log=/var/log/mha/app1/manager.log
manager_workdir=/var/log/mha/app1
master_binlog_dir=/usr/local/mysql/data
user=mha
password=mha
ping_interval=2
repl_password=123456
repl_user=rep
ssh_user=root
[server1]
hostname=10.10.10.81
port=3306
[server2]
candidate_master=1
check_repl_delay=0
hostname=10.10.10.82
port=3306
[server3]
hostname=10.10.10.83
port=3306
如果用了failover了
[root@mysql-db03 bin]# more /etc/mha/app1.cnf
[server default]
manager_log=/var/log/mha/app1/manager.log
manager_workdir=/var/log/mha/app1
master_binlog_dir=/usr/local/mysql/data
master_ip_failover_script=/usr/local/bin/master_ip_failover   ---这个需要放在这里
password=mha
ping_interval=2
repl_password=123456
repl_user=rep
ssh_user=root
user=mha
[server1]
hostname=10.10.10.81
port=3306
[server2]
candidate_master=1
check_repl_delay=0
hostname=10.10.10.82
port=3306
[server3]
hostname=10.10.10.83
port=3306




然后再启动mgr

nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/mha/app1/manager.log 2>&1 &


优秀的mha文档

https://www.cnblogs.com/keerya/p/7883766.html