MySQL MHA高可用

2024-01-09 21:40:39

目录

一、MHA概述

二、MHA 的组成(工作原理)

三、MHA 的特点

四、搭建MySQL MHA

1、修改 Master、Slave1、Slave2 节点的主机名

2、给 Master、Slave1、Slave2 节点做时间同步

3、修改 Master、Slave1、Slave2 节点的MySQL配置文件

4、在 Master、Slave1、Slave2 节点上都创建两个软链接

5、配置 mysql 一主两从

①所有数据库节点进行 mysql 授权

②在 Master 节点查看二进制文件和同步点

③在 Slave1、Slave2 节点执行同步操作

④在 Slave1、Slave2 节点查看数据同步结果

⑤将两个从库必须设为只读模式

⑥插入数据测试数据库同步

6、安装 MHA 软件

①所有服务器上都安装 MHA 依赖的环境(首先安装 epel 源)

②安装 MHA 软件包,先在所有服务器上必须先安装 node 组件

③在 MHA manager 节点上安装 manager 组件

7、在所有服务器上配置无密码认证

①在 manager 节点上配置到所有数据库节点的无密码认证

②在 mysql1 上配置到数据库节点 mysql2 和 mysql3 的无密码认证

③在 mysql2 上配置到数据库节点 mysql1 和 mysql3 的无密码认证

④在 mysql3 上配置到数据库节点 mysql1 和 mysql2 的无密码认证

8、在 manager 节点上配置 MHA

①在 manager 节点上复制相关脚本到/usr/local/bin 目录

②复制上述的自动切换时 VIP 管理的脚本到 /usr/local/bin 目录,这里使用master_ip_failover脚本来管理 VIP 和故障切换

③修改master_ip_failover脚本内容

④创建 MHA 软件目录并拷贝配置文件,这里使用 mysql_mha.cnf配置文件来管理 mysql 节点服务器

9、第一次配置需要在 Master 节点上手动添加VIP

10、在 manager 节点上测试 ssh 无密码认证,做健康检查

11、在 manager 节点上测试 mysql 主从连接情况

12、在 manager 节点上启动 MHA

五、故障模拟

1、在 manager 节点上监控观察日志记录

2、在 Master 节点 mysql1 上停止mysql服务

六、故障修复步骤

1、重启旧主的mysql服务

2、备份和恢复

3、修复主从


一、MHA概述

MHA(MasterHigh Availability)是一套优秀的MySQL高可用环境下故障切换和主从复制的软件。

MHA 的出现就是解决MySQL 单点的问题。

MySQL故障切换过程中,MHA能做到0-30秒内自动完成故障切换操作。

MHA能在故障切换的过程中最大程度上保证数据的一致性,以达到真正意义上的高可用。

二、MHA 的组成(工作原理)

●MHA Node(数据节点)

? MHA Node 运行在每台 MySQL 服务器上。

●MHA Manager(管理节点)

? MHA Manager 可以单独部署在一台独立的机器上,管理多个 master-slave 集群;也可以部署在一台 slave 节点上。

MHA Manager 会定时探测集群中的 master 节点的运行状态。当 master 出现故障时,它可以自动将最新数据的 slave 提升为新的 master, 然后将所有其他的 slave 重新指向新的 master做主从复制,最大程度保证数据完整性。vip从旧的master转移到新的master上,整个故障转移过程对客户端应用程序完全透明。

三、MHA 的特点

●自动故障切换过程中,MHA试图从宕机的主服务器上保存二进制日志,最大程度的保证数据不丢失

●默认使用半同步复制,可以大大降低数据丢失的风险,如果只有一个slave已经收到了最新的二进制日志,MHA可以将最新的二进制日志应用于其他所有的slave服务器上,因此可以保证所有节点的数据一致性

●目前MHA支持一主多从架构,最少三台服务,即一主两从

四、搭建MySQL MHA

架构:至少需要一主两从,基于主从复制的基础上来实现

MHA manager 节点服务器:192.168.130.50,安装MHA node 和 manager 组件

Master 节点服务器:192.168.130.20,安装mysql、MHA node 组件

Slave1 节点服务器:192.168.130.30,安装mysql、MHA node 组件

Slave2 节点服务器:192.168.130.40,安装mysql、MHA node 组件

准备工作:所有服务器关闭firewalld和setenforce

systemctl disable --now firewalld

setenforce 0

1、修改 Master、Slave1、Slave2 节点的主机名

2、给 Master、Slave1、Slave2 节点做时间同步

使用master服务器做边缘服务器:

给两台slave服务器做时间同步:

3、修改 Master、Slave1、Slave2 节点的MySQL配置文件

vim?/etc/my.cnf

systemctl restart mysql

4、在 Master、Slave1、Slave2 节点上都创建两个软链接

ln -s /usr/local/mysql/bin/mysql /usr/sbin/

ln -s /usr/local/mysql/bin/mysqlbinlog /usr/sbin/

5、配置 mysql 一主两从

①所有数据库节点进行 mysql 授权

mysql -uroot -p123

flush privileges;

②在 Master 节点查看二进制文件和同步点

show master status;

③在 Slave1、Slave2 节点执行同步操作

④在 Slave1、Slave2 节点查看数据同步结果

start slave;

show slave status\G? ? ? ? ? ?#确保 IO 和 SQL 线程都是 Yes,代表同步正常

⑤将两个从库必须设为只读模式

set global read_only=1;

⑥插入数据测试数据库同步

##在 Master 主库插入条数据,测试是否同步##

6、安装 MHA 软件

①所有服务器上都安装 MHA 依赖的环境(首先安装 epel 源)

yum install epel-release --nogpgcheck -y

yum install -y perl-DBD-MySQL \

perl-Config-Tiny \

perl-Log-Dispatch \

perl-Parallel-ForkManager \

perl-ExtUtils-CBuilder \

perl-ExtUtils-MakeMaker \

perl-CPAN

②安装 MHA 软件包,先在所有服务器上必须先安装 node 组件

对于每个操作系统版本不一样,这里 CentOS7.4 必须选择 0.57 版本。

在所有服务器上必须先安装 node 组件,最后在 MHA-manager 节点上安装 manager 组件,因为 manager 依赖 node 组件。

③在 MHA manager 节点上安装 manager 组件

manager 组件安装后在/usr/local/bin 下面会生成几个工具,主要包括以下几个:

masterha_check_ssh? ? ? ? ? ? ? ?检查 MHA 的 SSH 配置状况

masterha_check_repl? ? ? ? ? ? ???检查 MySQL 复制状况

masterha_manger? ? ? ? ? ? ? ? ? ? 启动 manager的脚本

masterha_check_status? ? ? ? ? ?检测当前 MHA 运行状态

masterha_master_monitor? ? ? ?检测 master 是否宕机

masterha_master_switch? ? ? ? ?控制故障转移(自动或者手动)

masterha_conf_host? ? ? ? ? ? ? ? ?添加或删除配置的 server 信息

masterha_stop? ? ? ? ? ? ? ? ? ? ? ? ? 关闭manager

node 组件安装后也会在/usr/local/bin 下面会生成几个脚本(这些工具通常由 MHAManager 的脚本触发,无需人为操作)主要如下:

save_binary_logs? ? ? ? ? ? ?? ?保存和复制 master 的二进制日志

apply_diff_relay_logs? ? ? ? ? ?识别差异的中继日志事件并将其差异的事件应用于其他的 slave

filter_mysqlbinlog? ? ? ? ? ? ? ? 去除不必要的 ROLLBACK 事件(MHA 已不再使用这个工具)

purge_relay_logs? ? ? ? ? ? ? ? ?清除中继日志(不会阻塞 SQL 线程)

7、在所有服务器上配置无密码认证

布置ssh免密登录的目的是为了menager节点能够实现故障转移,通过ssh连接到节点主机上进行相关调用脚本的操作。

先使用yum在所有服务器上安装sshpass工具

①在 manager 节点上配置到所有数据库节点的无密码认证

ssh-keygen -t rsa? ? ? ? ? ? ? ? ?? ?#一路按回车键

vim /etc/ssh/ssh_config

sshpass -p '密码' ssh-copy-id 192.168.130.20

②在 mysql1 上配置到数据库节点 mysql2 和 mysql3 的无密码认证

ssh-keygen -t rsa ? ? ? ? ? ? ? ?? ?#一路按回车键

vim /etc/ssh/ssh_config

③在 mysql2 上配置到数据库节点 mysql1 和 mysql3 的无密码认证

ssh-keygen -t rsa ? ? ? ? ? ? ? ?? ?#一路按回车键

vim /etc/ssh/ssh_config

④在 mysql3 上配置到数据库节点 mysql1 和 mysql2 的无密码认证

ssh-keygen -t rsa ? ? ? ? ? ? ? ?? ?#一路按回车键

vim /etc/ssh/ssh_config

8、在 manager 节点上配置 MHA

①在 manager 节点上复制相关脚本到/usr/local/bin 目录

cp -a?/opt/mha4mysql-manager-0.57/samples/scripts /usr/local/bin

master_ip_failover? ? ? ? ? ? ? ? ?#自动切换时 VIP 管理的脚本

master_ip_online_change? ? ?#在线切换时 VIP 的管理

power_manager? ? ? ? ? ? ? ? ? ? #故障发生后关闭主机的脚本

send_report? ? ? ? ? ? ? ? ? ? ? ? ? ?#因故障切换后发送报警的脚本

②复制上述的自动切换时 VIP 管理的脚本到 /usr/local/bin 目录,这里使用master_ip_failover脚本来管理 VIP 和故障切换

cp /usr/local/bin/scripts/master_ip_failover /usr/local/bin

③修改master_ip_failover脚本内容

vim /usr/local/bin/master_ip_failover

删除原有内容,直接复制并修改vip相关参数。可在拷贝前输入 :set paste 解决vim粘贴乱序问题

#!/usr/bin/env perl
use strict;
use warnings FATAL => 'all';
 
use Getopt::Long;
 
my (
    $command, $orig_master_host, $orig_master_ip,$ssh_user,
    $orig_master_port, $new_master_host, $new_master_ip,$new_master_port,
    $orig_master_ssh_port,$new_master_ssh_port,$new_master_user,$new_master_password
);
 
# 这里定义的虚拟IP配置要注意,这个ip必须要与你自己的集群在同一个网段,否则无效
my $vip = '192.168.130.200/24';
my $key = '1';
# 这里的网卡名称 “ens33” 需要根据你机器的网卡名称进行修改
# 如果多台机器直接的网卡名称不统一,有两种方式,一个是改脚本,二是把网卡名称修改成统一
# 我这边实际情况是修改成统一的网卡名称
my $ssh_start_vip = "sudo /sbin/ifconfig ens33:$key $vip";
my $ssh_stop_vip = "sudo /sbin/ifconfig ens33:$key down";
my $ssh_Bcast_arp= "sudo /sbin/arping -I ens33 -c 3 -A $vip";

GetOptions(
    'command=s'          => \$command,
    'ssh_user=s'         => \$ssh_user,
    'orig_master_host=s' => \$orig_master_host,
    'orig_master_ip=s'   => \$orig_master_ip,
    'orig_master_port=i' => \$orig_master_port,
    'orig_master_ssh_port=i' => \$orig_master_ssh_port,
    'new_master_host=s'  => \$new_master_host,
    'new_master_ip=s'    => \$new_master_ip,
    'new_master_port=i'  => \$new_master_port,
    'new_master_ssh_port' => \$new_master_ssh_port,
    'new_master_user' => \$new_master_user,
    'new_master_password' => \$new_master_password
 
);
 
exit &main();
 
sub main {
    $ssh_user = defined $ssh_user ? $ssh_user : 'root';
    print "\n\nIN SCRIPT TEST====$ssh_user|$ssh_stop_vip==$ssh_user|$ssh_start_vip===\n\n";
 
    if ( $command eq "stop" || $command eq "stopssh" ) {
 
        my $exit_code = 1;
        eval {
            print "Disabling the VIP on old master: $orig_master_host \n";
            &stop_vip();
            $exit_code = 0;
        };
        if ($@) {
            warn "Got Error: $@\n";
            exit $exit_code;
        }
        exit $exit_code;
    }
    elsif ( $command eq "start" ) {
 
        my $exit_code = 10;
        eval {
            print "Enabling the VIP - $vip on the new master - $new_master_host \n";
            &start_vip();
        &start_arp();
            $exit_code = 0;
        };
        if ($@) {
            warn $@;
            exit $exit_code;
        }
        exit $exit_code;
    }
    elsif ( $command eq "status" ) {
        print "Checking the Status of the script.. OK \n";
        exit 0;
    }
    else {
        &usage();
        exit 1;
    }
}
 
sub start_vip() {
    `ssh $ssh_user\@$new_master_host \" $ssh_start_vip \"`;
}
sub stop_vip() {
    `ssh $ssh_user\@$orig_master_host \" $ssh_stop_vip \"`;
}
 
sub start_arp() {
    `ssh $ssh_user\@$new_master_host \" $ssh_Bcast_arp \"`;
}
sub usage {
    print
    "Usage: master_ip_failover --command=start|stop|stopssh|status --ssh_user=user --orig_master_host=host --orig_master_ip=ip --orig_master_port=port --new_master_host=host --new_master_ip=ip --new_master_port=port\n";
}

④创建 MHA 软件目录并拷贝配置文件,这里使用 mysql_mha.cnf配置文件来管理 mysql 节点服务器

#创建相关目录(所有节点创建node工作目录)

mkdir -p /opt/mysql-mha/mha-node

# manager节点

mkdir -p /opt/mysql-mha/mha

#编写配置文件

vim /opt/mysql-mha/mysql_mha.cnf

9、第一次配置需要在 Master 节点上手动添加VIP

ifconfig ens33:1 192.168.130.200/24

10、在 manager 节点上测试 ssh 无密码认证,做健康检查

masterha_check_ssh -conf=/opt/mysql-mha/mysql_mha.cnf

11、在 manager 节点上测试 mysql 主从连接情况

masterha_check_repl -conf=/opt/mysql-mha/mysql_mha.cnf

:如果显示is not ok ,看上面的[warning]和[error]字段的提示信息。

12、在 manager 节点上启动 MHA

nohup masterha_manager \

--conf=/opt/mysql-mha/mysql_mha.cnf \

--remove_dead_master_conf \

--ignore_last_failover < /dev/null > /var/log/mha_manager.log 2>&1 &

注:nohup作用时把后台进程作为守护进程,不会因为窗口关闭而退出

remove_dead_master_conf:该参数代表当发生主从切换后,老的主库的 ip 将会从配置文件中移除

ignore_last_failover:在缺省情况下,如果 MHA 检测到连续发生宕机,且两次宕机间隔不足 8 小时的话,则不会进行 Failover, 之所以这样限制是为了避免 ping-pong 效应。该参数代表忽略上次MHA 触发切换产生的文件,默认情况下,MHA 发生切换后会在 app1.failover.complete 日志文件中记录,下次再次切换的时候如果发现该目录下存在该文件将不允许触发切换,除非在第一次切换后删除该文件,为了方便,这里设置为--ignore_last_failover

//若要关闭 manager 服务,可以使用如下命令。

masterha_stop --conf=/opt/mysql-mha/mysql_mha.cnf

或者可以直接采用 kill 进程 ID 的方式关闭。

五、故障模拟

1、在 manager 节点上监控观察日志记录

tail -f /opt/mysql-mha/manager.log

2、在 Master 节点 mysql1 上停止mysql服务

systemctl stop mysql

或 pkill -9 mysql

总结:

mha在做故障切换时的处理动作

1、将VIP切换到新的主服务器上,其他的从服务器对接新的主服务器做主从复制

2、mha的manager进程会自动退出,并把配置文件中原来的旧主信息删除

故障切换备选主库的算法:

1.一般判断从库的是从(position/GTID)判断优劣,数据有差异,最接近于master的slave,成为备选主。

2.数据一致的情况下,按照配置文件顺序,选择备选主库。

3.设定有权重(candidate_master=1),按照权重强制指定备选主。

(1)默认情况下如果一个slave落后master 100M的relay logs的话,即使有权重,也会失效。

(2)如果check_repl_delay=0的话,即使落后很多日志,也强制选择其为备选主

六、故障修复步骤

1、重启旧主的mysql服务

systemctl restart mysqld

2、备份和恢复

在新主上使用mysqldump命令进行备份,再回到救主上进行恢复,保证两台数据库的数据是一致的

3、修复主从

①在现主库服务器 mysql2 查看二进制文件和同步点

show master status;

②在原主库服务器 mysql1 执行同步操作

change master to master_host='192.168.130.30',master_user='myslave',master_password='123',master_log_file='mysql_bin.0000_lo.000004

③在 manager 节点上修改配置文件 mysql_mha.cnf(再把这个记录添加进去,因为它检测掉失效时候会自动消失)

vim mysql_mha.cnf

④在 manager 节点上启动 MHA

nohup masterha_manager \

--conf=/opt/mysql-mha/mysql_mha.cnf \

--remove_dead_master_conf \

--ignore_last_failover < /dev/null > /var/log/mha_manager.log 2>&1 &

⑤关闭主数据库服务器

文章来源:https://blog.csdn.net/lcy913/article/details/135388505
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。