Redis集群

缺点：原来规划好的节点，进行扩容或者缩容就比较麻烦了额，不管扩缩，每次数据变动导致节点有变动，映射关系需要重新进行计算，在服务器个数固定不变时没有问题，如果需要弹性扩容或故障停机的情况下，原来的取模公式就会发生变化：Hash(key)/3会变成Hash(key)/?。此时地址经过取余运算的结果将发生很大变化，根据公式获取的服务器也会变得不可控。?

2、一致性哈希算法分区

提出一致性Hash解决方案。目的是当服务器个数发生变动时，尽量减少影响客户端到服务器的映射关系。

步骤：1、算法构建一致性哈希环? ? ? 2、服务器IP节点映射? ? ? 3、key落到服务器的落键规则

算法构建一致性哈希环

一致性哈希算法必然有个hash函数并按照算法产生hash值，这个算法的所有可能哈希值会构成一个全量集，这个集合可以成为一个hash空间[0,2^32-1]，这个是一个线性空间，但是在算法中，我们通过适当的逻辑控制将它首尾相连(0= 2个32),这样让它逻辑上形成了一个环形空间。

服务器IP节点映射

将集群中各个IP节点映射到环上的某一个位置。将各个服务器使用Hash进行一个哈希，具体可以选择服务器的IP或主机名作为关键字进行哈希，这样每台机器就能确定其在哈希环上的位置。假如4个节点NodeA、B、C、D，经过IP地址的哈希函数计算(hash(ip))，使用IP地址哈希后在环空间的位置如下:

key落到服务器的落键规则

当我们需要存储一个kv键值对时，首先计算key的hash值，hash(key)，将这个key使用相同的函数Hash计算出哈希值并确定此数据在环上的位置，从此位置沿环顺时针“行走”，第一台遇到的服务器就是其应该定位到的服务器，并将该键值对存储在该节点上。

如我们有Object A、Object B、object C. object D四个数据对象，经过哈希计算后,
在环空间上的位置如下:根据一致性Hash算法，数据A会被定为到Node A上，B被定为到Node B上，C被定为到Node C上，D被定为到Node D上。

优点：

均衡性：一致性哈希算法能够将节点均匀地映射到哈希环上，从而实现负载均衡。在增加或删除节点时，只会影响到相邻的节点，对整体的影响较小，使得系统能够快速适应节点变化。
扩展性：由于哈希环的结构，一致性哈希算法能够有效地支持节点的动态扩展和收缩。当增加或删除节点时，只需要重新映射受影响的数据，而不需要重新分配所有数据，降低了数据迁移的成本。
缓存友好：一致性哈希算法在分布式缓存系统中应用广泛。由于节点的增加或删除只会影响到少部分数据，缓存的命中率相对较高，减少了缓存失效带来的性能损失。
容错性：一致性哈希算法通过将数据复制到多个节点来提高系统的容错性。当某个节点故障时，数据可以自动转移到其他节点上，保证系统的可用性。

缺点：

数据倾斜：由于哈希函数的输出可能存在冲突，一致性哈希算法在某些情况下可能导致数据倾斜。部分节点可能会负载过重，而其他节点负载较轻。为了解决这个问题，可以引入虚拟节点来增加哈希的离散性，使得数据更均匀地映射到节点上。
节点增删复杂性：当节点增加或删除时，会导致部分数据需要重新映射和迁移，可能会对系统的稳定性和性能造成一定的影响。为了减少这种影响，可以采用渐进式增删策略，逐渐迁移数据，避免一次性的大规模数据迁移。

3、哈希槽分区算法

为了解决均匀分配的问题，在数据和节点之间又加入了一层，把这层称为哈希槽(slot)，用于管理数据和节点之间的关系，现在就相当于节点上放的槽，槽里放的是数据。

槽解决的是粒度问题，相当于把粒度变大了，这样便于数据移动。哈希解决的是映射问题，使用key的哈希值来计算所在的槽，便于数据分配。

一个集群只能有16384个槽，编号0-16383(0-2^14-1)。这些槽会分配给集群中的所有主节点，分配策略没有要求。
集群会记录节点和槽的对应关系，解决了节点和槽的关系后，接下来就需要对key求哈希值，然后对16384取模，余数是几key就落入对应的槽里。HASH_SLOT = CRC16(key) mod 16384。以槽为单位移动数据，因为槽的数目是固定的，处理起来比较容易，这样数据移动问题就解决了。

面试题：为什么redis集群的最大槽数是16384个(2^14)而不是65536(2^16)个?

(1)如果槽位为65536，发送心跳信息的消息头达8k，发送的心跳包过于庞大。
在消息头中最占空间的是myslots[CLUSTER_SLOTS/8]。当槽位为65536时，这块的大小是:65536:8÷1024=8kb

在消息头中最占空间的是myslots[CLUSTER_SLOTS/8]。当槽位为16384时，这块的大小是:16384:8÷1024=2kb
因为每秒钟，redis节点需要发送一定数量的ping消息作为心跳包，如果槽位为65536，这个ping消息的消息头太大了，浪费带宽。

(2)redis的集群主节点数量基本不可能超过1000个。
集群节点越多，心跳包的消息体内携带的数据越多。如果节点过1000个，也会导致网络拥堵。因此redis作者不建议redis cluster节点数量超过1000个。那么，对于节点数在1000以内的redis cluster集群，16384个槽位够用了。没有必要拓展到65536个。

(3)槽位越小，节点少的情况下，压缩比高，容易传输
Redis主节点的配置信息中它所负责的哈希槽是通过一张bitmap的形式来保存的，在传输过程中会对bitmap进行压缩，但是如果bitmap的填充率slots / N很高的话(N表示节点数)， bitmap的压缩率就很低。如果节点数很少，而哈希槽数量很多的话，bitmap的压缩率就很低。

Redis集群不能保证其强一致性

Redis集群不能保证其强一致性，可能会出现数据丢失或者不一致的情况。这是因为，Redis集群采用异步复制机制来进行数据同步，而异步复制存在一定的延迟和不确定性，从而导致新的写入请求不能立即被同步和复制到所有节点上。

五、集群搭建

集群搭建设计图

1、3主3从redis集群配置

配置3台虚拟机，每台配置一主一从

修改redis主机配置文件：/myredis/cluster/redisCluster6381.conf

bind 0.0.0.0
daemonize yes
protected-mode no
port 6381
logfile "/myredis/cluster/cluster6381.log"
pidfile /myredis/cluster6381.pid
dir /myredis/cluster
dbfilename dump6381.rdb
appendonly yes
appendfilename "appendonly6381.aof"
requirepass 111111
masterauth 111111

cluster-enabled yes
cluster-config-file nodes-6381.conf
cluster-node-timeout 5000

bind：指定Redis服务绑定的IP地址。在本例中，使用0.0.0.0表示服务将绑定到所有可用的IPv4地址上。

daemonize：决定Redis是否以守护进程方式运行。当设置为yes时，Redis将在后台运行，不会向终端输出日志信息。

protected-mode：控制Redis是否启用保护模式。当设置为no时，Redis将不会检查访问请求是否来自本地主机。

port：指定Redis服务监听的端口号。在本例中，服务将监听6381端口。

logfile：指定Redis日志文件的路径和文件名。在本例中，日志将写入/myredis/cluster/cluster6381.log文件。

pidfile：指定Redis进程ID文件的路径和文件名。在本例中，文件名为cluster6381.pid。

dir：指定Redis数据库文件和AOF文件所在的目录。在本例中，它们将存储在/myredis/cluster目录下。

dbfilename：指定Redis数据库文件的文件名。在本例中，文件名为dump6381.rdb。

appendonly：决定Redis是否启用AOF持久化。当设置为yes时，Redis将记录所有修改操作，并将其写入AOF文件中。

appendfilename：指定AOF文件的文件名。在本例中，文件名为appendonly6381.aof。

requirepass：设置Redis的访问密码。在本例中，密码为111111。

masterauth：设置Redis主节点的访问密码。在本例中，主节点密码也为111111。

cluster-enabled：决定Redis是否启用集群模式。当设置为yes时，Redis将启用集群模式。

cluster-config-file：指定Redis集群配置文件的路径和文件名。在本例中，文件名为nodes-6381.conf。

cluster-node-timeout：指定Redis集群节点之间的超时时间。在本例中，超时时间为5000毫秒

修改redis从机配置文件：/myredis/cluster/redisCluster6382.conf 添加一下配置

bind 0.0.0.0
daemonize yes
protected-mode no
port 6382
logfile "/myredis/cluster/cluster6382.log"
pidfile /myredis/cluster6382.pid
dir /myredis/cluster
dbfilename dump6382.rdb
appendonly yes
appendfilename "appendonly6382.aof"
requirepass 111111
masterauth 111111

cluster-enabled yes
cluster-config-file nodes-6382.conf
cluster-node-timeout 5000

分别启动6台服务

查看进程看到是以集群的方式开启的

构建主从关系命令

redis-cli -a 111111 --cluster create --cluster-replicas 1 192.168.111.185:6381 192.168.111.185:6382 192.168.111.172:6383 192.168.111.172:6384 192.168.111.184:6385
192.168.111.184:6386

--cluster-replicas 1表示为每个master创建一个slave节点

?创建成功

集群配置号后会产生nodes-conf文件

以6381为切入点查看节点状态

?查看集群节点关系：CLUSTER NODES

2、3主3从redis集群读写

当写入数据时会报这个错误，说明k1要到6385服务器去存储，redis集群需要路由到所在的槽位

解决方法：连接redis时带? -c 参数打开路由

redis-cli -a 111111 -p 6381 -c

?从定向到6385这台redis

3、主从容错切换迁移

?关闭6381查看6384是否上位

进入6382查看主从关系，看到6381主机掉线，6384从机上位

?从新打开6381主机，6381变成了从机

6831宕机重启后变成了从机，如果还想6381变成主机使用一下命令

CLUSTER FAILOVER

4、主从扩容

重新配置一主一从

查看是否启动成功

将新增的6387作为master节点加入原有集群

redis-cli -a密码--cluster add-node自己实际IP地址:6387自己实际IP地址:6381

6387就是将要作为master新增节点
6381就是原来集群节点里面的领路人，相当于6387拜拜6381的码头从而找到组织加入集群

redis-cli -a 111111 --cluster add-node 192.168.111.184:6387 192.168.111.185:6381

?新节点添加成功

从新分配槽位

命令:redis-cli -a密码--cluster reshard IP地址:端口号
redis-cli -a 111111 --cluster reshard 192.168.111.175:6381l

?分配多少槽位，分配主机ID是多少

?检查是否正确分配完成

redis- cli -a 111111 --cluster check 192.168.111.185:6381

为什么6387是3个新的区间，以前的还是连续?
重新分配成本太高，所以前3家各自匀出来一部分，从6381/6382/6383三个旧节点分别匀出1364个坑位给新节点6387

给新主机添加从机

redis-cli -a密码--cluster add-node ip:新slave端口 ip:新master端口--cluster-slave --cluster-master-id新主机节点ID

redis-cli - a 111111 --cluster add-node 192.168.111.184:6388 192.168.111.184.6387

--cluster-slave --cluster-master-id 307a5f6617a6eeb4949f3cb9124edo4c6962c348
?

重新查看主从关系

5、主从缩容

检查集群情况获取从节点6388的节点ID

redis- cli -a 111111 --cluster check 192.168.111.184:6385

?从集群中将节点6388删除

redis-cli -a密码--cluster del-node ip:从机端口从机6388节点ID

将6387的槽位清空，重新分配槽位

redis- cli -a 111111 -- cluster reshard 192.168.111.185:6381

4096个槽位都指给6381，它变成了8192个槽位，相当于全部都给6381了，不然要输入3次?

检查集群情况，此时6381有两个从节点

将6387节点删除

redis-cli -a密码--cluster del-node ip:端口6387节点ID

再检查集群情况、6387和6388被删除

文章来源:https://blog.csdn.net/qi341500/article/details/135034596
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！