部署Redis集群_服务器

管理节点：
m(Manager:192168120)
缓存节点：
redis1(redis1:192168111) 、redis2(redis2:192168112)、redis3(redis3:192168113)、 redis4(redis4:192168114)、redis5(redis5:192168115)、 redis6(redis6:192168116)

Redis Cluster 集群分区方案采用去中心化的方式，包括：sharding（分区）、replication（复制）、failover（故障转移）

Redis Cluster 由多个Redis节点组构成，是一个P2P（point to point）无中心节点的集群架构，依靠Gossip协议传播集群

Gossip协议是一个通信协议，一种传播消息的方式。

起源于：病毒传播

Gossip协议基本思想：

一个节点周期性(每秒)随机选择一些节点，并把信息传递给这些节点。

这些收到信息的节点接下来会做同样的事情，即把这些信息传递给其他一些随机选择的节点。

信息会周期性的传递给N个目标节点。这个N被称为 fanout （扇出）

gossip协议包含多种消息，包括meet、ping、pong、fail、publish等等

通过gossip协议，cluster可以提供集群间状态同步更新、选举自助failover等重要的集群功能。

redis-cluster把所有的物理节点映射到[0-16383]个 slot 上,基本上采用平均分配和连续分配的方式。

比如上图中有5个节点，这样在 Redis Cluster 创建时，slot槽可按下表分配

cluster 负责维护节点和slot槽的对应关系 value------>slot-------->节点

当需要在 Redis 集群中放置一个 key-value 时，redis 先对 key 使用 crc16 算法算出一个结果，然后把
结果对 16384 求余数，这样每个 key 都会对应一个编号在 0-16383 之间的哈希槽，redis 会根据节点
数量大致均等的将哈希槽映射到不同的节点。

比如：
set name zhangsan
hash("name")采用crc16算法，得到值：1324203551%16384=15903
根据上表15903在13088-16383之间，所以name被存储在Redis5节点。
slot槽必须在节点上连续分配，如果出现不连续的情况，则RedisCluster不能工作。

redis版本说明

redis505

服务器说明

启动 7001、7002、7003、7011、7012、7013

配置启动脚本

三主三从

客户端连接集群

-c 以集群方式连接

扩容节点数据必须为空

启动 7004、7014

将 7004、7014 添加到集群

只能删除数据为空的节点

集群中的每个节点都会定期地（每秒）向集群中的其他节点发送PIN

如果在一定时间内(cluster-node-timeout)，发送ping的节点A没有收到某节点B的pong回应，则A将B
标识为pfail。

A在后续发送ping时，会带上B的pfail信息，通知给其他节点。

如果B被标记为pfail的个数大于集群主节点个数的一半（N/2 + 1）时，B会被标记为fail，A向整个集群
广播，该节点已经下线

其他节点收到广播，标记B为fail。

采用 raft 协议

每个从节点，都根据自己对master复制数据的offset，来设置一个选举时间，offset越大（复制数
据越多）的从节点，选举时间越靠前，优先进行选举。

slave 通过向其他master发送FAILVOER_AUTH_REQUEST 消息发起竞选，

master 收到后回复FAILOVER_AUTH_ACK 消息告知是否同意。

slave 发送FAILOVER_AUTH_REQUEST 前会将currentEpoch 自增，并将最新的Epoch 带入到

FAILOVER_AUTH_REQUEST 消息中，如果自己未投过票，则回复同意，否则回复拒绝。

所有的 Master 开始slave选举投票，给要进行选举的slave进行投票，如果大部分master node（N/2 +
1）都投票给了某个从节点，那么选举通过，那个从节点可以切换成master。

RedisCluster失效的判定 ：

1、集群中半数以上的主节点都宕机（无法投票）

2、宕机的主节点的从节点也宕机了（slot槽分配不连续）

当slave 收到过半的master 同意时，会成为新的master。此时会以最新的Epoch 通过PONG 消息广播
自己成为master，让Cluster 的其他节点尽快的更新拓扑结构(nodeconf)。

自动切换

就是上面讲的从节点选举

手动切换

人工故障切换是预期的 *** 作，而非发生了真正的故障，目的是以一种安全的方式(数据无丢失)将当前
master节点和其中一个slave节点(执行cluster-failover的节点)交换角色

1、向从节点发送cluster failover 命令（slaveof no one）
2、从节点告知其主节点要进行手动切换（CLUSTERMSG_TYPE_MFSTART）
3、主节点会阻塞所有客户端命令的执行（10s）
4、从节点从主节点的ping包中获得主节点的复制偏移量
5、从节点复制达到偏移量，发起选举、统计选票、赢得选举、升级为主节点并更新配置
6、切换完成后，原主节点向所有客户端发送moved指令重定向到新的主节点

以上是在主节点在线情况下。

如果主节点下线了，则采用cluster failover force或cluster failover takeover 进行强制切换。

我们知道在一主一从的情况下，如果主从同时挂了，那整个集群就挂了。
为了避免这种情况我们可以做一主多从，但这样成本就增加了。
Redis提供了一种方法叫副本漂移，这种方法既能提高集群的可靠性又不用增加太多的从机。

Master1宕机，则Slaver11提升为新的Master1
集群检测到新的Master1是单点的（无从机）
集群从拥有最多的从机的节点组（Master3）中，选择节点名称字母顺序最小的从机（Slaver31）漂移
到单点的主从节点组(Master1)。

具体流程如下（以上图为例）：
1、将Slaver31的从机记录从Master3中删除
2、将Slaver31的的主机改为Master1
3、在Master1中添加Slaver31为从节点
4、将Slaver31的复制源改为Master1
5、通过ping包将信息同步到集群的其他节点

>在Redis中，实现高可用的技术主要包括持久化、复制、哨兵和集群，下面简单说说它们的作用，以及解决了什么样的问题：

持久化：持久化是最简单的高可用方法。它的主要作用是数据备份，就是将数据存在硬盘上，防止数据因为redis异常而丢失。

复制：复制是高可用 Redis 的基础，哨兵和集群都是在复制基础上实现高可用的。复制跟我们通俗的理解一致，就是从一台机器拷贝到另一台机器。复制主要实现了数据的多机备份以及对于读 *** 作的负载均衡和简单的故障恢复。但是如果发生故障，无法自动恢复。

哨兵：在复制的基础上，哨兵实现了自动化的故障恢复。缺陷是写 *** 作无法负载均衡，存储能力受到单机的限制（在哨兵模式下每台redis服务器都存储相同的数据，很浪费内存）

集群：通过集群，Redis 解决了写 *** 作无法负载均衡以及存储能力受到单机限制的问题，实现了较为完善的高可用方案。

这个问题困扰了一个下午没有解决，百度的乱七八糟每一个有用的，最后在Stack Overflow找到问题答案，特此总结一下给大家，节省时间，珍爱生命。

2你的redis几个节点里面需要加入配置 protected-mode no。关闭保护模式。
如图：

3是否已经启动节点，这个可以再服务中查看

4几个节点的服务器地址是否可以互相telnet通

5服务器的防火墙是否关闭，或者端口号是否开通

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/zz/12716072.html

部署Redis集群

发表评论

评论列表（0条）