共计 3776 个字符,预计需要花费 10 分钟才能阅读完成。
Redis-Sentinel 是 Redis 官方推荐的高可用性 (HA) 解决方案,当用 Redis 做 Master-slave 的高可用方案时,假如 master 宕机了,Redis 本身 (包括它的很多客户端) 都没有实现自动进行主备切换,而 Redis-sentinel 本身也是一个独立运行的进程,它能监控多个 master-slave 集群,发现 master 宕机后能进行自动切换。
它的主要功能有以下几点
不时地监控 redis 是否按照预期良好地运行; 如果发现某个 redis 节点运行出现状况,能够通知另外一个进程 (例如它的客户端); 能够进行自动切换。当一个 master 节点不可用时,能够选举出 master 的多个 slave(如果有超过一个 slave 的话) 中的一个来作为新的 master, 其它的 slave 节点会将它所追随的 master 的地址改为被提升为 master 的 slave 的新地址
1. 集群规划
172.16.1.42 6379 Master
172.16.1.43 6379 Slave1
172.16.1.43 6380 Slave2
2. 集群配置
2.1 安装 reids
# yum install gcc gcc-c++ tcl
# cd /opt/redis/
# tar xvf redis-3.2.8.tar.gz
# cd redis-3.2.8
# make install
# make test
# cd utils/
# 初始化数据
# ./install_server.sh
2.2 配置并启动 redisMaster:
# vim master.conf
port 6379
bind 0.0.0.0
masterauth 123456
requirepass 123456
slave-read-only yes
# 启动
# redis-server /etc/redis/master.conf
Slave1:
# vim slave1.conf
port 6379
bind 0.0.0.0
slaveof 172.16.1.42 6379
masterauth 123456
requirepass 123456
slave-read-only yes
protected-mode no
# 启动
# redis-server slave1.conf
Slave2:
# vim slave2.conf
port 6379
bind 0.0.0.0
slaveof 172.16.1.42 6379
masterauth 123456
requirepass 123456
slave-read-only yes
protected-mode no
# 启动
# redis-server slave2.conf
3. 验证主从复制
Master:
[root@localhost redis]# redis-cli -a 123456 -p 6379
127.0.0.1:6379> set name1 zhangsan
OK
Slave1:
[root@localhost ~]# redis-cli -p 6379
127.0.0.1:6379> auth 123456
OK
127.0.0.1:6379> get name1
“zhangsan”
Slave2:
[root@localhost ~]# redis-cli -a 123456 -p 6380
127.0.0.1:6380> get name1
“zhangsan”
4. 主从切换(Redis Sentinel)
Redis Sentinel
Sentinel(哨兵)是用于监控 redis 集群中 Master 状态的工具
4.1 Sentinel 作用 Master 状态检测如果 Master 异常,则会进行 Master-Slave 切换,将其中一个 Slave 作为 Master,将之前的 Master 作为 SlaveMaster-Slave 切换后,master_redis.conf、slave_redis.conf 和 sentinel.conf 的内容都会发生改变,即 master_redis.conf 中会多一行 slaveof 的配置,sentinel.conf 的监控目标会随之调换 4.2 Sentinel 工作方式:每个 Sentinel 以每秒钟一次的频率向它所知的 Master,Slave 以及其他 Sentinel 实例发送一个 PING 命令如果一个实例(instance)距离最后一次有效回复 PING 命令的时间超过 down-after-milliseconds 选项所指定的值,则这个实例会被 Sentinel 标记为主观下线。
如果一个 Master 被标记为主观下线,则正在监视这个 Master 的所有 Sentinel 要以每秒一次的频率确认 Master 的确进入了主观下线状态。
当有足够数量的 Sentinel(大于等于配置文件指定的值)在指定的时间范围内确认 Master 的确进入了主观下线状态,则 Master 会被标记为客观下线
在一般情况下,每个 Sentinel 会以每 10 秒一次的频率向它已知的所有 Master,Slave 发送 INFO 命令
当 Master 被 Sentinel 标记为客观下线时,Sentinel 向下线的 Master 的所有 Slave 发送 INFO 命令的频率会从 10 秒一次改为每秒一次
若没有足够数量的 Sentinel 同意 Master 已经下线,Master 的客观下线状态就会被移除。
若 Master 重新向 Sentinel 的 PING 命令返回有效回复,Master 的主观下线状态就会被移除。
主观下线和客观下线
主观下线:Subjectively Down,简称 SDOWN,指的是当前 Sentinel 实例对某个 redis 服务器做出的下线判断。客观下线:Objectively Down,简称 ODOWN,指的是多个 Sentinel 实例在对 Master Server 做出 SDOWN 判断,并且通过 SENTINEL is-master-down-by-addr 命令互相交流之后,得出的 Master Server 下线判断,然后开启 failover.
SDOWN 适合于 Master 和 Slave,只要一个 Sentinel 发现 Master 进入了 ODOWN,这个 Sentinel 就可能会被其他 Sentinel 推选出,并对下线的主服务器执行自动故障迁移操作。
ODOWN 只适用于 Master,对于 Slave 的 Redis 实例,Sentinel 在将它们判断为下线前不需要进行协商,所以 Slave 的 Sentinel 永远不会达到 ODOWN。
4.3 配置
1:指定监听 Master(三个节点)
所有节点都需要运行,所有节点配置一样,且必须启动
# vim /etc/redis/sentinel.conf(可以从安装包里面找到这个文件)
protected-mode no
logfile “/mejust/logs/sentinel.log”
port 26379
dir “/tmp”
sentinel monitor mymaster 172.16.1.42 6379 2
sentinel down-after-milliseconds mymaster 5000
sentinel failover-timeout mymaster 60000
sentinel auth-pass mymaster !@#123mejust.com
上面配置文件说明如下:
第二行指定 sentinel 端口号第五行指定 Sentinel 去监视一个名为 mymaster 的 Master,Master 的 IP 地址为 172.16.1.42,端口号为 6379,最后的 2 表示当有 2 个 Sentinel 检测到 Master 异常时才会判定其失效,即只有当 2 个 Sentinel 都判定 Master 失效了才会自动迁移,如果 Sentinel 的数量不达标,则不会执行自动故障迁移。
第六行指定 Sentinel 判定 Master 断线的时间。(单位为毫秒,判定为主观下线 SDOWN)
第七行指定在执行故障转移时,最多可以有多少个 Slave 同时对新的 Master 进行同步。这个数字设置为 1,虽然完成故障转移所需的时间会变长,但是可以保证每次只有 1 个 Slave 处于不能处理命令请求的状态
2:启动 sentinel(三个节点):
# redis-sentinel /etc/redis/sentinel.conf
3:设置开机启动(三个节点)
# echo“/opt/redis/src/redis-sentinel /main/redis/sentinel.conf”>> /etc/rc.local
4.4 注意点首次启动时,必须先启动 MasterSentinel 只在 server 端做主从切换,app 端要自己开发(例如 Jedis 库的 SentinelJedis,能够监控 Sentinel 的状态)
若 Master 已经被判定为下线,Sentinel 已经选择了新的 Master,也已经将 old Master 改成 Slave,但是还没有将其改成 new Master。若此时重启 old Master,则 Redis 集群将处于无 Master 状态,此时只能手动修改配置文件,然后重新启动集群
5. 集群状态
返回结构是 PONG,则表示服务运行正常
127.0.0.1:6379> ping
PONG
127.0.0.1:6379> info Replication
查看 sentine 状态
[root@localhost log]# redis-cli -p 26379
127.0.0.1:26379> info
主从切换:
127.0.0.1:26379> slaveof NO ONE