乐趣区

Redis-集群教程

Redis 集群教程
本文档是 Redis 集群的一般介绍,没有涉及复杂难懂的分布式概念的赘述,只是提供了从用户角度来如何搭建测试以及使用的方法,如果你打算使用并深入了解 Redis 集群,推荐阅读完本章节后, 仔细阅读 Redis 集群规范 一章。
本教程试图提供最终用户一个简单的关于集群和一致性特征的描述
请注意,本教程使用于 Redis3.0(包括 3.0)以上版本
如果你计划部署集群,那么我们建议你从阅读这个文档开始。
Redis 集群介绍
Redis 集群是一个提供在多个 Redis 间节点间共享数据的程序集。
Redis 集群并不支持处理多个 keys 的命令, 因为这需要在不同的节点间移动数据, 从而达不到像 Redis 那样的性能, 在高负载的情况下可能会导致不可预料的错误.
Redis 集群通过分区来提供一定程度的可用性, 在实际环境中当某个节点宕机或者不可达的情况下继续处理命令. Redis 集群的优势:
自动分割数据到不同的节点上。
整个集群的部分节点失败或者不可达的情况下能够继续处理命令。
Redis 集群的数据分片
Redis 集群没有使用一致性 hash, 而是引入了 哈希槽的概念.
Redis 集群有 16384 个哈希槽, 每个 key 通过 CRC16 校验后对 16384 取模来决定放置哪个槽. 集群的每个节点负责一部分 hash 槽, 举个例子, 比如当前集群有 3 个节点, 那么:
节点 A 包含 0 到 5500 号哈希槽.
节点 B 包含 5501 到 11000 号哈希槽.
节点 C 包含 11001 到 16384 号哈希槽.
这种结构很容易添加或者删除节点. 比如如果我想新添加个节点 D, 我需要从节点 A, B, C 中得部分槽到 D 上. 如果我想移除节点 A, 需要将 A 中的槽移到 B 和 C 节点上, 然后将没有任何槽的 A 节点从集群中移除即可. 由于从一个节点将哈希槽移动到另一个节点并不会停止服务, 所以无论添加删除或者改变某个节点的哈希槽的数量都不会造成集群不可用的状态.
Redis 集群的主从复制模型
为了使在部分节点失败或者大部分节点无法通信的情况下集群仍然可用,所以集群使用了主从复制模型, 每个节点都会有 N - 1 个复制品.
在我们例子中具有 A,B,C 三个节点的集群, 在没有复制模型的情况下, 如果节点 B 失败了,那么整个集群就会以为缺少 5501-11000 这个范围的槽而不可用.
然而如果在集群创建的时候(或者过一段时间)我们为每个节点添加一个从节点 A1,B1,C1, 那么整个集群便有三个 master 节点和三个 slave 节点组成,这样在节点 B 失败后,集群便会选举 B1 为新的主节点继续服务,整个集群便不会因为槽找不到而不可用了
不过当 B 和 B1 都失败后,集群是不可用的.
Redis 一致性保证
Redis 并不能保证数据的强一致性. 这意味这在实际中集群在特定的条件下可能会丢失写操作.
第一个原因是因为集群是用了异步复制. 写操作过程:
客户端向主节点 B 写入一条命令.
主节点 B 向客户端回复命令状态.
主节点将写操作复制给他得从节点 B1, B2 和 B3.
主节点对命令的复制工作发生在返回命令回复之后,因为如果每次处理命令请求都需要等待复制操作完成的话,那么主节点处理命令请求的速度将极大地降低 —— 我们必须在性能和一致性之间做出权衡。注意:Redis 集群可能会在将来提供同步写的方法。Redis 集群另外一种可能会丢失命令的情况是集群出现了网络分区,并且一个客户端与至少包括一个主节点在内的少数实例被孤立。
举个例子 假设集群包含 A、B、C、A1、B1、C1 六个节点,其中 A、B、C 为主节点,A1、B1、C1 为 A,B,C 的从节点,还有一个客户端 Z1 假设集群中发生网络分区,那么集群可能会分为两方,大部分的一方包含节点 A、C、A1、B1 和 C1,小部分的一方则包含节点 B 和客户端 Z1 .
Z1 仍然能够向主节点 B 中写入, 如果网络分区发生时间较短, 那么集群将会继续正常运作, 如果分区的时间足够让大部分的一方将 B1 选举为新的 master,那么 Z1 写入 B 中得数据便丢失了.
注意,在网络分裂出现期间,客户端 Z1 可以向主节点 B 发送写命令的最大时间是有限制的,这一时间限制称为节点超时时间(node timeout),是 Redis 集群的一个重要的配置选项:
搭建并使用 Redis 集群
搭建集群的第一件事情我们需要一些运行在 集群模式的 Redis 实例. 这意味这集群并不是由一些普通的 Redis 实例组成的,集群模式需要通过配置启用,开启集群模式后的 Redis 实例便可以使用集群特有的命令和特性了.
下面是一个最少选项的集群的配置文件:
[AppleScript] 纯文本查看 复制代码
?
1
2
3
4
5
port 7000
cluster-enabled yes
cluster-config-file nodes.conf
cluster-node-timeout 5000
appendonly yes
文件中的 cluster-enabled 选项用于开实例的集群模式,而 cluster-conf-file 选项则设定了保存节点配置文件的路径,默认值为 nodes.conf. 节点配置文件无须人为修改,它由 Redis 集群在启动时创建,并在有需要时自动进行更新。
要让集群正常运作至少需要三个主节点,不过在刚开始试用集群功能时,强烈建议使用六个节点:其中三个为主节点,而其余三个则是各个主节点的从节点。
首先,让我们进入一个新目录,并创建六个以端口号为名字的子目录,稍后我们在将每个目录中运行一个 Redis 实例:命令如下:
[AppleScript] 纯文本查看 复制代码
?
1
2
3
mkdir cluster-test
cd cluster-test
mkdir 7000 7001 7002 7003 7004 7005
在文件夹 7000 至 7005 中,各创建一个 redis.conf 文件,文件的内容可以使用上面的示例配置文件,但记得将配置中的端口号从 7000 改为与文件夹名字相同的号码。
从 Redis Github 页面 的 unstable 分支中取出最新的 Redis 源码,编译出可执行文件 redis-server,并将文件复制到 cluster-test 文件夹,然后使用类似以下命令,在每个标签页中打开一个实例:
[AppleScript] 纯文本查看 复制代码
?
1
2
cd 7000
../redis-server ./redis.conf
实例打印的日志显示,因为 nodes.conf 文件不存在,所以每个节点都为它自身指定了一个新的 ID:
[AppleScript] 纯文本查看 复制代码
?
1
[82462] 26 Nov 11:56:55.329 * No cluster configuration found, I’m 97a3a64667477371c4479320d683e4c8db5858b1
实例会一直使用同一个 ID,从而在集群中保持一个独一无二(unique)的名字。
搭建集群
现在我们已经有了六个正在运行中的 Redis 实例,接下来我们需要使用这些实例来创建集群,并为每个节点编写配置文件。
通过使用 Redis 集群命令行工具 redis-trib,编写节点配置文件的工作可以非常容易地完成:redis-trib 位于 Redis 源码的 src 文件夹中,它是一个 Ruby 程序,这个程序通过向实例发送特殊命令来完成创建新集群,检查集群,或者对集群进行重新分片(reshared)等工作。
[AppleScript] 纯文本查看 复制代码
?
1
2
./redis-trib.rb create –replicas 1 127.0.0.1:7000 127.0.0.1:7001 \
127.0.0.1:7002 127.0.0.1:7003 127.0.0.1:7004 127.0.0.1:7005

这个命令在这里用于创建一个新的集群, 选项–replicas 1 表示我们希望为集群中的每个主节点创建一个从节点。
之后跟着的其他参数则是这个集群实例的地址列表,3 个 master3 个 slave redis-trib 会打印出一份预想中的配置给你看,如果你觉得没问题的话,就可以输入 yes,redis-trib 就会将这份配置应用到集群当中, 让各个节点开始互相通讯, 最后可以得到如下信息:
[AppleScript] 纯文本查看 复制代码
?
1
[OK] All 16384 slots covered

这表示集群中的 16384 个槽都有至少一个主节点在处理,集群运作正常。
Creating a Redis Cluster using the create-cluster script
If you don’t want to create a Redis Cluster by configuring and executing individual instances manually as explained above, there is a much simpler system (but you’ll not learn the same amount of operational details).
Just check utils/create-cluster directory in the Redis distribution. There is a script called create-cluster inside (same name as the directory it is contained into), it’s a simple bash script. In order to start a 6 nodes cluster with 3 masters and 3 slaves just type the following commands:
create-cluster start
create-cluster create
Reply to yes in step 2 when the redis-trib utility wants you to accept the cluster layout.
You can now interact with the cluster, the first node will start at port 30001 by default. When you are done, stop the cluster with:
create-cluster stop.
Please read the README inside this directory for more information on how to run the script.
使用集群
Redis 集群现阶段的一个问题是客户端实现很少。
以下是一些我知道的实现:
redis-rb-cluster 是我(@antirez)编写的 Ruby 实现,用于作为其他实现的参考。该实现是对 redis-rb 的一个简单包装,高效地实现了与集群进行通讯所需的最少语义(semantic).
redis-py-cluster 看上去是 redis-rb-cluster 的一个 Python 版本,这个项目有一段时间没有更新了(最后一次提交是在六个月之前),不过可以将这个项目用作学习集群的起点。
流行的 Predis 曾经对早期的 Redis 集群有过一定的支持,但我不确定它对集群的支持是否完整,也不清楚它是否和最新版本的 Redis 集群兼容(因为新版的 Redis 集群将槽的数量从 4k 改为 16k 了).
使用最多的时 java 客户端, Jedis 最近添加了对集群的支持, 详细请查看项目 README 中 Jedis Cluster 部分.
StackExchange.Redis 提供对 C# 的支持 (并且包括大部分 .NET 下面的语言,比如:VB, F# 等等)
thunk-redis 提供对 Node.js 和 io.js 的支持。
Redis unstable 分支中的 redis-cli 程序实现了非常基本的集群支持,可以使用命令 redis-cli -c 来启动。
测试 Redis 集群比较简单的办法就是使用 redis-rb-cluster 或者 redis-cli,接下来我们将使用 redis-cli 为例来进行演示:
[AppleScript] 纯文本查看 复制代码
?
01
02
03
04
05
06
07
08
09
10
11
12
13
$ redis-cli -c -p 7000
redis 127.0.0.1:7000> set foo bar
-> Redirected to slot [12182] located at 127.0.0.1:7002
OK
redis 127.0.0.1:7002> set hello world
-> Redirected to slot [866] located at 127.0.0.1:7000
OK
redis 127.0.0.1:7000> get foo
-> Redirected to slot [12182] located at 127.0.0.1:7002
“bar”
redis 127.0.0.1:7000> get hello
-> Redirected to slot [866] located at 127.0.0.1:7000
“world”

注意: 如果你是使用脚本创建的集群节点,那么默认端口可能是从 30001 开始。
redis-cli 对集群的支持是非常基本的,所以它总是依靠 Redis 集群节点来将它转向(redirect)至正确的节点。一个真正的(serious)集群客户端应该做得比这更好:它应该用缓存记录起哈希槽与节点地址之间的映射(map),从而直接将命令发送到正确的节点上面。这种映射只会在集群的配置出现某些修改时变化,比如说,在一次故障转移(failover)之后,或者系统管理员通过添加节点或移除节点来修改了集群的布局(layout)之后,诸如此类。
使用 redis-rb-cluster 写一个例子
在展示如何使用集群进行故障转移、重新分片等操作之前,我们需要创建一个示例应用,了解一些与 Redis 集群客户端进行交互的基本方法。
在运行示例应用的过程中,我们会尝试让节点进入失效状态,又或者开始一次重新分片,以此来观察 Redis 集群在真实世界运行时的表现,并且为了让这个示例尽可能地有用,我们会让这个应用向集群进行写操作。
本节将通过两个示例应用来展示 redis-rb-cluster 的基本用法,以下是本节的第一个示例应用,它是一个名为 example.rb 的文件,包含在 redis-rb-cluster 项目里面
[AppleScript] 纯文本查看 复制代码
?
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
require ‘./cluster’

startup_nodes = [

 {:host => "127.0.0.1", :port => 7000},
 {:host => "127.0.0.1", :port => 7001}

]
rc = RedisCluster.new(startup_nodes,32,:timeout => 0.1)

last = false

while not last

begin
    last = rc.get("__last__")
    last = 0 if !last
rescue => e
    puts "error #{e.to_s}"
    sleep 1
end

end

((last.to_i+1)..1000000000).each{|x|

begin
    rc.set("foo#{x}",x)
    puts rc.get("foo#{x}")
    rc.set("__last__",x)
rescue => e
    puts "error #{e.to_s}"
end
sleep 0.1

}

这个应用所做的工作非常简单:它不断地以 foo<number> 为键,number 为值,使用 SET 命令向数据库设置键值对:
[AppleScript] 纯文本查看 复制代码
?
1
2
3
4
SET foo0 0
SET foo1 1
SET foo2 2
And so forth…

代码中的每个集群操作都使用一个 begin 和 rescue 代码块(block)包裹着,因为我们希望在代码出错时,将错误打印到终端上面,而不希望应用因为异常(exception)而退出。
代码的第七行是代码中第一个有趣的地方,它创建了一个 Redis 集群对象,其中创建对象所使用的参数及其意义如下:第一个参数是记录了启动节点的 startup_nodes 列表,列表中包含了两个集群节点的地址。第二个参数指定了对于集群中的各个不同的节点,Redis 集群对象可以获得的最大连接数,第三个参数 timeout 指定了一个命令在执行多久之后,才会被看作是执行失败。
启动列表中并不需要包含所有集群节点的地址,但这些地址中至少要有一个是有效的:一旦 redis-rb-cluster 成功连接上集群中的某个节点时,集群节点列表就会被自动更新,任何真正的的集群客户端都应该这样做。
现在,程序创建的 Redis 集群对象实例被保存到 rc 变量里面,我们可以将这个对象当作普通 Redis 对象实例来使用。
在十一至十九行,我们先尝试阅读计数器中的值,如果计数器不存在的话,我们才将计数器初始化为 0:通过将计数值保存到 Redis 的计数器里面,我们可以在示例重启之后,仍然继续之前的执行过程,而不必每次重启之后都从 foo0 开始重新设置键值对。为了让程序在集群下线的情况下,仍然不断地尝试读取计数器的值,我们将读取操作包含在了一个 while 循环里面,一般的应用程序并不需要如此小心。
二十一至三十行是程序的主循环,这个循环负责设置键值对,并在设置出错时打印错误信息。程序在主循环的末尾添加了一个 sleep 调用,让写操作的执行速度变慢,帮助执行示例的人更容易看清程序的输出。执行 example.rb 程序将产生以下输出:
[AppleScript] 纯文本查看 复制代码
?
01
02
03
04
05
06
07
08
09
10
11
ruby ./example.rb
1
2
3
4
5
6
7
8
9
^C (I stopped the program here)

这个程序并不是十分有趣,稍后我们就会看到一个更有趣的集群应用示例,不过在此之前,让我们先使用这个示例来演示集群的重新分片操作。
集群重新分片
现在,让我们来试试对集群进行重新分片操作。在执行重新分片的过程中,请让你的 example.rb 程序处于运行状态,这样你就会看到,重新分片并不会对正在运行的集群程序产生任何影响,你也可以考虑将 example.rb 中的 sleep 调用删掉,从而让重新分片操作在近乎真实的写负载下执行 重新分片操作基本上就是将某些节点上的哈希槽移动到另外一些节点上面,和创建集群一样,重新分片也可以使用 redis-trib 程序来执行 执行以下命令可以开始一次重新分片操作:
[AppleScript] 纯文本查看 复制代码
?
1
./redis-trib.rb reshard 127.0.0.1:7000

你只需要指定集群中其中一个节点的地址,redis-trib 就会自动找到集群中的其他节点。
目前 redis-trib 只能在管理员的协助下完成重新分片的工作,要让 redis-trib 自动将哈希槽从一个节点移动到另一个节点,目前来说还做不到
你想移动多少个槽 (从 1 到 16384)?
我们尝试从将 100 个槽重新分片,如果 example.rb 程序一直运行着的话,现在 1000 个槽里面应该有不少键了。
除了移动的哈希槽数量之外,redis-trib 还需要知道重新分片的目标,也即是,负责接收这 1000 个哈希槽的节点。
[AppleScript] 纯文本查看 复制代码
?
1
2
$ redis-cli -p 7000 cluster nodes | grep myself
97a3a64667477371c4479320d683e4c8db5858b1 :0 myself,master – 0 0 0 connected 0-5460

我的目标节点是 97a3a64667477371c4479320d683e4c8db5858b1.
现在需要指定从哪些节点来移动 keys 到目标节点 我输入的是 all,这样就会从其他每个 master 上取一些哈希槽。
最后确认后你将会看到每个 redis-trib 移动的槽的信息,每个 key 的移动的信息也会打印出来 在重新分片的过程中,你的例子程序是不会受到影响的, 你可以停止或者重新启动多次。
在重新分片结束后你可以通过如下命令检查集群状态:
更多技术资讯可关注:gzitcast

退出移动版