使用Redis管道提升性能

jiezi

6 年前

首发于樊浩柏科学院

Redis 的管道（pipelining）是用来打包多条无关命令批量执行，以减少多个命令分别执行带来的网络交互时间。在一些批量操作数据的场景，使用管道可以显著提升 Redis 的读写性能。
原理演示
Redis 的管道实质就是命令打包批量执行，多次网络交互减少到单次。使用管道和不使用管道时的交互过程如下：

我们使用 nc 命令来直观感受下 Redis 管道的使用过程：
# 安装 nc 命令
$ yum install nc
# nc 打包多个命令
$ (printf “PING\r\nPING\r\nPING\r\n”) | nc localhost 6379
# 响应
+PONG
+PONG
+PONG
因此，只要通过管道进行命令打包后，Redis 就可以批量返回命令的执行结果了。
管道的应用
首先，构造示例需要的 Hash 用户数据：
$keyPrex = ‘user:hash:u:’;
for ($i=1; $i<=10000; $i++) {
$redis->hMset($keyPrex.$i, [
‘name’ => name(), //name() 函数生成随机姓名
‘age’ => rand(21, 30),
‘sex’ => rand(0, 1),
‘is_new’ => rand(0, 1)
]);
}
然后，查看导入 Redis 中的数据：
127.0.0.1:6379> keys user:hash:u:*
9997) “user:hash:u:3013”
9998) “user:hash:u:8971”
9999) “user:hash:u:4761”
10000) “user:hash:u:1828”

127.0.0.1:6379> HGETALL user:hash:u:1828
1) “name”
2) “ggrg”
3) “age”
4) “23”
5) “sex”
6) “0”
7) “is_new”
8) “1”
需求
在某个社交活动中，通过一系列筛选逻辑后取得种子用户 uid，然后用这些 uid 去 Hash 获取用户的信息。这种情况下你会怎么来处理呢？
不使用管道
一般情况下，在数据量较小时，我们会直接使用 HGETALL 命令遍历地获取用户数据。
$start = nowTime();
foreach (range(1, 1000) as $id) {
$user[] = $redis->hgetAll($keyPrex.$id);
}
echo ‘ 时间：’, nowTime() – $start, ‘ms’, PHP_EOL;

时间：39ms
执行所用时间：39ms
使用管道
因为通过 uid 批量获取用户数据，各个命令并没有依赖关系，所以可以使用 Redis 的管道来优化查询。
$start = nowTime();
$redis->multi(Redis::PIPELINE);
foreach (range(1, 1000) as $id) {
// 返回资源 id 相同的 socket 资源，并未执行命令
$redis->hgetAll($keyPrex.$id);
}
$user = $redis->exec();
echo ‘ 时间：’, nowTime() – $start, ‘ms’, PHP_EOL;

时间：6ms
使用管道后，执行时间显著地减少为：6ms。使用 tcpdump 抓取打包后的命令如下：
10:45:03.029049 IP localhost.58176 > localhost.6379: Flags [P.], seq 2255478840:2255479211, ack 3144685411, win 342, options [nop,nop,TS val 17640474 ecr 17640474], length 371
E…./@.@.o……….@…o.8.p.c…V…….
,.*2
$7
HGETALL
$13
user:hash:u:1
*2
$7
HGETALL
$13
user:hash:u:2
*2
$7
… …
适用场景
在批量操作（查询和写入）数据时，我们应尽量避免多次跟 Redis 的网络交互。这时，可以使用管道实现，也可以 Redis 内嵌 Lua 脚本实现。需要注意的是：

管道只适用于无因果关联的多命令操作，否则就需要借助 Lua 脚本实现批量操作；
在实际应用中，Redis 往往不可能是单机部署，如果想要在集群中使用管道，可以部署为一主多从架构，此时所有节点的数据都一致，随机选取节点使用管道即可；

总结
在批量获取数据时，尽管使用 Redis 的管道性能会显著提升，但是使用管道时 Redis 会缓存之前命令的结果，最后一并输出给终端，因此所打包的命令不宜太多，否则内存使用会很严重。