关于redis:Redis系列之如何高效使用

本文将从避免阻塞和内存节约两个方面介绍如和高效应用 Reids。

应用 Redis 时，咱们须要联合具体业务和 Redis 个性两方面来思考如何设计应用计划。须要两个从两个方面思考：

避免阻塞
节约内存

上面，咱们将就下面两个点开展阐明如何高效正当应用 Redis。

从阻塞章节咱们晓得，引起 Redis 阻塞可能的起因有内因和外因两方面。

缩小简单命令的应用，或者有节制的应用 。上面这些命令能够看做简单命令（工夫复杂度为 O(N) 或者更高）：SETRANGE, GETRANGE, MSET, MGET, MSETNX, HMSET, HMGET, HKEYS,HVALS, HGETALL, HSCAN, LTRIM, LINDEX, SMEMBERS, SUNION, SUNIONSTORE, SDIFF, SDIFFSTORE, ZUNIONSTORE, ZINTERSTORE, SINTER, SINTERSTORE。这些命令当操作的 key 或者 field 过多时将会导致 Redis 过程阻塞。
举例来说，对一个蕴含上十万甚至百万个 field 的hash执行 hgetall 操作，hgetall命令的工夫复杂度为 O(N)，此时 N 页特地大（上十万甚至百万）必然耗时很长。
从这个例子，咱们能够发现至多两个不合理的中央：

这种有大量元素的数据不应该存在，因为，咱们并不能确定什么时候咱们对它执行了简单命令。
如果真的不可躲避超多元素的状况，在获取多个元素或者全量元素时，务必应用 scan 之类命令，且确保每次获取元素数量在肯定范畴，比方 50 等。

防止频繁生成 RDB 和 AOF 重写，尤其是高峰期。失常状况下，Redis 比拟时候缓存类型数据，当然为了保证数据不失落，能够进行导出 RDB 和从新 AOF。但须要确保一下几点：

不要执行 save 等同步命令；
尽量不要在高峰期进行长久化操作；
尽量在从实例上做长久化操作；

如果必须频繁长久化，须要确保如下几点：

保障 CPU、内存短缺，倡议 CPU 和内存留出肯定的 buffer
不要绑定 CPU
防止和 CPU 密集型服务混布
如果多个 Redis 实例部署在同一台机器，留神布局好系统资源，能够思考错峰长久化，防止同时长久化导致系统资源开销霎时突增
零碎尽量不要开启HugePage，避免复制内存页过大而拖慢执行工夫，且会导致长久化期间内存耗费增长

防止单 Redis 实例负载过高。Redis 是单线程服务，当负载过大必然影响整体性能，能够通过如下计划进步读写能力：

能够通过读写拆散，从实例承接局部读申请，来升高主实例压力；
如果读写压力都很大的话，须要思考集群计划。

通常，引起服务的外因无外乎 CPU、内存和网络，导致 Redis 阻塞的起因同样也须要从这几方面去思考。
CPU 竞争 导致 Redis 阻塞的问题起因在阻塞章节曾经具体介绍过，对于解决方案，能够通过以下伎俩来躲避：

过程 CPU 资源竞争，倡议不要和其余多线程 CPU 密集型服务混布，尤其是线上环境。另外，如果流量趋势有稳定的服务，比方有早晚顶峰，倡议不要把流量稳定统一的服务混布。
绑定 CPU，绑定 CPU（设置 CPU 亲和力 affinity）是为了升高 Redis 过程在不同 CPU 来回切换导致缓存命中率降落等引起的性能问题，然而，过程的 CPU 亲和力会继承给子过程，Redis 过程 fork 出的子过程也共享该 CPU。因而，如果须要频繁长久化的 Redis 不倡议绑定 CPU。

缩小内存碎片，失常的碎片率（mem_fragmentation_ratio）在 1.03 左右。然而当存储的数据长短差别较大时，以下场景容易呈现高内存碎片问题：

频繁做更新操作，例如频繁对已存在的键执行 append、setrange 等更新操作。
大量过期键删除，键对象过期删除后，开释的空间无奈失去充分利用，导致碎片率回升。

呈现高内存碎片问题时常见的解决形式如下：

数据对齐：在条件容许的状况下尽量做数据对齐，比方数据尽量采纳数字类型或者固定长度字符串等，然而这要视具体的业务而定，有些场景无奈做到。
平安重启：重启节点能够做到内存碎片重新整理，因而能够利用高可用架构，如 Sentinel 或 Cluster，将碎片率过高的主节点转换为从节点，进行平安重启。

RDB 生成和 AOF 重写会 fork 子过程，进而导致内存耗费。总结如下：

失常状况下 Redis 产生的子过程并不需要耗费 1 倍的父过程内存，理论耗费依据期间写入命令量决定，然而仍然要预留出一些内存避免溢出。
须要设置 sysctl vm.overcommit_memory= 1 容许内核能够调配所有的物理内存，避免 Redis 过程执行 fork 时因零碎残余内存不足而失败。
排查以后零碎是否反对并开启 THP，如果开启倡议敞开，避免 copy-onwrite 期间内存适度耗费。

key 能够通过字符串缩减来缩小长度
value 能够通过序列化和压缩来缩小存储，也能够能够通过业务侧优化缩小不必要的字段

尽量应用 `set` 而非`append`

因为字符串（SDS）存在预分配机制，日常开发中要小心预调配带来的内存节约。

表 -2 set & append 比照测试

操作	数据量	key 大小	value 大小	used_memory_human	used_memory_rss_human	mem_fragmentation_ratio	阐明
set	100w	20B	100B	176.66M	180.19M	1.02	—
set	100w	20B	200B	283.47M	287.66M	1.01
set && append	100w	20B	100B+100B	497.10M	503.19M	1.01	先 set，value 大小为 100B，随后 append 大小 100B 的数据

从下面的试验能够看出，同样存储 100w 条 key 大小为 20B，value 大小为 200B 的数据，通过 set 和append操作实现的和间接应用 set 实现多了近75% 的存储耗费。

字符串重构：指不肯定把每份数据作为字符串整体存储，像 json 这样的数据能够应用 hash 构造，这样做有如下收益：

应用二级构造存储也能帮咱们节俭内存。
同时能够应用 hmget、hmset 命令反对字段的局部读取批改，而不必每次整体存取。

留神，这样样做的一个前提是 json key-value对中 value 绝对较小，上面是一个测试例子。

{
"id" : "12345678",
"title" : "redis-memory-optimization",
"chinese_url" : "http://www.redis.cn/topics/memory-optimization.html",
"english_url" : "https://redis.io/topics/memory-optimization"
}

代码 -2 一个 json 实例

表 -3 hash 优化测试

数据量	数据结构	编码	key	value	配置	used_memory_human	used_memory_rss_human	mem_fragmentation_ratio
100w	string	raw	20B	json 字符串	默认	252.95M	258.04M	1.02
100w	hash	hashtbale	20B	key-value	hash-max-ziplist-value 50	474.21M	484.27M	1.02
100w	hash	ziplist	20B	key-value	hash-max-ziplist-value 64	252.95M	258.09M	1.02

依据测试构造，hash-max-ziplist-value 50配置下应用 hash 类型，内存耗费岂但没有升高反而比字符串存储多出 2 倍，而调整 hash-max-ziplist-value 64 之后内存升高为 252.95M。因为 json 的 chinese_url 属性长度是 51，调整配置后 hash 类型外部编码方式变为 ziplist，相比字符串在内存应用上至多持平且反对属性的局部操作。
intset 编码：intset 编码是汇合（set）类型编码的一种，外部体现为存储有序、不反复的整数集。当汇合只蕴含整数且长度不超过 set-max-intset-entries 配置时被启用。

typedef struct intset {
uint32_t encoding;
uint32_t length;
int8_t contents[];} intset;

代码 -3 intset 构造

encoding：整数示意类型，依据汇合内最长整数值确定类型，整数类型划分为三种：int-16、int-32、int-64。intset 保留的整数类型依据长度划分，当保留的整数超出以后类型时，将会触发主动降级操作且降级后不再做回退。降级操作将会导致从新申请内存空间，把原有数据按转换类型后拷贝到新数组。
应用 intset 编码的汇合时，尽量放弃整数范畴统一，如都在 int-16 范畴内。避免个别大整数触发汇合降级操作，产生内存节约。

通过在客户端预估键规模，把大量键分组映射到多个 hash 构造中升高键的数量。简略的说就是 复用 key 前缀。

内存是绝对贵重的资源，通过正当的优化能够无效地升高内存的使用量，内存优化的思路包含：

精简键值对大小，键值字面量精简，应用高效二进制序列化工具。
应用对象共享池优化小整数对象。
数据优先应用整数，比字符串类型更节俭空间。
优化字符串应用，防止预调配造成的内存节约。
应用 ziplist 压缩编码优化 hash、list 等构造，重视效率和空间的均衡。
应用 intset 编码优化整数汇合。
应用 ziplist 编码的 hash 构造升高小对象链规模。

Redis 官网

Redis 开发与运维

How Twitter Uses Redis To Scale – 105TB RAM, 39MM QPS, 10,000+ Instances

Latency Numbers Every Programmer Should Know

关于redis:Redis系列之如何高效使用

避免阻塞

内因躲避

外因躲避

节约内存

系统优化

用户优化

减小键值字符串长度

尽量应用 `set` 而非`append`

字符串重构

控制键的数量

总结

reference

避免阻塞

内因躲避

外因躲避

节约内存

系统优化

用户优化

减小键值字符串长度

尽量应用 set 而非append

字符串重构

控制键的数量

总结

reference

尽量应用 `set` 而非`append`