关于java:学习下Redis内存模型

作者：京东批发吴佳

前言

redis，对于一个java开发工程师来讲，其实算不得什么简单离奇的技术，但可能也很少人去深刻理解学习它的底层的一些货色。上面将通过对内存统计、内存划分、存储细节、对象类型&外部编码这四个模块来学习学习redis的内存模型，手字笔录，潜心修行。

一、redis的内存统计

info memory 命令查看内存应用状况：服务器根本信息、CPU、内存、长久化、客户端连贯信息等等，如下图：

（1）used_memory和used_memory_rss

used_memory：Redis分配器调配的内存总量 + 虚拟内存（磁盘）

used_memory_rss：Redis过程占据操作系统的内存 + 过程运行自身须要的内存 + 内存碎片等（*：留神 used_memory_rss 不包含虚拟内存）

两者区别：

①面向角度：used_memory: Redis角度 used_memory_rss：操作系统角度

②大小不肯定是后者大于前者：内存碎片和Redis过程运行须要占用内存，使得前者可能比后者小，另一方面虚拟内存的存在，使得前者可能比后者大

（2）mem_fragmentation_ratio

内存碎片比率，等于 used_memory_rss / used_memory

mem_fragmentation_ratio > 1 : 值越大，内存碎片比例越大

mem_fragmentation_ratio < 1 : 阐明Redis应用了虚拟内存

*:因为虚拟内存的媒介是磁盘，比内存速度要慢很多，当这种状况呈现时，应该及时排查，如果内存不足应该及时处理，如减少Redis节点、减少Redis服务器的内存、优化利用等。

失常状况下：mem_fragmentation_ratio = 1.03左右（衰弱：对于jemalloc来说）

下面的状况：没有向Redis中存入数据，Redis过程自身运行的内存使得used_memory_rss 比used_memory大得多

（3）mem_allocator：

Redis应用的内存分配器，在编译时指定，能够是 libc 、jemalloc或者tcmalloc，默认是jemalloc。

（4）used_memory_peak：

Redis的内存耗费峰值

（5）used_memory_human和used_memory_peak_human：

字面含意，以人类浏览的形式返回。

二、redis的内存划分

数据：最次要的局部，会统计在used_memory。实际上，在Redis外部，每种类型可能有2种或更多的外部编码实现。此外，Redis在存储对象时，并不是间接将数据扔进内存，而是会对对象进行各种包装：如RedisObject、SDS等。

过程自身内存：Redis主过程自身运行必定须要占用内存，如代码、常量池等等。这部分内存大概几兆，在大多数生产环境中与Redis数据占用的内存相比能够疏忽。这部分内存不是由jemalloc调配，因而不会统计在used_memory中。

缓冲内存：蕴含客户端缓冲区、复制积压缓冲区、AOF缓冲区

客户端缓冲区：存储客户端连贯的输入输出缓冲

复制积压缓冲区：用于局部复制性能

AOF缓冲区：用于在进行AOF重写时，保留最近的写入命令

内存碎片：内存碎片是Redis在调配、回收物理内存过程中产生的。

三、redis的数据存储细节

当咱们执行一个redis指令，比方：set hello world，redis底层存储到底干了什么？

下面就波及到两个概念：jemalloc和RedisObject

（1）jemalloc

内存分配器：能够是 libc 、jemalloc或者tcmalloc，默认jemalloc

jemalloc内存划分：小、大、微小，每个又分许多小内存块单位

（例如，如果须要存储大小为130字节的对象，jemalloc会将其放入160字节的内存单元中。）

（2）RedisObject（外围数据结构）

redis的五种类型都是通过RedisObject存储，Redis对象的类型、外部编码、内存回收、共享对象等性能都须要RedisObject对象反对。

typedef struct redisObject{    unsigned type:4;    unsigned encoding:4;    unsigned lru:REDIS_LRU_BITS; /* lru time (relative to server.lruclock) */           int refcount;    void *ptr;}

type：示意对象的数据类型，占4bit。

encoding：示意对象外部的编码，占4bit，对于redis的每种数据类型，都至多有俩

种外部编码。比方字符串类型有：int、embstr、raw。

lru：记录的是对象最初一次被命令程序拜访的工夫，占据的比特数不同的版本有所不同（如4.0版本占24比特，2.6版本占22比特）。

refcount:

1、概念：refcount记录的是该对象被援用的次数，类型目前仅为整型。

2、作用：refcount的作用，次要在于对象的援用计数和内存回收：

①当创立新对象时，refcount初始化为1；

②当有新程序应用该对象时，refcount加1；

③当对象不再被一个新程序应用时，refcount减1；

④当refcount变为0时，对象占用的内存会被开释。

3、为什么只反对整数值的字符串对象？对内存和CPU（工夫）的均衡：

①对于整数值，判断操作复杂度为O(1)；

②对于一般字符串，判断复杂度为O(n)；

③而对于哈希、列表、汇合和有序汇合，判断的复杂度为O(n^2)。

4、目前实现：Redis服务器在初始化时，会创立10000个字符串对象，值别离是0~9999的整数值；10000这个数字能够通过调整参数REDIS_SHARED_INTEGERS（4.0中是 OBJ_SHARED_INTEGERS）的值进行扭转。（共享对象的援用次数能够通过object refcount命令查看：）

ptr:ptr指针指向具体的数据，如后面的例子中，set hello world，ptr指向蕴含字符串world的SDS

（3）SDS

1、概念：Redis没有间接应用C字符串(即以空字符‘\0’结尾的字符数组)作为默认的字符串示意，而是应用了SDS。SDS是简略动静字符串(Simple Dynamic String)的缩写。

2、构造：

3、相干计算：

*：buf数组的长度 = free+len+1（其中1示意字符串结尾的空字符）

一个SDS构造占据的空间 = free所占长度+len所占长度+ buf数组的长度=4+4+free+len+1=free+len+9。

4、加“\0”目标：为了简略字符串可能调用c字符串局部函数

四、redis的对象类型&外部编码

（1）字符串

1、字符串长度不超过512MB

2、外部编码有三种： int、embstr、raw

3、编码转换关系：

int：整形

embstr：<=39字节的字符串

raw：>39字节的字符串

4、embstr和raw的区别：

①embstr都应用redisObject和sds构造存储

②emstr创立只调配一次内存空间（redisObject和sds一起调配，因为它是间断的）

毛病：创立和删除都须要整个redisObject和sds重新分配空间，所以emstr实现为只读。

③raw须要调配两次

5、当emstr被批改时，会先变成raw，再批改，无论是否达到39字节

这也是为了防止创立整个redisObject和sds

（2）列表

1、外部编码：ziplist和linkedlist：（每个节点指向的是redisObject）

2、压缩列表：节约空间，间断内存块

3、编码转换：什么状况下应用压缩列表？

①列表元素 < 512个

②列表中所有字符串对象都有余64字节（字符串长度）

（3）hash：内层哈希和外层哈希

内层哈希：ziplist、hashtable

外层哈希：hashtable

作者：京东批发 吴佳

前言