作者:京东批发 吴佳
前言
redis,对于一个java开发工程师来讲,其实算不得什么简单离奇的技术,但可能也很少人去深刻理解学习它的底层的一些货色。上面将通过对内存统计、内存划分、存储细节、对象类型&外部编码这四个模块来学习学习redis的内存模型,手字笔录,潜心修行。
一、redis的内存统计
info memory 命令查看内存应用状况:服务器根本信息、CPU、内存、长久化、客户端连贯信息等等,如下图:
(1)used_memory和used_memory_rss
used_memory:Redis分配器调配的内存总量 + 虚拟内存(磁盘)
used_memory_rss:Redis过程占据操作系统的内存 + 过程运行自身须要的内存 + 内存碎片等 (*:留神 used_memory_rss 不包含虚拟内存)
两者区别:
①面向角度:used_memory: Redis角度 used_memory_rss:操作系统角度
②大小不肯定是后者大于前者:内存碎片和Redis过程运行须要占用内存,使得前者可能比后者小,另一方面虚拟内存的存在,使得前者可能比后者大
(2)mem_fragmentation_ratio
内存碎片比率, 等于 used_memory_rss / used_memory
mem_fragmentation_ratio > 1 : 值越大,内存碎片比例越大
mem_fragmentation_ratio < 1 : 阐明Redis应用了虚拟内存
*:因为虚拟内存的媒介是磁盘,比内存速度要慢很多,当这种状况呈现时,应该及时排查,如果内存不足应该及时处理,如减少Redis节点、减少Redis服务器的内存、优化利用等。
失常状况下:mem_fragmentation_ratio = 1.03左右 (衰弱:对于jemalloc来说)
下面的状况:没有向Redis中存入数据,Redis过程自身运行的内存使得used_memory_rss 比used_memory大得多
(3)mem_allocator:
Redis应用的内存分配器,在编译时指定,能够是 libc 、jemalloc或者tcmalloc,默认是jemalloc。
(4)used_memory_peak:
Redis的内存耗费峰值
(5)used_memory_human和used_memory_peak_human:
字面含意,以人类浏览的形式返回。
二、redis的内存划分
数据:最次要的局部,会统计在used_memory。实际上,在Redis外部,每种类型可能有2种或更多的外部编码实现。此外,Redis在存储对象时,并不是间接将数据扔进内存,而是会对对象进行各种包装:如RedisObject、SDS等。
过程自身内存:Redis主过程自身运行必定须要占用内存,如代码、常量池等等。这部分内存大概几兆,在大多数生产环境中与Redis数据占用的内存相比能够疏忽。这部分内存不是由jemalloc调配,因而不会统计在used_memory中。
缓冲内存:蕴含客户端缓冲区、复制积压缓冲区、AOF缓冲区
客户端缓冲区:存储客户端连贯的输入输出缓冲
复制积压缓冲区:用于局部复制性能
AOF缓冲区:用于在进行AOF重写时,保留最近的写入命令
内存碎片:内存碎片是Redis在调配、回收物理内存过程中产生的。
三、redis的数据存储细节
当咱们执行一个redis指令,比方:set hello world,redis底层存储到底干了什么?
下面就波及到两个概念:jemalloc和RedisObject
(1)jemalloc
内存分配器:能够是 libc 、jemalloc或者tcmalloc,默认jemalloc
jemalloc内存划分:小、大、微小,每个又分许多小内存块单位
(例如,如果须要存储大小为130字节的对象,jemalloc会将其放入160字节的内存单元中。)
(2)RedisObject(外围数据结构)
redis的五种类型都是通过RedisObject存储,Redis对象的 类型、外部编码、内存回收、共享对象等性能都须要RedisObject对象反对。
typedef struct redisObject{ unsigned type:4; unsigned encoding:4; unsigned lru:REDIS_LRU_BITS; /* lru time (relative to server.lruclock) */ int refcount; void *ptr;}
type:示意对象的数据类型,占4bit。
encoding:示意对象外部的编码,占4bit,对于redis的每种数据类型,都至多有俩
种外部编码。比方字符串类型有:int、embstr、raw。
lru:记录的是对象最初一次被命令程序拜访的工夫,占据的比特数不同的版本有所不同(如4.0版本占24比特,2.6版本占22比特)。
refcount:
1、概念:refcount记录的是该对象被援用的次数,类型目前仅为整型。
2、作用:refcount的作用,次要在于对象的援用计数和内存回收:
①当创立新对象时,refcount初始化为1;
②当有新程序应用该对象时,refcount加1;
③当对象不再被一个新程序应用时,refcount减1;
④当refcount变为0时,对象占用的内存会被开释。
3、为什么只反对整数值的字符串对象?对内存和CPU(工夫)的均衡:
①对于整数值,判断操作复杂度为O(1);
②对于一般字符串,判断复杂度为O(n);
③而对于哈希、列表、汇合和有序汇合,判断的复杂度为O(n^2)。
4、目前实现:Redis服务器在初始化时,会创立10000个字符串对象,值别离是0~9999的整数值;10000这个数字能够通过调整参数REDIS_SHARED_INTEGERS(4.0中是 OBJ_SHARED_INTEGERS)的值进行扭转。(共享对象的援用次数能够通过object refcount命令查看:)
ptr:ptr指针指向具体的数据,如后面的例子中,set hello world,ptr指向蕴含字符串world的SDS
(3)SDS
1、概念:Redis没有间接应用C字符串(即以空字符‘\0’结尾的字符数组)作为默认的字符串示意,而是应用了SDS。SDS是简略动静字符串(Simple Dynamic String)的缩写。
2、构造:
3、相干计算:
*:buf数组的长度 = free+len+1(其中1示意字符串结尾的空字符)
一个SDS构造占据的空间 = free所占长度+len所占长度+ buf数组的长度=4+4+free+len+1=free+len+9。
4、加“\0”目标:为了简略字符串可能调用c字符串局部函数
四、redis的对象类型&外部编码
(1)字符串
1、字符串长度不超过512MB
2、外部编码有三种: int、embstr、raw
3、编码转换关系:
int:整形
embstr:<=39字节的字符串
raw:>39字节的字符串
4、embstr和raw的区别:
①embstr都应用redisObject和sds构造存储
②emstr创立只调配一次内存空间(redisObject和sds一起调配,因为它是间断的)
毛病:创立和删除都须要整个redisObject和sds重新分配空间,所以emstr实现为只读。
③raw须要调配两次
5、当emstr被批改时,会先变成raw,再批改,无论是否达到39字节
这也是为了防止创立整个redisObject和sds
(2)列表
1、外部编码:ziplist和linkedlist:(每个节点指向的是redisObject)
2、压缩列表:节约空间,间断内存块
3、编码转换:什么状况下应用压缩列表?
①列表元素 < 512个
②列表中所有字符串对象都有余64字节(字符串长度)
(3)hash: 内层哈希和外层哈希
内层哈希:ziplist、hashtable
外层哈希:hashtable