关于java:学习下Redis内存模型

6次阅读

共计 3240 个字符,预计需要花费 9 分钟才能阅读完成。

作者:京东批发 吴佳

前言

redis,对于一个 java 开发工程师来讲,其实算不得什么简单离奇的技术,但可能也很少人去深刻理解学习它的底层的一些货色。上面将通过对内存统计、内存划分、存储细节、对象类型 & 外部编码这四个模块来学习学习 redis 的内存模型,手字笔录,潜心修行。

一、redis 的内存统计

info memory 命令查看内存应用状况:服务器根本信息、CPU、内存、长久化、客户端连贯信息等等,如下图:




(1)used_memory 和 used_memory_rss

used_memory:Redis 分配器调配的内存总量 + 虚拟内存(磁盘)

used_memory_rss:Redis 过程占据操作系统的内存 + 过程运行自身须要的内存 + 内存碎片等(*:留神 used_memory_rss 不包含虚拟内存)

两者区别:

①面向角度:used_memory: Redis 角度 used_memory_rss:操作系统角度

②大小不肯定是后者大于前者:内存碎片和 Redis 过程运行须要占用内存,使得前者可能比后者小,另一方面虚拟内存的存在,使得前者可能比后者大

(2)mem_fragmentation_ratio

内存碎片比率,等于 used_memory_rss / used_memory

mem_fragmentation_ratio > 1 : 值越大,内存碎片比例越大

mem_fragmentation_ratio < 1 : 阐明 Redis 应用了虚拟内存

*: 因为虚拟内存的媒介是磁盘,比内存速度要慢很多,当这种状况呈现时,应该及时排查,如果内存不足应该及时处理,如减少 Redis 节点、减少 Redis 服务器的内存、优化利用等。

失常状况下:mem_fragmentation_ratio = 1.03 左右(衰弱:对于 jemalloc 来说)

下面的状况:没有向 Redis 中存入数据,Redis 过程自身运行的内存使得 used_memory_rss 比 used_memory 大得多

(3)mem_allocator:

Redis 应用的内存分配器,在编译时指定,能够是 libc、jemalloc 或者 tcmalloc,默认是 jemalloc。

(4)used_memory_peak:

Redis 的内存耗费峰值

(5)used_memory_human 和 used_memory_peak_human:

字面含意,以人类浏览的形式返回。



二、redis 的内存划分

数据:最次要的局部,会统计在 used_memory。实际上,在 Redis 外部,每种类型可能有 2 种或更多的外部编码实现。此外,Redis 在存储对象时,并不是间接将数据扔进内存,而是会对对象进行各种包装:如 RedisObject、SDS 等。

过程自身内存:Redis 主过程自身运行必定须要占用内存,如代码、常量池等等。这部分内存大概几兆,在大多数生产环境中与 Redis 数据占用的内存相比能够疏忽。这部分内存不是由 jemalloc 调配,因而不会统计在 used_memory 中。

缓冲内存:蕴含客户端缓冲区、复制积压缓冲区、AOF 缓冲区

客户端缓冲区:存储客户端连贯的输入输出缓冲

复制积压缓冲区:用于局部复制性能

AOF 缓冲区:用于在进行 AOF 重写时,保留最近的写入命令

内存碎片:内存碎片是 Redis 在调配、回收物理内存过程中产生的。



三、redis 的数据存储细节

当咱们执行一个 redis 指令,比方:set hello world,redis 底层存储到底干了什么?





下面就波及到两个概念:jemalloc 和 RedisObject

(1)jemalloc

内存分配器:能够是 libc、jemalloc 或者 tcmalloc,默认 jemalloc

jemalloc 内存划分:小、大、微小,每个又分许多小内存块单位

(例如,如果须要存储大小为 130 字节的对象,jemalloc 会将其放入 160 字节的内存单元中。)

(2)RedisObject(外围数据结构)

redis 的五种类型都是通过 RedisObject 存储,Redis 对象的 类型、外部编码、内存回收、共享对象等性能都须要 RedisObject 对象反对。

typedef struct redisObject{
    unsigned type:4;
    unsigned encoding:4;
    unsigned lru:REDIS_LRU_BITS; /* lru time (relative to server.lruclock) */       
    int refcount;
    void *ptr;
}

type:示意对象的数据类型,占 4bit。

encoding:示意对象外部的编码,占 4bit,对于 redis 的每种数据类型,都至多有俩

种外部编码。比方字符串类型有:int、embstr、raw。

lru:记录的是对象最初一次被命令程序拜访的工夫,占据的比特数不同的版本有所不同(如 4.0 版本占 24 比特,2.6 版本占 22 比特)。

refcount:

1、概念:refcount 记录的是该对象被援用的次数,类型目前仅为整型。

2、作用:refcount 的作用,次要在于对象的援用计数和内存回收:

①当创立新对象时,refcount 初始化为 1;

②当有新程序应用该对象时,refcount 加 1;

③当对象不再被一个新程序应用时,refcount 减 1;

④当 refcount 变为 0 时,对象占用的内存会被开释。

3、为什么只反对整数值的字符串对象?对内存和 CPU(工夫)的均衡:

①对于整数值,判断操作复杂度为 O(1);

②对于一般字符串,判断复杂度为 O(n);

③而对于哈希、列表、汇合和有序汇合,判断的复杂度为 O(n^2)。

4、目前实现:Redis 服务器在初始化时,会创立 10000 个字符串对象,值别离是 0~9999 的整数值;10000 这个数字能够通过调整参数 REDIS_SHARED_INTEGERS(4.0 中是 OBJ_SHARED_INTEGERS)的值进行扭转。(共享对象的援用次数能够通过 object refcount 命令查看:)

ptr:ptr 指针指向具体的数据,如后面的例子中,set hello world,ptr 指向蕴含字符串 world 的 SDS

(3)SDS

1、概念:Redis 没有间接应用 C 字符串 (即以空字符‘\0’结尾的字符数组) 作为默认的字符串示意,而是应用了 SDS。SDS 是简略动静字符串 (Simple Dynamic String) 的缩写。

2、构造:



3、相干计算:

*:buf 数组的长度 = free+len+1(其中 1 示意字符串结尾的空字符)

一个 SDS 构造占据的空间 = free 所占长度 +len 所占长度 + buf 数组的长度 =4+4+free+len+1=free+len+9。

4、加“\0”目标:为了简略字符串可能调用 c 字符串局部函数

四、redis 的对象类型 & 外部编码





(1)字符串

1、字符串长度不超过 512MB

2、外部编码有三种:int、embstr、raw

3、编码转换关系:

int:整形

embstr:<=39 字节的字符串

raw:>39 字节的字符串

4、embstr 和 raw 的区别:

①embstr 都应用 redisObject 和 sds 构造存储

②emstr 创立只调配一次内存空间(redisObject 和 sds 一起调配,因为它是间断的)

毛病:创立和删除都须要整个 redisObject 和 sds 重新分配空间,所以 emstr 实现为只读。

③raw 须要调配两次

5、当 emstr 被批改时,会先变成 raw,再批改,无论是否达到 39 字节

这也是为了防止创立整个 redisObject 和 sds









(2)列表

1、外部编码:ziplist 和 linkedlist:(每个节点指向的是 redisObject)

2、压缩列表:节约空间,间断内存块

3、编码转换:什么状况下应用压缩列表?

①列表元素 < 512 个

②列表中所有字符串对象都有余 64 字节(字符串长度)







(3)hash: 内层哈希和外层哈希

内层哈希:ziplist、hashtable

外层哈希:hashtable





正文完
 0