1 引言

Redis作为基于内存的非关系型的K-V数据库。因读写响应疾速、原子操作、提供了多种数据类型String、List、Hash、Set、Sorted Set、在我的项目中有着宽泛的应用,明天咱们来探讨下下Redis的数据结构是如何实现的。

2 数据存储

2.1 RedisDB

Redis将数据存储在redisDb中,默认0~15共16个db。每个库都是独立的空间,不用放心key抵触问题,可通过select命令切换db。集群模式应用db0

typedef struct redisDb {dict *dict; /* The keyspace for this DB */dict *expires; /* Timeout of keys with a timeout set */...} redisDb;
  • dict:数据库键空间,保留着数据库中的所有键值对
  • expires:键的过期工夫,字典的键为键,字典的值为过期事件UNIX工夫戳

2.2 Redis哈希表实现

2.2.1 哈希字典dict

K-V存储咱们最先想到的就是map,在Redis中通过dict实现,数据结构如下:

typedef struct dict {    dictType *type;    void *privdata;    dictht ht[2];    long rehashidx; /* rehashing not in progress if rehashidx == -1 */    unsigned long iterators; /* number of iterators currently running */} dict;
  • type:类型特定函数是一个指向dictType构造的指针,每个dictType构造保留了一簇用于操作特定类型键值对的函数,Redis会为用处不同的字典设置不同的类型特定函数。
  • privdata:公有数据保留了须要传给那些类型特定函数的可选参数
  • ht[2]:哈希表一个蕴含两个项的数组,数组中的每个项都是一个dictht哈希表,个别状况下,字典只应用ht[0] 哈希表,ht[1]哈希表只会在对ht[0]哈希表进行rehash时应用
  • rehashidx:rehash 索引,当rehash不在进行时,值为 -1

hash数据存在两个特点:

  • 任意雷同的输出肯定能失去雷同的数据
  • 不同的输出,有可能失去雷同的输入

针对hash数据的特点,存在hash碰撞的问题,dict通过dictType中的函数可能解决这个问题

typedef struct dictType {uint64_t (*hashFunction)(const void *key);int (*keyCompare)(void *privdata, const void *key1, const void *key2);...} dictType;
  • hashFunction:用于计算key的hash值的办法
  • keyCompare:key的值比拟办法

2.2.2 哈希表 dictht

dict.h/dictht示意一个哈希表,具体构造如下:

typedef struct dictht {    dictEntry **table;    unsigned long size;    unsigned long sizemask;    unsigned long used;} dictht;
  • table:数组指针,数组中的每个元素都是一个指向dict.h/dictEntry构造的指针,每个dictEntry构造保留着一个键值对。
  • size:记录了哈希表的大小,也就是table数组的大小,大小总是2^n
  • sizemask:总是等于size - 1,这个属性和哈希值一起决定一个键应该被放到table数组的哪个索引下面。
  • used:记录了哈希表目前已有节点(键值对)的数量。

键值对dict.h/dictEntry

typedef struct dictEntry {    void *key;    union {        void *val;        uint64_t u64;        int64_t s64;        double d;    } v;    struct dictEntry *next;} dictEntry;
  • key:保留着键值对中的键(SDS类型对象)
  • val:保留着键值对中的值,能够是一个uint64\_t整数,或者是一个int64\_t整数,又或者是一个指针指向一个被redisObject包装的值
  • next:指向下个哈希表节点,造成链表指向另一个哈希表节点的指针,这个指针能够将多个哈希值雷同的键值对连贯在一次,以此来解决键抵触(collision)的问题

应用hash表就肯定会存在hash碰撞的问题,hash碰撞后在以后数组节点造成一个链表,在数据量超过hash表长度的状况下,就会存在大量节点称为链表,极其状况下工夫复杂度会从O(1)变为O(n);如果hash表的数据再一直缩小,会造成空间节约的状况。Redis会针对这两种状况依据负载因子做扩大与膨胀操作:

  • 负载因子:哈希表已保留节点数量/哈希表大小,load_factor = ht[0].used/ht[0].size
  • 扩大操作:
  • 服务器目前没有在执行BGSAVE命令或者BGREWRITEAOF命令,并且哈希表的负载因子大于等于 1;
  • 服务器目前正在执行BGSAVE命令或者BGREWRITEAOF命令,并且哈希表的负载因子大于等于5;

膨胀操作:

  • 当哈希表的负载因子小于 0.1 时, 程序主动开始对哈希表执行膨胀操作。

Redis在扩容时如果全量扩容会因为数据量问题导致客户端操作短时间内无奈解决,所以采纳渐进式 rehash进行扩容,步骤如下:

  1. 同时持有2个哈希表
  2. 将rehashidx的值设置为0,示意rehash工作正式开始
  3. 在rehash进行期间, 每次对字典执行增加、删除、查找或者更新操作时,程序除了执行指定的操作以外,还会顺带将ht[0]哈希表在rehashidx索引上的所有键值对rehash到ht[1] ,当rehash工作实现之后,程序将rehashidx属性的值增一
  4. 某个工夫点上,ht[0]的所有键值对都会被rehash至ht[1] ,这时程序将rehashidx属性的值设为-1, 示意rehash操作已实现

在渐进式 rehash 进行期间,字典的删除(delete)、查找(find)、更新(update)等操作会在两个哈希表上进行;在字典外面查找一个键的话, 程序会先在 ht[0] 外面进行查找,如果没找到的话,就会持续到ht[1]外面进行查找;新增加到字典的键值对一律会被保留到 ht[1] 外面,而ht[0]则不再进行任何增加操作:这一措施保障了ht[0]蕴含的键值对数量会只减不增(如果长时间不进行操作时,事件轮询进行这种操作),并随着rehash操作的执行而最终变成空表。

dict.h/redisObject

Typedef struct redisObject {unsigned type:4;unsigned encoding:4;unsigned lru:LRU_BITS;int refcount;void *ptr;}
  • type:4:束缚客户端操作时存储的数据类型,已存在的数据无奈批改类型,4bit
  • encoding:4:值在redis底层的编码模式,4bit
  • lru:LRU_BITS:内存淘汰策略
  • refcount:通过援用计数法治理内存,4byte
  • ptr:指向实在存储值的地址,8byte

残缺结构图如下:

3 String类型

3.1 String类型应用场景

String 字符串存在有三种类型:字符串,整数,浮点。次要有以下应用场景

1)页面动静缓存
比方生成一个动静页面,首次能够将后盾数据生成页面,并且存储到redis字符串中。再次拜访,不再进行数据库申请,间接从redis中读取该页面。特点是:首次拜访比较慢,后续拜访疾速。

2)数据缓存
在前后分离式开发中,有些数据尽管存储在数据库,然而更改特地少。比方有个全国地区表。以后端发动申请后,后盾如果每次都从关系型数据库读取,会影响网站整体性能。
咱们能够在第一次拜访的时候,将所有地区信息存储到redis字符串中,再次申请,间接从数据库中读取地区的json字符串,返回给前端。

3)数据统计
redis整型能够用来记录网站访问量,某个文件的下载量。(原子自增自减)

4)工夫内限度申请次数
比方已登录用户申请短信验证码,验证码在5分钟内无效的场景。当用户首次申请了短信接口,将用户id存储到redis 曾经发送短信的字符串中,并且设置过期工夫为5分钟。当该用户再次申请短信接口,发现曾经存在该用户发送短信记录,则不再发送短信。

5)分布式session
当咱们用nginx做负载平衡的时候,如果咱们每个从服务器上都各自存储本人的session,那么当切换了服务器后,session信息会因为不共享而会失落,咱们不得不思考第三利用来存储session。通过咱们用关系型数据库或者redis等非关系型数据库。关系型数据库存储和读取性能远远无奈跟redis等非关系型数据库。

3.2 String类型的实现——SDS构造

Redis并没有间接应用C字符串实现String类型,在Redis3.2版本之前通过SDS实现

Typedef struct sdshdr {int len;int free;char buf[];};
  • len:分配内存空间
  • free:残余可用调配空间
  • char[]:value值理论数据

3.3 SDS与C字符串之间的区别

3.3.1 查问工夫复杂度

C获取字符串长度的复杂度为O(N)。而SDS通过len记录长度,从C的O(n)变为O(1)。

3.3.2 缓冲区溢出

C字符串不记录本身长度容易造成缓冲区溢出(buffer overflow)。SDS的空间调配策略齐全杜绝了产生缓冲区溢出的可能性,当须要对SDS进行批改时,会先查看SDS的空间是否满足批改所需的要求,如果不满足的话SDS的空间扩大至执行批改所需的大小,而后才执行理论的批改操作,所以应用SDS既不须要手动批改SDS的空间大小,也不会呈现缓冲区溢出问题。

在SDS中,buf数组的长度不肯定就是字符数量加一,数组外面能够蕴含未应用的字节,而这些字节的数量就由SDS的free属性记录。通过未应用空间,SDS实现了空间预调配和惰性空间开释两种优化策略:

  • 空间预调配:当对一个SDS进行批改,并且须要对SDS进行空间扩大的时候,程序不仅会为SDS调配批改所必须要的空间,还会为SDS调配额定的未应用空间。扩大SDS 空间之前,会先查看未应用空间是否足够, 如果足够的话,就会间接应用未应用空间,而无须执行内存重调配。如果不够依据(len + addlen(新增字节)) * 2的形式进行扩容,大于1M时,每次只会减少1M大小。通过这种预调配策略,SDS将间断增长N次字符串所需的内存重调配次数从必然N次升高为最多N次。
  • 惰性空间开释:惰性空间开释用于优化SDS的字符串缩短操作:当须要缩短SDS保留的字符串时,程序并不立刻应用内存重调配来回收缩短后多进去的字节,而是应用free属性将这些字节的数量记录起来,并期待未来应用。

3.3.3 二进制平安

C字符串中的字符必须合乎某种编码(比方 ASCII,并且除了字符串的开端之外,字符串外面不能蕴含空字符, 否则最先被程序读入的空字符将被误认为是字符串结尾。

SDS的API都是二进制平安的(binary-safe):都会以解决二进制的形式来解决SDS寄存在buf数组里的数据,程序不会对其中的数据做任何限度、过滤、或者假如 —— 数据在写入时是什么样的,它被读取时就是什么样。redis不是用这个数组来保留字符,而是用它来保留一系列二进制数据。

3.4 SDS构造优化

String类型所存储的数据可能会几byte存在大量这种类型数据,但len、free属性的int类型会占用4byte共8byte存储,3.2之后会依据字符串大小应用sdshdr5、sdshdr8、sdshdr16、sdshdr32、sdshdr64数据结构存储,具体构造如下:

struct __attribute__ ((__packed__)) sdshdr5 {unsigned char flags; /* 3 lsb of type, and 5 msb of string length */char buf[];};struct __attribute__ ((__packed__)) sdshdr8 {uint8_t len; /* used */uint8_t alloc; /* excluding the header and null terminator */unsigned char flags; /* 3 lsb of type, 5 unused bits */char buf[];};struct __attribute__ ((__packed__)) sdshdr16 {uint16_t len; /* used */uint16_t alloc; /* excluding the header and null terminator */unsigned char flags; /* 3 lsb of type, 5 unused bits */char buf[];};struct __attribute__ ((__packed__)) sdshdr32 {uint32_t len; /* used */uint32_t alloc; /* excluding the header and null terminator */unsigned char flags; /* 3 lsb of type, 5 unused bits */char buf[];};struct __attribute__ ((__packed__)) sdshdr64 {uint64_t len; /* used */uint64_t alloc; /* excluding the header and null terminator */unsigned char flags; /* 3 lsb of type, 5 unused bits */char buf[];};
  • unsign char flags:3bit示意类型,5bit示意未应用长度
  • len:示意已应用长度
  • alloc:示意调配空间大小,残余空间大小能够应用alloc - len取得

3.5 字符集编码

redisObject包装存储的value值,通过字符集编码对数据存储进行优化,string类型的编码方式有如下三种:

  • embstr:
    CPU每次按Cache Line 64byte读取数据,一个redisObject对象为16byte,为填充64byte大小,会向后再读取48 byte数据。但获取理论数据时还须要再通过*ptr指针读取对应内存地址的数据。而一个sdshdr8属性的信息占用4byte,其余44byte能够用来存储数据。如果value值小于44,byte能够通过一次读取缓存行获取数据。
  • int:
    如果SDS小于20位,并且可能转换成整型数字,redisObject的*ptr指针会间接进行存储。
  • raw:
    SDS

4 总结

redis作为k-v数据存储,因查找和操作的工夫复杂度都是O(1)和丰盛的数据类型及数据结构的优化,理解了这些数据类型和构造更有利于咱们平时对于redis的应用。下一期将对其它罕用数据类型List、Hash、Set、Sorted Set所应用的ZipList、QuickList、SkipList做进一步介绍,对于文章中不清晰不精确的中央欢送大家一起探讨交换。


作者:盛旭