关于redis:Redis对象类型

前言

Redis是一种key-value型的数据库，key和value都是应用对象示意。执行SET message HelloWorld时，key是一个蕴含了字符串message的对象，value是一个蕴含了字符串HelloWorld的对象。本篇文章将对Redis中的对象类型进行学习。

注释

一. Redis中的五种对象简介

Redis中的对象叫做redisObject，其构造如下所示。

typedef struct redisObject {    //对象类型    unsigned type:4;    //对象底层应用的编码    unsigned encoding:4;    //对象最初一次被应用的工夫    unsigned lru:22;    //援用计数    int refcount;    //指向对象底层数据结构的指针    void *ptr;} robj;

redisObject中的type字段示意以后对象的类型，type字段的取值共五种，表明Redis中共有五种对象，如下表所示。

type	阐明
REDIS_STRING	字符串
REDIS_LIST	列表
REDIS_HASH	哈希
REDIS_SET	汇合
REDIS_ZSET	有序汇合

每种类型的Redis对象在不同状况下会由不同的底层数据结构实现。Redis对象底层数据结构共八种，如下表所示。

encoding	阐明
REDIS_ENCODING_INT	long类型的整数
REDIS_ENCODING_EMBSTR	embstr编码的简略动静字符串
REDIS_ENCODING_RAW	raw编码的简略动静字符串
REDIS_ENCODING_HT	字典
REDIS_ENCODING_LINKEDLIST	双端链表
REDIS_ENCODING_ZIPLIST	压缩列表
REDIS_ENCODING_INTSET	整数汇合
REDIS_ENCODING_SKIPLIST	跳表

type和encoding的对应关系能够由下表示意。

二. 字符串对象

字符串对象与底层数据结构对应关系如下。

如果一个字符串内容能够转换为long类型，则该字符串对象的底层数据结构为long类型的整数；
如果字符串不能转换为long类型，并且字符串长度小于等于44字节，则该字符串对象的底层数据结构为embstr编码的简略动静字符串；
如果字符串长度大于等于45字节，则该字符串对象的底层数据结构为raw编码的简略动静字符串。

embstr编码在分配内存时只须要调配一次，在开释内存时也只须要开释一次，与之作为比照的raw须要两次。同时embstr编码的字符串应用间断内存，能够躲避伪共享的产生从而能够更好的利用缓存劣势。

三. 列表对象

列表对象与底层数据结构对应关系如下。

列表对象存储的元素长度小于64字节，元素个数小于512个，则该列表对象底层数据结构应用压缩列表；
其它状况，该列表对象底层数据结构应用双端链表。

上面对压缩列表进行剖析。压缩列表是一种内存紧凑型的数据结构，因为应用间断的内存空间，能够躲避伪共享的产生从而能够更好的利用缓存劣势，压缩列表在元素长度不大或者元素个数不多时，会被列表对象采纳为底层数据结构。压缩列表的示意图能够示意如下。

struct ziplist<T> {    //整个压缩列表占用字节数    int32 zlbytes;    //最初一个entry间隔压缩列表起始地位的字节数    int32 zltail_offset;    //entry个数    int16 zllength;    //entry数组    T[] entries;    //压缩列表的完结标记，0xFF    int8 zlend;}

借助压缩列表的zlbytes，zltail_offset和zllength字段，定位到压缩列表的第一个entry和最初一个entry的工夫复杂度是O(1)，然而查找entry的工夫复杂度是O(N)，所以压缩列表的元素个数不宜太多。entry数据结构如下所示。

struct entry {    //前一个entry的字节    int<var> prevlen;    //entry的内容的类型和长度    int<var> encoding;    //entry的内容    optional byte[] content;}

entry中的prevlen字段和encoding字段都是可变长度，它们依照如下规定变动。

如果前一个entry的长度小于254字节，则prevlen字段长度为1字节；
如果前一个entry的长度大于等于254字节，则prevlen字段长度为5字节；
如果以后entry的内容是整数，则encoding字段长度为1字节；
如果以后entry的内容是字符串，则依据字符串的大小的不同，encoding字段长度为1字节，2字节或5字节。

插入数据时，依据插入数据的类型和大小的不同，prevlen字段和encoding字段会动态变化，这就是Redis应用压缩列表来节约空间的思维。然而相应的会产生如下的问题。

往压缩列表插入，更新和删除数据时，可能会导致某些entry的prevlen字段发生变化，极其状况下这个变动会向后逐级传递，造成压缩列表的级联更新；
压缩列表级联更新时，会屡次从新分配内存，使得压缩列表的性能好转。

因而鉴于压缩列表的个性，Redis中的列表对象在存储元素小于64字节，元素个数小于512个时才会应用压缩列表作为底层数据结构，为的就是防止级联更新的产生。

四. 哈希对象

哈希对象与底层数据结构对应关系如下。

哈希对象存储的元素的键和值的长度小于64字节，元素个数小于512时，该哈希对象底层数据结构应用压缩列表；
其它状况，该哈希对象底层数据结构应用字典。

上面对字典dict进行剖析。字典数据结构定义如下。

typedef struct dict {  dictType *type;  //公有数据  void *privdata;  //哈希表  dictht ht[2];  //rehash时的索引  int trehashids; } dict;

Redis中的字典是基于哈希表实现，并且一个字典中持有两张哈希表。哈希表dictht数据结构定义如下。

typedef struct dictht {    //节点数组    dictEntry **table;    //哈希表大小    unsigned long size;    //哈希表大小掩码，计算索引    //sizemask = size - 1    unsigned long sizemask;    //哈希表以后节点数    unsigned long used;} dictht;

和Java中的HashMap相似，哈希表中有一个存储元素的节点数组，每个键值对会被封装成一个dictEntry节点而后增加到节点数组中。哈希表节点dictEntry数据结构定义如下。

typedef struct dictEntry {    //键    void *key;    //值    union {        void *val;        uint64_t u64;        int64_t s64;    } v;    //指向下一个节点    struct dictEntry *next;} dictEntry;

当存在哈希抵触时，会转变为链表以解决哈希抵触，dictEntry中的next字段指向链表的下一个节点。

那么基于上述数据结构，Redis中的字典能够用下图进行示意。

字典持有两张哈希表，别离为ht[0]和ht[1]，在失常状况下，均会应用ht[0]，ht[1]不会被分配内存空间。当字典须要扩容或者缩容时，会对字典中的键值对进行rehash操作，此时会应用到ht[1]，具体规定如下。

先为ht[1]分配内存空间。如果是扩容，则ht[1]的size为大于等于ht[0].used * 2且同时为2的幂次方的最小值，如果是缩容，则ht[1]的size为大于等于ht[0].used且同时为2的幂次方的最小值；
将ht[0]中的键值对从新计算索引，而后寄存到ht[1]中；
ht[0]的所有键值对全副寄存到ht[1]中后，开释ht[0]的内存空间，而后ht[1]变为ht[0]。

当字典中键值对特地多时，rehash会特地耗时，所以Redis采纳一种渐进rehash的形式来实现扩缩容，字典中的trehashids字段用于记录以后曾经rehash到的索引，Redis会逐渐将ht[0]中的键值对rehash到ht[1]上，并更新trehashids字段，与此同时Redis也会失常提供缓存性能，且如果有新增的键值对，也会间接寄存到ht[1]中，上述过程会继续到ht[0]上的键值对全副寄存到ht[1]，此时开释ht[0]的内存空间，而后ht[1]变为ht[0]。

五. 汇合对象

汇合对象与底层数据结构对应关系如下。

汇合对象存储的元素都是整数值，元素个数不超过512个时，该汇合对象底层数据结构应用整数汇合；
其它状况，该汇合对象底层数据结构应用字典。

六. 有序汇合对象

有序汇合对象与底层数据结构对应关系如下。

有序汇合对象存储的元素长度小于64字节，元素个数小于128个时，该有序汇合对象底层数据结构应用压缩列表；
其它状况，有序汇合对象底层数据结构应用跳表。

对于跳表数据结构，将在后续的文章中学习。

总结

Redis中一共有五种对象类型，每种对象类型会依据元素类型，元素大小和元素数量的不同而采纳不同的底层数据结构，所以可能搞明确Redis中的对象类型，也就搞明确了Redis中的数据结构。