Redis-5种数据结构-及使用场景分析

也当过面试官，面试过不少应聘者，因为是我自己招人自己用，所以我不会看应聘者造火箭的技术有多牛比，只看拧螺丝的手艺瓷不瓷实。毕竟以后是一个整体，拖了大家后腿团队都很难受。

面试的题目一般也不会太难，就像问Redis，我只是想确认他真正用过就够了。Redis 5 种基础数据结构和简单操作要知道，最基本的要求，如果这个时候他会说出每种数据结构大致的应用场景，那么这一定是加分的，起码要比那些只会说出几种数据结构后，在那干瞪眼等我问下一个问题的强很多，千万别冷场。

在任何一种编程语言里，字符串 String 都是最基础的数据结构，那你有想过 Redis 中存储一个字符串都进行了哪些操作嘛？

在 Redis 中String是可以修改的，称为 动态字符串 (Simple Dynamic String 简称 SDS)（ 快拿小本本记名词，要考的），说是字符串但它的内部结构更像是一个 ArrayList，内部维护着一个字节数组，并且在其内部预分配了一定的空间，以减少内存的频繁分配。

Redis的内存分配机制是这样：

当字符串的长度小于 1MB 时，每次扩容都是加倍现有的空间。
如果字符串长度超过 1MB 时，每次扩容时只会扩展 1MB 的空间。

这样既保证了内存空间够用，还不至于造成内存的浪费，字符串最大长度为 512MB.。

以上图片源自网络，如有侵权联系删除

上图就是字符串的基本结构，其中 content 里面保存的是字符串内容，0x\0作为结束字符不会被计算 len 中。

分析一下字符串的数据结构

struct SDS{
  T capacity;       // 数组容量
  T len;            // 实际长度
  byte flages;  // 标志位, 低三位表示类型
  byte[] content;   // 数组内容}

capacity 和 len两个属性都是泛型，为什么不直接用 int 类型？因为Redis 内部有很多优化方案，为更合理的使用内存，不同长度的字符串采用不同的数据类型表示，且在创建字符串的时候 len 会和 capacity 一样大，不产生冗余的空间，所以 String 值可以是字符串、数字（整数、浮点数) 或者二进制。

1、应用场景：

存储 key-value 键值对，这个比较简单不细说了

2、字符串（String）常用的命令：

set   [key]  [value]   给指定 key 设置值（set 可覆盖老的值）get  [key]   获取指定 key 的值

del  [key]   删除指定 key

exists  [key]  判断是否存在指定 key

mset  [key1]  [value1]  [key2]  [value2] ...... 批量存键值对

mget  [key1]  [key2] ......   批量取 key

expire [key]  [time]    给指定 key 设置过期时间  单位秒

setex    [key]  [time]  [value]  等价于 set + expire 命令组合

setnx  [key]  [value]   如果 key 不存在则 set 创建，否则返回 0

incr   [key]           如果 value 为整数 可用 incr 命令每次自增 1

incrby  [key] [number]  使用 incrby 命令对整数值 进行增加 number

Redis中的 list 和Java中的 LinkedList 很像，底层都是一种链表结构，list的插入和删除操作非常快，时间复杂度为 0(1)，不像数组结构插入、删除操作需要移动数据。

像归像，但是 redis 中的 list 底层可不是一个双向链表那么简单。

当数据量较少的时候它的底层存储结构为一块连续内存，称之为 ziplist(压缩列表)，它将所有的元素紧挨着一起存储，分配的是一块连续的内存；当数据量较多的时候将会变成quicklist(快速链表) 结构。

可单纯的链表也是有缺陷的，链表的前后指针 prev 和 next 会占用较多的内存，会比较浪费空间，而且会加重内存的碎片化。在 redis 3.2 之后就都改用 ziplist+ 链表 的混合结构，称之为 quicklist(快速链表)。

下面具体介绍下两种链表

先看一下 ziplist 的数据结构，

struct ziplist<T>{
    int32 zlbytes;            // 压缩列表占用字节数
    int32 zltail_offset;    // 最后一个元素距离起始位置的偏移量, 用于快速定位到最后一个节点
    int16 zllength;            // 元素个数
    T[] entries;            // 元素内容
    int8 zlend;                // 结束位 0xFF
}

int32 zlbytes：压缩列表占用字节数
int32 zltail_offset：最后一个元素距离起始位置的偏移量, 用于快速定位到最后一个节点

`int16 zllength`：元素个数
`T[] entries`：元素内容
`int8 zlend`：结束位 0xFF

压缩列表为了支持双向遍历，所以才会有 ztail_offset 这个字段，用来快速定位到最后一
个元素，然后倒着遍历

以上图片源自网络，如有侵权联系删除

entry的数据结构：

struct entry{
    int<var> prevlen;            // 前一个 entry 的长度
    int<var> encoding;            // 元素类型编码
    optional byte[] content;    // 元素内容}

entry它的 prevlen 字段表示前一个 entry 的字节长度，当压缩列表倒着遍历时，需要通过这
个字段来快速定位到下一个元素的位置。

1、应用场景：

由于 list 它是一个按照插入顺序排序的列表，所以应用场景相对还较多的，例如：

消息队列：lpop和 rpush（或者反过来，lpush 和rpop）能实现队列的功能
朋友圈的点赞列表、评论列表、排行榜：lpush命令和 lrange 命令能实现最新列表的功能，每次通过 lpush 命令往列表里插入新的元素，然后通过 lrange 命令读取最新的元素列表。

2、list 操作的常用命名：

rpush  [key] [value1] [value2] ......    链表右侧插入

rpop    [key]  移除右侧列表头元素，并返回该元素

lpop   [key]    移除左侧列表头元素，并返回该元素

llen  [key]     返回该列表的元素个数

lrem [key] [count] [value]  删除列表中与 value 相等的元素，count 是删除的个数。count>0 表示从左侧开始查找，删除 count 个元素，count<0 表示从右侧开始查找，删除 count 个相同元素，count=0 表示删除全部相同的元素

(PS:   index 代表元素下标，index 可以为负数，index= 表示倒数第一个元素，同理 index=-2 表示倒数第二 个元素。)

lindex [key] [index]  获取 list 指定下标的元素（需要遍历，时间复杂度为 O(n)）lrange [key]  [start_index] [end_index]   获取 list 区间内的所有元素（时间复杂度为 O（n））ltrim  [key]  [start_index] [end_index]   保留区间内的元素，其他元素删除（时间复杂度为 O（n））

Redis 中的 Hash和 Java 的 HashMap 更加相似，都是 数组 + 链表 的结构，当发生 hash 碰撞时将会把元素追加到链表上，值得注意的是在 Redis 的 Hash 中 value 只能是字符串.

hset books java "Effective java" (integer) 1
hset books golang "concurrency in go" (integer) 1
hget books java "Effective java"
hset user age 17 (integer) 1
hincrby user age 1    #单个 key 可以进行计数 和 incr 命令基本一致 (integer) 18

Hash 和 String 都可以用来存储用户信息，但不同的是 Hash 可以对用户信息的每个字段单独存储；String存的是用户全部信息经过序列化后的字符串，如果想要修改某个用户字段必须将用户信息字符串全部查询出来，解析成相应的用户信息对象，修改完后在序列化成字符串存入。而 hash 可以只对某个字段修改，从而节约网络流量，不过 hash 内存占用要大于 String，这是 hash 的缺点。

1、应用场景：

购物车：hset [key] [field] [value] 命令，可以实现以 用户 Id，商品 Id为field，商品数量为value，恰好构成了购物车的 3 个要素。
存储对象：hash类型的 (key, field, value) 的结构与对象的 (对象 id, 属性, 值) 的结构相似，也可以用来存储对象。

2、hash 常用的操作命令：

hset  [key]  [field] [value]    新建字段信息

hget  [key]  [field]    获取字段信息

hdel [key] [field]  删除字段

hlen  [key]   保存的字段个数

hgetall  [key]  获取指定 key 字典里的所有字段和值（字段信息过多, 会导致慢查询 慎用：亲身经历 曾经用过这个这个指令导致线上服务故障）hmset  [key]  [field1] [value1] [field2] [value2] ......   批量创建

hincr  [key] [field]   对字段值自增

hincrby [key] [field] [number] 对字段值增加 number

Redis 中的 set和 Java 中的HashSet 有些类似，它内部的键值对是无序的、唯一的。它的内部实现相当于一个特殊的字典，字典中所有的 value 都是一个值 NULL。当集合中最后一个元素被移除之后，数据结构被自动删除，内存被回收。

1、应用场景：

好友、关注、粉丝、感兴趣的人集合：
1) sinter命令可以获得 A 和 B 两个用户的共同好友；
2) sismember命令可以判断 A 是否是 B 的好友；
3) scard命令可以获取好友数量；
4) 关注时，smove命令可以将 B 从 A 的粉丝集合转移到 A 的好友集合
首页展示随机：美团首页有很多推荐商家，但是并不能全部展示，set 类型适合存放所有需要展示的内容，而 srandmember 命令则可以从中随机获取几个。
存储某活动中中奖的用户 ID，因为有去重功能，可以保证同一个用户不会中奖两次。

2、set 的常用命令：

sadd  [key]  [value]  向指定 key 的 set 中添加元素

smembers [key]    获取指定 key 集合中的所有元素

sismember [key] [value]   判断集合中是否存在某个 value

scard [key]    获取集合的长度

spop  [key]   弹出一个元素

srem [key] [value]  删除指定元素

zset也叫 SortedSet 一方面它是个 set，保证了内部 value 的唯一性，另方面它可以给每个 value 赋予一个 score，代表这个 value 的排序权重。它的内部实现用的是一种叫作“ 跳跃列表”的数据结构。

1、应用场景：

zset 可以用做排行榜，但是和 list 不同的是 zset 它能够实现动态的排序，例如：可以用来存储粉丝列表，value 值是粉丝的用户 ID，score 是关注时间，我们可以对粉丝列表按关注时间进行排序。

zset 还可以用来存储学生的成绩，value 值是学生的 ID, score 是他的考试成绩。我们对成绩按分数进行排序就可以得到他的名次。

2、zset 有序集合的常用操作命令：

zadd [key] [score] [value] 向指定 key 的集合中增加元素

zrange [key] [start_index] [end_index] 获取下标范围内的元素列表，按 score 排序输出

zrevrange [key] [start_index] [end_index]  获取范围内的元素列表，按 score 排序 逆序输出

zcard [key]  获取集合列表的元素个数

zrank [key] [value]  获取元素再集合中的排名

zrangebyscore [key] [score1] [score2]  输出 score 范围内的元素列表

zrem [key] [value]  删除元素

zscore [key] [value] 获取元素的 score

本文很多概念都一带而过了，只是给大家粗略的讲述一下 Redis 五种基础数据结构和应用场景，旨在给小伙伴们一个面试备题的方向，后续会持续输出 Redis 方面的文章，欢迎关注，咱们一起学习拿 offer。

Redis-5种数据结构-及使用场景分析

Redis 基础数据结构有哪些？

一、String（字符串）

二、list(列表)

ziplist(压缩列表)

三、hash（字典）

四、set(集合)

五、zset(有序集合)

总结