如果执意要做一件事,就不要再问值不值得,心甘情愿才能理所当然,理所当然就会义无反顾。
Redis 基础数据结构有哪些?
一、String(字符串)
在任何一种编程语言里,字符串 String
都是最基础的数据结构,那你有想过 Redis
中存储一个字符串都进行了哪些操作嘛?
在 Redis
中String
是可以修改的,称为 动态字符串
(Simple Dynamic String
简称 SDS
)( 快拿小本本记名词,要考的),说是字符串但它的内部结构更像是一个ArrayList
,内部维护着一个字节数组,并且在其内部预分配了一定的空间,以减少内存的频繁分配。
Redis
的内存分配机制是这样:
- 当字符串的长度小于 1MB 时,每次扩容都是加倍现有的空间。
- 如果字符串长度超过 1MB 时,每次扩容时只会扩展 1MB 的空间。
这样既保证了内存空间够用,还不至于造成内存的浪费,字符串最大长度为 512MB
.。
上图就是字符串的基本结构,其中 content
里面保存的是字符串内容,0x\0
作为结束字符不会被计算 len
中。
分析一下字符串的数据结构
struct SDS{
T capacity; // 数组容量
T len; // 实际长度
byte flages; // 标志位, 低三位表示类型
byte[] content; // 数组内容}
capacity
和 len
两个属性都是泛型,为什么不直接用 int 类型
?因为Redis
内部有很多优化方案,为更合理的使用内存,不同长度的字符串采用不同的数据类型表示,且在创建字符串的时候 len
会和 capacity
一样大,不产生冗余的空间,所以 String
值可以是字符串、数字(整数、浮点数) 或者 二进制。
1、应用场景:
存储 key-value 键值对,这个比较简单不细说了
2、字符串(String)常用的命令:
set [key] [value] 给指定 key 设置值(set 可覆盖老的值)get [key] 获取指定 key 的值
del [key] 删除指定 key
exists [key] 判断是否存在指定 key
mset [key1] [value1] [key2] [value2] ...... 批量存键值对
mget [key1] [key2] ...... 批量取 key
expire [key] [time] 给指定 key 设置过期时间 单位秒
setex [key] [time] [value] 等价于 set + expire 命令组合
setnx [key] [value] 如果 key 不存在则 set 创建,否则返回 0
incr [key] 如果 value 为整数 可用 incr 命令每次自增 1
incrby [key] [number] 使用 incrby 命令对整数值 进行增加 number
二、list(列表)
Redis
中的 list
和Java
中的 LinkedList
很像,底层都是一种链表结构,list
的插入和删除操作非常快,时间复杂度为 0(1),不像数组结构插入、删除操作需要移动数据。
像归像,但是 redis
中的 list
底层可不是一个双向链表那么简单。
当数据量较少的时候它的底层存储结构为一块连续内存,称之为 ziplist(压缩列表)
,它将所有的元素紧挨着一起存储,分配的是一块连续的内存;当数据量较多的时候将会变成quicklist(快速链表)
结构。
可单纯的链表也是有缺陷的,链表的前后指针 prev
和next
会占用较多的内存,会比较浪费空间,而且会加重内存的碎片化。在 redis 3.2 之后就都改用 ziplist+ 链表
的混合结构,称之为quicklist(快速链表)
。
下面具体介绍下两种链表
ziplist(压缩列表)
先看一下 ziplist
的数据结构,
struct ziplist<T>{
int32 zlbytes; // 压缩列表占用字节数
int32 zltail_offset; // 最后一个元素距离起始位置的偏移量, 用于快速定位到最后一个节点
int16 zllength; // 元素个数
T[] entries; // 元素内容
int8 zlend; // 结束位 0xFF
}
int32 zlbytes
:压缩列表占用字节数 int32 zltail_offset
:最后一个元素距离起始位置的偏移量, 用于快速定位到最后一个节点
`int16 zllength`:元素个数
`T[] entries`:元素内容
`int8 zlend`:结束位 0xFF
压缩列表为了支持双向遍历,所以才会有 ztail_offset
这个字段,用来快速定位到最后一
个元素,然后倒着遍历 entry
的数据结构:
struct entry{
int<var> prevlen; // 前一个 entry 的长度
int<var> encoding; // 元素类型编码
optional byte[] content; // 元素内容}
entry
它的 prevlen
字段表示前一个 entry
的字节长度,当压缩列表倒着遍历时,需要通过这
个字段来快速定位到下一个元素的位置。
1、应用场景:
由于 list 它是一个按照插入顺序排序的列表,所以应用场景相对还较多的,例如:
- 消息队列:
lpop
和rpush
(或者反过来,lpush
和rpop
)能实现队列的功能 - 朋友圈的点赞列表、评论列表、排行榜:
lpush
命令和lrange
命令能实现最新列表的功能,每次通过lpush
命令往列表里插入新的元素,然后通过lrange
命令读取最新的元素列表。
2、list 操作的常用命名:
rpush [key] [value1] [value2] ...... 链表右侧插入
rpop [key] 移除右侧列表头元素,并返回该元素
lpop [key] 移除左侧列表头元素,并返回该元素
llen [key] 返回该列表的元素个数
lrem [key] [count] [value] 删除列表中与 value 相等的元素,count 是删除的个数。count>0 表示从左侧开始查找,删除 count 个元素,count<0 表示从右侧开始查找,删除 count 个相同元素,count=0 表示删除全部相同的元素
(PS: index 代表元素下标,index 可以为负数,index= 表示倒数第一个元素,同理 index=-2 表示倒数第二 个元素。)
lindex [key] [index] 获取 list 指定下标的元素(需要遍历,时间复杂度为 O(n))lrange [key] [start_index] [end_index] 获取 list 区间内的所有元素(时间复杂度为 O(n))ltrim [key] [start_index] [end_index] 保留区间内的元素,其他元素删除(时间复杂度为 O(n))
三、hash(字典)
Redis
中的 Hash
和 Java 的 HashMap
更加相似,都是 数组 + 链表
的结构,当发生 hash 碰撞时将会把元素追加到链表上,值得注意的是在 Redis
的Hash
中 value
只能是字符串.
hset books java "Effective java" (integer) 1
hset books golang "concurrency in go" (integer) 1
hget books java "Effective java"
hset user age 17 (integer) 1
hincrby user age 1 #单个 key 可以进行计数 和 incr 命令基本一致 (integer) 18
Hash
和 String
都可以用来存储用户信息,但不同的是 Hash
可以对用户信息的每个字段单独存储;String
存的是用户全部信息经过序列化后的字符串,如果想要修改某个用户字段必须将用户信息字符串全部查询出来,解析成相应的用户信息对象,修改完后在序列化成字符串存入。而 hash 可以只对某个字段修改,从而节约网络流量,不过 hash 内存占用要大于 String
,这是hash
的缺点。
1、应用场景:
- 购物车:
hset [key] [field] [value]
命令,可以实现以用户 Id
,商品 Id
为field
,商品数量为value
,恰好构成了购物车的 3 个要素。 - 存储对象:
hash
类型的(key, field, value)
的结构与对象的(对象 id, 属性, 值)
的结构相似,也可以用来存储对象。
2、hash 常用的操作命令:
hset [key] [field] [value] 新建字段信息
hget [key] [field] 获取字段信息
hdel [key] [field] 删除字段
hlen [key] 保存的字段个数
hgetall [key] 获取指定 key 字典里的所有字段和值(字段信息过多, 会导致慢查询 慎用:亲身经历 曾经用过这个这个指令导致线上服务故障)hmset [key] [field1] [value1] [field2] [value2] ...... 批量创建
hincr [key] [field] 对字段值自增
hincrby [key] [field] [number] 对字段值增加 number
四、set(集合)
Redis
中的 set
和Java
中的 HashSet
有些类似,它内部的键值对是无序的、唯一 的。它的内部实现相当于一个特殊的字典,字典中所有的 value 都是一个值 NULL。当集合中最后一个元素被移除之后,数据结构被自动删除,内存被回收。
1、应用场景:
- 好友、关注、粉丝、感兴趣的人集合:
1)sinter
命令可以获得 A 和 B 两个用户的共同好友;
2)sismember
命令可以判断 A 是否是 B 的好友;
3)scard
命令可以获取好友数量;
4) 关注时,smove
命令可以将 B 从 A 的粉丝集合转移到 A 的好友集合 - 首页展示随机:美团首页有很多推荐商家,但是并不能全部展示,set 类型适合存放所有需要展示的内容,而
srandmember
命令则可以从中随机获取几个。 - 存储某活动中中奖的用户 ID,因为有去重功能,可以保证同一个用户不会中奖两次。
2、set 的常用命令:
sadd [key] [value] 向指定 key 的 set 中添加元素
smembers [key] 获取指定 key 集合中的所有元素
sismember [key] [value] 判断集合中是否存在某个 value
scard [key] 获取集合的长度
spop [key] 弹出一个元素
srem [key] [value] 删除指定元素
五、zset(有序集合)
zset
也叫 SortedSet
一方面它是个 set
,保证了内部 value 的唯一性,另方面它可以给每个 value 赋予一个score
,代表这个 value 的排序权重。它的内部实现用的是一种叫作“ 跳跃列表
”的数据结构。
1、应用场景:
zset
可以用做排行榜,但是和 list
不同的是 zset
它能够实现动态的排序,例如:可以用来存储粉丝列表,value 值是粉丝的用户 ID,score 是关注时间,我们可以对粉丝列表按关注时间进行排序。
zset
还可以用来存储学生的成绩,value
值是学生的 ID,score
是他的考试成绩。我们对成绩按分数进行排序就可以得到他的名次。
2、zset 有序集合的常用操作命令:
zadd [key] [score] [value] 向指定 key 的集合中增加元素
zrange [key] [start_index] [end_index] 获取下标范围内的元素列表,按 score 排序输出
zrevrange [key] [start_index] [end_index] 获取范围内的元素列表,按 score 排序 逆序输出
zcard [key] 获取集合列表的元素个数
zrank [key] [value] 获取元素再集合中的排名
zrangebyscore [key] [score1] [score2] 输出 score 范围内的元素列表
zrem [key] [value] 删除元素
zscore [key] [value] 获取元素的 score