经验拾忆纯手工-Redis与Python操作Redis语法对比解析

jiezi

5 年前

R: 代表 redis-cli
P: 代表 python 的 redis

pip install redis
pool = redis.ConnectionPool(host='39.107.86.223', port=6379, db=1)
redis = redis.Redis(connection_pool=pool)
redis. 所有命令
下面命令所有命令我都省略了，有和 Python 内置函数冲突的我会加上 redis.

   R: dbsize
   P: print(redis.dbsize())

   R: exists name
   P: exists('name')

   R: keys na*
   P: keys('na*')
   注：时间复杂度为 O(n)

   R: scan 0 match '*' count 4       
   P: keys_iter = redis.scan_iter(match='*', count=4)  
   注：这种 scan，API 后面也会有，所以我全部放在最后的结束语中讲

   R: info            # 也可以填参数  info memory     info cpu 等
   P: redis.info()    # redis.info('CPU')     redis.info('MEMORY')

   R: type name
   P: redis.type('name')   # type 和 python 的冲突了，所以这里我写全了    
   redis 中类型有：none string list    set zset     hash

   R: expire name 秒数
   P: expire('name',  秒数)

   R: ttl name     
   P: ttl('name')
   
   # 返回剩余过期时间值
   # 返回值为 -2 则代表 无此 key
   # 返回值为 -1 则代表 有此 key，但未设置过期时间

   R: persist name
   P: persist('name')

   incr incrby     加上一个整数
       R: incr age   或 incrby age 1
       P: incr age 1 或 incrby age 1        # python 实现 的 incr 被 重定向为 incrby，所以用哪个都行
       
   decr decrby     减去一个整数
       同上
   
   incrbyfloat     加减一个浮点数
       同上

   R: set name lin
   P: redis.set('name', 'lin') 

   set 选项（原子操作）nx（设置默认值）R: set name lin nx    
           P: redis.set('name', 'lin', nx=True)
               注：nx 代表 key 不存在才会将值设置成功，类似 python dict 的 setdefault，即给 key 设置默认值
           
       xx（更新值）R: set name Tom xx
           P: redis.set('name', 'lin', xx=True)
               注：xx 代表 key 存在才会将值更新成功。如果 key 不存在，则更新失败。

   R: get name
   P: redis.get('name')
   注：通过 py redis 客户端的 get 取出的都是 字节二进制类型，所以需要手动转为对应类型
       前面提到的 incr decr 等，操作返回结果直接就是 int，而非 字节类型

   R: mset name lin age 18
   p: redis.mset({'name': 'lin', 'age': 18} )

   R: mget name age
   p: redis.mget('name', 'age')    # 返回值为 字节类型的 列表

   R: getset name zhang
   P: print(redis.getset('name', 'zhang') )

   R: append name abc
   P: redis.append('name', 'abc')

   R: strlen name
   P: print(redis.strlen('name') )
   注：与编程语言的普遍 API 不同的是，strlen 返回的字符串 长度是 字符对应编码的长度。。。。中文 utf-8 占 3 个字节

   R: getrange name 1 2
   P: redis.getrange('name', 1, 2)

   R: setrange name 0 abc     # 把第 0 个位置开始，逐个覆盖赋值为 abc，多余的不变
   P: redis.setrange('name', 0, 'abc')

   R: del k1 k2
   P: redis.delete(k1, k2)

   R: hset user name lin
   P: redis.hset('user', 'name', 'lin')

   R: hget user name
   P: print(redis.hget('user', 'name'))

   R: hmset user name lin age 18
   P: redis.hmset('user', {'user': 'lin', 'age': 18})

   R: hmget user name age
   P: print(redis.hmget('user', 'name', 'age'))

   R: hkeys user
   P: print(redis.hkeys('user'))

   R: hvals user
   P: print(redis.hvals('user'))

   R: hgetall user                    # 返回为列表，偶数索引为 key，奇数索引为 vaLue(从 0 开始)
   P: print(redis.hgetall('user'))    # 返回为 dict 格式
   
   注：hgetall 会将所有 key-value 取出来，所以数据量庞大可能会造成性能影响。大批量数据在 python 是怎么处理来着？？？？？？？没错，就是迭代器，当然 python 的 redis 模块已为我们封装好一个 API，hscan_iter, 见一条 API

   R: hscan user 0 match * count 200        # 按游标，按数量取
       # 0 代表游标从头开始
       # match 是关键字 
       # * 是 key 的通配符
       # count 是一次接待的条数
   P: result_iter = redis.hscan_iter('user', match= 'na*', count=2)    
       # python 的 cursor 参数没有，是因为源码中被固定设置为 0 了，其他参数解释同上
       # 返回结果为可迭代对象，可遍历取出。

   R: hexists user name1                   # 存在返回 1，不存在返回 0
   P: print(redis.hexists('user', 'name')) # 存在返回 True

   R: hlen user
   P: print(redis.hlen('user'))

   R: lpush list1 1 2 3
   P: redis.lpush('list1', 1,2,3)

rpush (右压栈，同左压栈，略)

   R: lpop list2
   P: print(redis.lpop('list2'))

rpop (右弹栈，同左弹栈，略)

   R: blpop list2 1000      # 1000 为过期时间为 1000 秒，1000 秒后自动解除阻塞，有值加入也会解除阻塞
   P: redis.blpop('list2', timeout=1000)

brpop (右阻塞弹栈，同左阻塞弹栈，略)

   R: linsert list2 before Tom jerry                # 在 Tom 前插入 jerry, before 代表之前
   P: redis.linsert('list2', 'after', 'b', 'Tom')   # 在 b 的后面插入 Tom,  after 代表之后

   R：lset list2 4 zhang
   P: redis.lset('list2', 4, 'zhang')

   R: lindex list2 -3
   P: print(redis.lindex('list2', 3))

   R: llen list2
   P: print(redis.llen('list2'))

   R: ltrim list2 3 10                     # 保留 索引 3-10 的列表数据，其他都删除
   P: print(redis.ltrim('list2', 2, -1))   # 索引前闭后闭，可正可负

   R: lrem list2 0 Tom    
       # 0 这个位置的参数代表删除值的个数
           # 0 代表全部删除，删除全部 Tom 值
           # 正数代表 从左到右 删除 n 个。eg:  lrem list2 5 Tom    即为 从左到右 删除 5 个 Tom 值
           # 负数代表 从右到左 删除 n 个。eg:  lrem list2 -5 Tom   即为 从右到左 删除 5 个 Tom 值
   P: print(redis.lrem('list2', -5, 1))    # 解释同上

   R: lrange list1 0 -1 
   P: print(redis.lrange('list2', 0, -1))

   R: sadd set1 1 2 3
   P: redis.sadd('set1', *[1,2,3])

   R: srem set1 Tom
   P: redis.srem('set1', 'Tom')

   R: scard set1
   P: redis.scard('set1')

   R: sismember set1 Tom
   P: redis.sismember('set1', 'Tom')

“”“类似 py 的 random.choices，注意有 s”“R: srandmember set1 2             # 从集合随机中取出 2 个元素
   P: redis.srandmember('set1', 2)

   R: smembers set1
   P: redis.smembers('set1')
   注：同 hgetall，如果一次性取出，可能会出问题，所以需要迭代获取，见下 sscan

   R: sscan set1 0 match * count 200
   P: result_iter = redis.sscan_iter('set1', match='*', count=200)    # 遍历迭代

   R: sdiff sset1 sset2
   P: print(redis.sdiff('sset1', 'sset2'))

   R: sinter sset1 sset2
   P: print(redis.sinter('sset1', 'sset2'))

   R: sunion sset1 sset2
   P: print(redis.sunion('sset1', 'sset2'))

   R: zadd zset 100 Tom 90 Jerry    #  100 是权重，Tom 是数据值，注意 redis-cli  权重在前，值在后
   P: redis.zadd('zset', {'Tom': 100, 'Jerry': 90})    # 注意，py 语法，权重作为字典的 value
   注特别注意：zadd 的默认机制是同值，不同权重时，会更新值的权重
       eg: 上面再插入一条 Tom, 不过这次的权重是 50（zadd zset 50 Tom），则 Tom 的权重会更新为 50
       
   这时就延申出 2 个参数，（应该还记得前面讲的 set 的 nx 和 xx 参数吧，没错 zadd 也有）nx:（不存在才更新（添加），存在则更新（添加）失败）R: zadd zset nx 1000 Tom            
       P: redis.zadd('zset',{'Tom': 1000}, nx=True)    
       注：如果 Tom 这个值之前存在，则这个 1000 就不会被更新了
           若不存在，则就会新创建，并把这个 1000 设置成功
           
   nx：（存在才更新（添加），不存在则更新（添加）失败）R: zadd zset xx 1000 Tom            
       P：redis.zadd('zset',{'Tom': 1000}, xx=True)    
       注：如果 Tom 这个值之前存在，则 1000 才会更新成功
           如果不存在，比如 {'张三':500}, 张三本来就不存在，用了 xx, 他不会被添加进来，更何谈更新

   R: zrange zset 0 -1
   P: print(redis.zrange('zset', 0, -1))    # 返回值为列表

   withscores 参数（把权重也带出来返回）：R: zrange zset 0 -1 withscores    # 注意，返回时 奇数位 是值，偶数位是权重
       P: print(redis.zrange('zset', 0, -1, withscores=True))  # 返回列表嵌套元组，[(值，权重)]

   这条 API 就是多了 "rev" 三个字母,   reversed 单词 熟悉把，python 内置逆序高阶函数。。就是那个意思
   操作同 zrange，略

   R: zrangebyscore zset 40 99 limit 1 3   # 查出权重在 40-99 之内的数据，并从第 1 条开始，返回 3 条
       # 40-99 都是闭区间，要想变成开区间这样写即可   (40 (99
   P: print(redis.zrangebyscore('zset', 40, 99, start=1, num=3))

   操作同 zrangebyscore，略
   这 API 设计的，还不如，直接弄成一条命令，然后加一个逆序参数，吐槽！！！！

   R: zrem zset Tom        # 删除 Tom 这个值
   P: print(redis.zrem('zset','Tom'))

   R: zremrangebyscore zset 70 90        # 把权重在 70-90 分的所有数据删除
   P: redis.zremrangebyscore('zset', 70, 90)

   R: zremrangebyrank zset 0 -1    # 删除所有值（0 到 - 1 的索引就代表所有值啦！）P: redis.zremrangebyrank('zset', 0, -1)    # redis 的 API 风格真的。。。没办法 python 也无奈同名

   R: zcard zset
   P: print(redis.zcard('zset'))

   R: zcount zset 10 69         # 同样默认闭区间，( 可改为开区间
   P: print(redis.zcount('zset',50, 69))

   R: zrank zset Jerry       # 不用猜，索引肯定从 0 开始
   P: print(redis.zrank('zset', 'Jerry'))

   逆序获取索引，比如最后一个，索引就是 0
   具体操作，同 zrank，略

   R: zscore zset Jerry
   P: print(redis.zscore('zset', 'Jerry'))

   """
       嗯? 似曾相识燕归来？前面说过的 scan hsacn sscan 还有接下来要说的 zscan 都是一个样子的，都是为了应对大数据来迭代处理
       python 版的 redis 给了我们一个简化函数, 那就是 _iter 结尾的，eg: hscan_iter()
       这种 _iter 结尾的函数，不用我们来传游标 cursor 参数，为啥呢??
           一. 因为 python 有生成器 - 迭代器机制阿！（当然 _iter 等函数的源码就是用 yield 为我们实现的）二. cursor 游标不易于管理
   """
   R: zscan zset 0 match * count 5 
   P: zset_iter = redis.zscan_iter('zset', match='*', count=5)   # 同理返回可迭代对象
   注：还要说明一下：match 参数:  
           过滤查询数据（其实过滤完了，数据量小了也没必要用 scan 了，此参数主要用在 "hscan" 之类的）"因此 match 参数可不写",  "match='*'和 不传是一个效果的。"
       count 参数：Py 源码解释   ``count`` allows for hint the minimum number of returns
           意思就是：这个参数是一次迭代 "最少" 取 5 个 "，但不管怎么说，最终还是会取出全部数据！！

   """RDB 机制就是 触发生成 RDB 文件，将 Redis 数据以二进制形式写入其中，触发方式有如下三种"""
   RDB 基本配置：vi /etc/redis/redis.conf
           dbfilename dump.rdb    # 配置 RDB 文件名
           dir /var/lib/redis     # 配置 RDB 文件存放目录（ll 命令查看 dump.rdb 是否为最新时间）appendonly no          # 若为 yes, 会优先按照 aof 文件来恢复，或不恢复
   上述配置，可在下面三种方法实现的时候，自动触发生成 RDB 文件。并在 redis 启动时恢复 RDB 文件

触发方式 1：save（阻塞）
```
   R: save
   P: redis.save()
```
触发方式 2：bgsave（开 fork 进程，异步, 非阻塞）
```
   R: bgsave
   P: redis.bgsave()
```

   在上面 RDB 基本配置基础上，追加如下配置
   vi /etc/redis/redis.conf
       save 100 10    # 100 秒钟改变 10 条数据就会，自动生成 RDB 文件

   大数据耗时，RDB 文件写入影响 IO 性能。宕机数据不可控

   """AOF 机制就是 每执行一条命令，都会记录到缓冲区，在根据某种策略刷新到 AOF 文件中，策略有如下三种"""
   AOF 基本配置：vi /etc/redis/redis.conf
           appendonly yes    # 开关，先要打开
           appendfilename "appendonly.aof"    # AOF 文件名
           dir /var/lib/redis     # AOF 文件目录（和 RDB 是一样的）

   always 即缓冲区有一条命令，就会刷新追加到 AOF 文件中（安全可靠，耗 IO）

   everysec 即每过 1 秒 就会把缓冲区的命令 刷新追加到 AOF 文件中
           如果就在这一秒钟宕机，那么数据就丢失了。。。（1 秒不可控）

   no 即 什么时候刷新，全听操作系统自己的（完全不可控）

AOF 重写机制（两种方法, 异步）

   如上可知，越来越多的命令会追加到 AOF 中，其中可能会有一些类似
       一、键值覆盖：set name tom
               set name jerry
       二、超时时间过期
       三、多条插入（可用一条命令代替）如上无用命令，会让 AOF 文件变得繁杂。可通过 AOF 重写策略优化来达到化简，提高恢复速度等。

   一、开 fork 子进程 新弄一份 AOF 文件，它的任务就是把当前 redis 中的数据重新按照上面的”重写清洁过程“捋一遍，并记录到这个新 AOF 文件中
   二、此时主进程可以正常接受用户的请求及修改，（这时可能子进程 AOF，和数据库内容不一致, 往下看）三、其实 --- 第一条开 fork 的时候，顺便也开了一份内存空间 A（名为重写缓冲区）用来平行记录 用户新请求的命令
   四、当子进程 AOF 重写完事后，会把上面 空间 A 中 中的数据命令追加到 AOF 中（类似断点复制）五、新 AOF 替代 旧的 AOF
   
   打个比方（针对于 二、三、四）：就是，你给我一个任务，我正做着，你又给我很多任务，我当然忙不过来
       那这样，你先拿个清单记录下来，一会等我忙完了，咱们对接一下就好了）

   R: bgrewriteaof
   P: redis.bgrewriteaof()

   在上面 AOF 基本配置的基础上，追加如下配置
   vi /etc/redis/redis.conf
       appendfsync everysec    # 就是上面说的三种策略，选一种  always no
       auto-aof-rewrite-min-size 64mb     # 当 AOF 文件超过 64mb 就会自动重写
       auto-aof-rewrite-percentage 100    # 100 为增长率，每一次的限制大小是之前的 100%, 也就是二倍

       no-appendfsync-on-rewrite yes     # yes 就是不把“重写缓冲区”的内容 刷新到 磁盘
       注意这个参数:
           这就是针对上面’重写原理‘中的第三条 中的 内存空间 A（重写缓冲区）如果这个 重写缓冲区 不刷新持久化到磁盘中，要是宕机了，那么这个缓冲区的数据就会丢失。丢失多少呢？据悉（linux 中 最多最多 会丢失 30 秒的数据）如果你将其 设置为 no，那么 重写缓冲区 就会像 前面讲的 原始 AOF 一样地 刷新持久化到硬盘中。但是你想想，如果 重写缓冲区  和 原始 AOF 都做持久化刷新
               那么 它们就会 竞争 IO，性能必定大打折扣，特殊情况下，还可能 堵塞。so, 要性能（设为 yes），要数据完整安全 (设为 no)，自己选....

 本文主要写了关于 redis 以及 python 操作 redis 的语法对比详细解释！！python 的 redis API 也是非常够意思了，函数名几乎完全还原 原生 Redis！！语法部分印象比较深刻的就是 "redis 的 scan 家族函数" 以及 "python 的 scan_iter" 家族函数：上面陆陆续续讲了那么多数据结构，都有它们各自的 "遍历所有数据的操作"
    但对于大量数据的情况下，这些遍历函数就都变成渣渣了，可能会造成 "OOM（内存溢出）等情况"
    这时 redis 机智的为我们 提供了一些列 "scan 家族函数" , 当然这些函数是都需要游标控制的。"游标 cursor" 是比较头疼的东西，因此 python 本着 人性化的思想：将 "scan 家族函数" 封装为 "scan_iter 家族函数"，让我们省去了游标的操作，可以愉快编程！那我就列出全部大家族 以及 对应 原始遍历函数：原始遍历    redis    python
        keys       scan     scan_iter
        hgetall    hscan    hscan_iter
        smembers   sscan    sscan_iter
        zrange     zscan    zscan_iter
        沿着这个对应规律，之前我发现一件事情：为什么 "list 的 lrange 没有对应的 lscan？"
        我像 zz 一样还去 ov 查了一遍，居然还看到一位外国朋友和我有一样的疑问。。。解答者的一句话，我直接就清醒了，"Instead, you should use LRANGE to iterate the list"
            由于顺着规律，思维定势，却忘记了 "lrange 本身就可以带索引来迭代"   lrange list1 0 n
            
        这时我突然又想起 zrange 不也是和 lrange 语法一样么？？？为何 zrange 单独设立了一个 zscan，而 list 却没？？？(查了一下好像是 list 底层性能之类的原因，我也没愿意继续看了。。。)
    
    scan 与 iter 家族函数，各自的数据结构章节都有写，并且在 "zset" 那节的 "zscan" 那里做出了详细的分析
END

前言

准备

全局命令

dbsize（返回 key 的数量）

exists（是否存在某 key）

keys（列出所有 key, 可使用通配符）

scan (对应 keys，迭代取出所有 keys)

info (查看资源信息)

type (列出类型)

过期时间

expire(设置)

ttl(查询)

persist(删除)

自增，自减

字符串相关操作

set 设置值

get 获取值

mset 批量设置

mget 批量获取

getset 设置新值并返回旧值

append 字符串追加拼接

strlen 获取字符串长度

getrange 字符串切片（从 0 开始，前闭后闭）

setrange 字符串按索引赋值（覆盖）

del 删除键值

Hash 相关操作 (可对应为 文档 - 属性 - 值)

hset 设置 1 条文档，1 个属性 - 值

hget 获取 1 条文档，1 个属性

hmset 设置 1 条文档，多个属性 - 值

hmget 获取 1 条文档，多个属性 - 值

hkeys 获取所有 key

hvals 获取所有 values

hgetall 获取 一条文档，所有属性值（慎用，见下一条 API）

hscan（hash 迭代，大体上可代替 hgetall 使用）

hexists 检测是否存在某 key

hlen 统计获取一个文档，所有属性的 总数

List 相关操作

lpush (左压栈)

rpush (右压栈，同左压栈，略)

lpop (左弹栈)

rpop (右弹栈，同左弹栈，略)

blpop (左阻塞弹栈，列表为空时，就阻塞了)

brpop (右阻塞弹栈，同左阻塞弹栈，略)

linsert (在指定 值 的 前后 插入值)

lset (按索引赋值, 注意索引不要越界)

lindex (按索引取值, 索引可正可负)

llen（获取列表元素个数）

ltrim (注意：在原数据上切片，不返回值。)

lrem (删除指定值)

lrange(遍历，正负索引都可，前闭后闭)

Set 相关操作

sadd（插入元素）

srem（删除指定值的元素）

scard（获取集合中元素个数）

sismember (判断某元素是否在集合)

srandmember (随机取出集合指定个数元素)

smembers (取出集合中所有元素)

sscan (游标 / 迭代取出集合所有元素)

sdiff (差集)

sinter（交集）

sunion (并集)

zset 有序集合相关操作

zadd (有序插入)

zrange (遍历)

zrevrange (逆序 - 降序，遍历)

zrangebyscore (根据权重来遍历)

zrevrangebyscore (根据权重来 逆序遍历)

zrem (删除某值)

zremrangebyscore (删除 权重 范围内的值)

zremrangebyrank (删除 索引 范围内的值)

zcard (获取有序集合的 所有 元素个数)

zcount (统计有序集合的 某权重范围的 元素个数)

zrank (获取某元素的索引)

zrevrank (逆序 获取某元素的索引)

zscore (获取某元素对应的权重)

zscan (迭代方式和返回 所有元素及其权重)

Redis 两种持久化的方式

生成 RDB 文件（三种方法）

触发方式 1：save（阻塞）

触发方式 2：bgsave（开 fork 进程，异步, 非阻塞）

Hash 相关操作 (可对应为文档 - 属性 - 值)

hgetall 获取一条文档，所有属性值（慎用，见下一条 API）

hlen 统计获取一个文档，所有属性的总数

linsert (在指定值的前后插入值)

zrevrangebyscore (根据权重来逆序遍历)

zremrangebyscore (删除权重范围内的值)

zremrangebyrank (删除索引范围内的值)

zcard (获取有序集合的所有元素个数)

zcount (统计有序集合的某权重范围的元素个数)

zrevrank (逆序获取某元素的索引)

zscan (迭代方式和返回所有元素及其权重)