Redis篇-5-redis-持久化之-RDB-AOF

39次阅读

共计 4207 个字符,预计需要花费 11 分钟才能阅读完成。

Redis 持久化实现方式

  • 快照
    对数据某一时间点的完整备份。例如 Linux 快照备份、Redis RDB、MySQL Dump。
  • 日志
    将数据的所有操作都记录到日志中,需要恢复时,将日志重新执行一次。MySQL biglog、Redis AOF。
RDB

什么是 RDB

将 redis 内存中的数据,完整的生成一个快照,以.rdb 结尾的文件保存在硬盘上,当需要恢复时,再从文件加载到内存中。

RDB 三种触发方式
  • save 命令触发(同步)
[vagrant@tmwy ~]$ redis-cli
127.0.0.1:6379> save
OK

save 执行时,会造成 Redis 的阻塞。所有数据操作命令都要排队等待它完成。
文件策略:新生成一个新的临时文件,当 save 执行完后,用新的替换老的。

  • bgsave 命令触发(异步)
[vagrant@tmwy ~]$ redis-cli
127.0.0.1:6379> bgsave
Background saving started

客户端对 Redis 服务器下达 bgsave 命令时,Redis 会 fork 出一个子进程进行 rdb 文件的生成。当文件生成完毕后,子进程再反馈给主进程。fork 子进程时也会阻塞,不过正常情况下 fork 过程都非常快的。
文件策略:与 save 命令相同。

  • 配置文件配置规则自动触发
配置 seconds changes 作用
save 900 1 900 秒内改变 1 条数据、自动生成 rdb 文件
save 300 10 300 秒内改变 10 条数据、自动生成 rdb 文件
save 60 10000 60 秒内改变 10000 条数据、自动生成 rdb 文件

PS: 这三种规则都不建议使用。

RDB 自动规则配置

# 配置自动生成规则。一般不建议配置自动生成 rdb 文件
save 900 1
save 300 10
save 60 10000
# 指定 rdb 文件名
dbfilename dump-${port}.rdb
# 指定 rdb 文件目录
dir /opt/redis/data
# bgsave 发生错误,停止写入
stop-writes-on-bgsave-error yes
# rdb 文件采用压缩格式
rdbcompression yes
# 对 rdb 文件进行校验
rdbchecksum yes
RDB 不容忽略的触发方式

  • 全量复制
    主从复制时,主会自动生成 rdb 文件(主从就是依据 rdb 文件进行数据同步)。
  • debug reload
    redis 提供了 debug 级的重启,不清空内存的一种重启方式,也会生成 rdb 文件。
  • shutdown
    关闭 redis 会触发 rdb 文件生成。
RDB 存在的问题

  • 耗时、耗内存、耗 IO 性能
    将内存中的数据全部 dump 到硬盘当中,耗时。bgsave 的方式 fork()子进程耗额外内存。大量的硬盘读写耗费 IO 性能。
  • 不可控、丢失数据
    宕机时,上次快照之后写入的内存数据,将会丢失。
RDB 总结

  • RDB 是 Redis 内存到硬盘的快照,用于持久化。
  • save 通常会阻塞 redis。
  • bgsave 通常不会阻塞 redis,但是会 fork 新进程。
  • save 自动配置满足任一就会被执行。
  • 耗时、耗内存、耗 IO 性能
  • 不可控、丢失数据
AOF

什么是 AOF

就是写日志,每次执行 Redis 写命令,让命令同时记录日志(以.aof 结尾的日志文件)。Redis 宕机时,只要进行日志回放就可以恢复数据。

AOF 三种策略

首先 redis 执行写命令将命令刷新到硬盘缓冲区中

  • always
    总是让缓冲区文件刷新到硬盘(即使性)。
  • everysec(推荐)
    每秒刷新一次缓冲区同步硬盘数据。
    对比 always,在高写入量的情况下,可以保护硬盘。出故障时会丢失一秒数据
  • no
    刷新策略让系统决定(不可控)。
  • 三种策略对比
命令 优点 缺点
always 不丢失数据 IO 开销大,一般的 sata 盘只有几百 TPS
everysec 只丢一秒数据 丢了一秒数据
no 系统决定 不可控,不知道什么时候刷盘,也不知道会丢失多少数据

通常使用 everysec 策略,这也是 AOF 的默认策略。

AOF 重写

AOF 重写就是把过期的、没用的、重复的以及可优化的命令,进行化简。只取最终有价值的结果。虽然写入操作很频繁,但系统定义的 key 的量是相对有限的。
AOF 重写可以大大压缩最终日志文件的大小。从而减少磁盘占用量,加快数据恢复速度。比如我们有个计数的服务,有很多自增的操作,比如有一个 key 自增到 1 个亿,对 AOF 文件来说就是一亿次 incr。AOF 重写就只用记 1 条记录。

AOF 重写两种方式

  • bgrewriteaof 命令触发 AOF 重写
    redis 客户端向 Redis 发 bgrewriteaof 命令,redis 服务端 fork 一个子进程去完成 AOF 重写。这里的 AOF 重写,是将 Redis 内存中的数据进行一次回溯,回溯成 AOF 文件。而不是重写 AOF 文件生成新的 AOF 文件去替换。
  • AOF 重写配置

    • auto-aof-rewrite-min-size:AOF 文件重写需要的尺寸
    • auto-aof-rewrite-percentage:AOF 文件增长
    • aof_current_size:统计 AOF 当前尺寸(单位:字节)
    • aof_base_size:AOF 上次启动和重写的尺寸(单位:字节)
  • AOF 自动重写的触发时机,需同时满足以下两点:

    • aof_current_size > auto-aof-rewrite-min-size
    • aof_current_size – aof_base_size/aof_base_size > auto-aof-rewrite-percentage
AOF 重写配置

# 开启正常 AOF 的 append 刷盘操作
appendonly yes
# AOF 文件名
appendfilename "appendonly-${port}.aof"
# 每秒刷盘
appendfsync everysec
# 文件目录
dir /opt/redis/data
# AOF 重写增长率
auto-aof-rewrite-percentage 100
# AOF 重写最小尺寸
auto-aof-rewrite-min-size 64mb
# AOF 重写期间是否暂停 append 操作。AOF 重写非常消耗磁盘性能,而正常的 AOF 过程中也会往磁盘刷数据。# 通常偏向考虑性能,设为 yes。万一重写失败了,这期间正常 AOF 的数据会丢失,因为我们选择了重写期间放弃了正常 AOF 刷盘。no-appendfsync-on-rewrite yes
RDB & AOF

RDB 对比 AOF

命令 RDB AOF 说明
启动优先级 RDB 和 AOF 都开启的情况下,Redis 重启后,选择 AOF 进行恢复。大部分情况下它保存了比 RDB 更新的数据
体积 RDB 二进制模式存储,而且做了压缩。AOF 虽然有 AOF 重写,但是体积相对还是大很多,毕竟它是记日志形式
恢复速度 RDB 体积小,恢复速度快。AOF 体积大,恢复速度慢
数据安全 丢数据 根据策略决定 RDB 丢上次快照后的数据,AOF 根据 always、everysec、no 策略决定是否丢数据
轻重 AOF 是追加日志,所以比较轻的操作。而 RDB 是 CPU 密集型操作,对磁盘,以及 fork 时对内存的消耗都比较大
RDB 最佳策略

  • 建议关闭 RDB
    无论是 Redis 主节点,还是从节点,都建议关掉 RDB。但是关掉不是绝对的,主从复制时还是会借助 RDB。
  • 用作数据备份
    RDB 虽然是很重的操作,但是对数据备份很有作用。文件大小比较小,可以按天或按小时进行数据备份。
  • 主从,从开?
    在极个别的场景下,需要在从节点开 RDB,可以再本地保存这样子的一个历史的 RDB 文件。虽然从节点不进行读写,但是 Redis 往往单机多部署,由于 RDB 是个很重的操作,所以还是会对 CPU、硬盘和内存造成一定影响。根据实际需求进行设定。
AOF 最佳策略

  • 建议开启 AOF
    如果 Redis 数据只是用作数据源的缓存,并且缓存丢失后从数据源重新加载不会对数据源造成太大压力,这种情况下。AOF 可以关。
  • AOF 重写集中管理
    单机多部署情况下,发生大量 fork 可能会内存爆满。
  • everysec
    建议采用每秒刷盘策略
最佳策略

  • 小分片
    使用 maxmemary 对 Redis 最大内存进行规划。
  • 缓存和存储
    根据缓存和存储的特性来决定使用哪种策略
  • 监控(硬盘、内存、负载、网络)
  • 足够的内存
    不要把就机器全部的内存规划给 Redis。不然会出很多问题。像客户端缓冲区等,不受 maxmemary 限制。规划不当可能会产生 SWAP、OOM 等问题。
开发运维常见问题

fork 操作

fork 是一个同步操作。执行 bgsave 和 bgrewriteaof 时都会执行 fork 操作

  • 改善 fork

    • 优先使用物理机或者其他能高效支持 form 操作的虚拟化技术;
    • 控制 Redis 实例最大可用内存 maxmemary;
      fork 操作只是执行内存页的拷贝,大部分情况速度是比较快的。redis 内存越大,内存页越大。可以使用 maxmemary 规划 redis 内存,避免 fork 过慢。
    • 合理配置 Linux 内存分配策略:vm.overcommit_memory=1
      fork 时如果内存不够,会阻塞。Linux 的 vm.overcommit_memory 默认为 0,不会分配额外内存
子进程开销和优化

bgsave 和 bgrewriteaof 会进行 fork 操作产生子进程。

  • CPU

    • 开销:RDB 和 AOF 文件生成属于 CPU 密集型;
    • 优化:不做 CPU 绑定,不和 CPU 密集型应用部署在一起;
  • 内存

    • 开销:fork 内存开销
    • 优化:echo never > /sys/kernel/mm/transparent_hugepage/enabled
  • 硬盘

    • 开销:AOF 和 RDB 文件写入,可以结合 iostat 和 iotao 分析
    • 优化:

      • 不要和高硬盘负载服务部署在一起:存储服务、消息队列;
      • no-appendfsync-on-rewrite=yes;
      • 根据写入量决定磁盘类型:例如 sdd;
      • 单机多实例持久化文件目录可以考虑分盘;
AOF 追加阻塞

AOF 阻塞定位

  • redis 日志
Asynchronous AOF fsync is taking to long(disk is busy?). Writing the AOF 
buffer whitout waiting for fsync to complete, this may slow down Redis
  • info persistence
    可以查看上述日志发生的次数:
127.0.0.1:6379> info persistence
......
......
aof_delayed_fsync: 100
......
......

改善方式

同子进程的硬盘优化

PS: 更多文章请关注微信公众号:浮话

正文完
 0