关于java:一文深度剖析Redis6的持久化机制简洁易懂

Redis的强劲性能很大水平上是因为它所有的数据都存储在内存中,当然如果redis重启或者服务器故障导致redis重启,所有存储在内存中的数据就会失落。然而在某些状况下,咱们心愿Redis在重启后可能保证数据不会失落。

  1. 将redis作为nosql数据库应用。
  2. 将Redis作为高效缓存服务器,缓存被击穿后对后端数据库层面的刹时压力是特地大的,所有缓存同时生效可能会导致雪崩。

这时咱们心愿Redis能将数据从内存中以某种模式同步到硬盘上,使得重启后能够依据硬盘中的记录来复原数据。

Redis反对两种形式的长久化,一种是RDB形式、另一种是AOF(append-only-file)形式,两种长久化形式能够独自应用其中一种,也能够将这两种形式联合应用。

  • RDB:依据指定的规定“定时”将内存中的数据存储在硬盘上,
  • AOF:每次执行命令后将命令自身记录下来。

RDB模式

RDB的长久化形式是通过快照(snapshotting)实现的,它是Redis默认的长久化形式,配置如下。

# save 3600 1
# save 300 100
# save 60 10000

Redis容许用户自定义快照条件,当合乎快照条件时,Redis会主动执行快照操作。快照的条件能够由用户在配置文件中配置。配置格局如下

save <seconds> <changes>

第一个参数是工夫窗口,第二个是键的个数,也就是说,在第一个工夫参数配置范畴内被更改的键的个数大于前面的changes时,即合乎快照条件。当触发条件时,Redis会主动将内存中的数据生成一份正本并存储在磁盘上,

这个过程称之为“快照”,除了上述规定之外,还有以下几种形式生成快照。

  1. 依据配置规定进行主动快照
  2. 用户执行SAVE或者GBSAVE命令
  3. 执行FLUSHALL命令
  4. 执行复制(replication)时

依据配置规定进行主动快照

  • 批改redis.conf文件,示意5秒内,有一个key发生变化,就会生成rdb文件。
  save 5 1                # 示意3600s以内至多产生1个key变动(新增、批改、删除),则重写rdb文件
  save 300 100
  save 60 10000
  • 批改文件存储门路

    dir /data/program/redis/bin
  • 其余参数配置阐明

    参数 阐明
    dir rdb文件默认在启动目录下(相对路径) config get dir 获取
    dbfilename 文件名称
    rdbcompression 开启压缩能够节俭存储空间,然而会耗费一些CPU的计算工夫,默认开启
    rdbchecksum 应用CRC64算法来进行数据校验,然而这样做会减少大概10%的性能耗费,如果心愿获取到最大的性能晋升,能够敞开此性能。

如果须要敞开RDB的长久化机制,能够参考如下配置,开启save,并正文其余规定即可

save ""
#save 900 1
#save 300 10
#save 60 10000

用户执行SAVE或者GBSAVE命令

除了让Redis主动进行快照以外,当咱们对服务进行重启或者服务器迁徙咱们须要人工去干涉备份。redis提供了两条命令来实现这个工作

  1. save命令

    如图4-24所示,当执行save命令时,Redis同步做快照操作,在快照执行过程中会阻塞所有来自客户端的申请。当redis内存中的数据较多时,通过该命令将导致Redis较长时间的不响应。所以不倡议在生产环境上应用这个命令,而是举荐应用bgsave命令

图4-24

  1. bgsave命令

    如图4-25所示,bgsave命令能够在后盾异步地进行快照操作,快照的同时服务器还能够持续响应来自客户端的申请。执行BGSAVE后,Redis会立刻返回ok示意开始执行快照操作,在redis-cli终端,通过上面这个命令能够获取最近一次胜利执行快照的工夫(以 UNIX 工夫戳格局示意)。

    LASTSAVE

1:redis应用fork函数复制一份以后过程的正本(子过程)

2:父过程持续接管并解决客户端发来的命令,而子过程开始将内存中的数据写入硬盘中的临时文件

3:当子过程写入完所有数据后会用该临时文件替换旧的RDB文件,至此,一次快照操作实现。

留神:redis在进行快照的过程中不会批改RDB文件,只有快照完结后才会将旧的文件替换成新的,也就是说任何时候RDB文件都是残缺的。 这就使得咱们能够通过定时备份RDB文件来实现redis数据库的备份, RDB文件是通过压缩的二进制文件,占用的空间会小于内存中的数据,更加利于传输。

bgsave是异步执行快照的,bgsave写入的数据就是for过程时redis的数据状态,一旦实现fork,后续执行的新的客户端命令对数据产生的变更都不会反馈到本次快照

Redis启动后会读取RDB快照文件,并将数据从硬盘载入到内存。依据数据量大小以及服务器性能不同,这个载入的工夫也不同。

图4-25

执行FLUSHALL命令

该命令在后面讲过,会革除redis在内存中的所有数据。执行该命令后,只有redis中配置的快照规定不为空,

也就是save 的规定存在。redis就会执行一次快照操作。不论规定是什么样的都会执行。如果没有定义快照规定,就不会执行快照操作。

执行复制(replication)时

该操作次要是在主从模式下,redis会在复制初始化时进行主动快照。这个会在前面讲到;

这里只须要理解当执行复制操作时,即时没有定义主动快照规定,并且没有手动执行过快照操作,它依然会生成RDB快照文件。

RDB数据恢复演示

  • 筹备初始数据
  redis> set k1 1
  redis> set k2 2
  redis> set k3 3
  redis> set k4 4
  redis> set k5 5
  • 通过shutdown命令敞开触发save

    redis> shutdown
  • 备份dump.rdb文件(用来后续复原)

    cp dump.rdb dump.rdb.bak
  • 接着再启动redis-server(systemctl restart redis_6379),通过keys命令查看,发现数据还在

    keys *

模仿数据失落

  • 执行flushall

    redis> flushall
  • shutdown(从新生成没有数据的快照,用来模仿后续的数据恢复)

    redis> shutdown
  • 再次启动redis, 通过keys 命令查看,此时rdb中没有任何数据。
  • 复原之前备份的rdb文件(之前保留了数据的rdb快照)

    mv dump.rdb.bak dump.rdb
  • 再次重启redis,能够看到之前快照保留的数据

    keys *

文件的劣势和劣势

一、劣势

  1.RDB是一个十分紧凑(compact)的文件,它保留了redis 在某个工夫点上的数据集,这种文件非常适合用于进行备份和劫难复原。

  2.生成RDB文件的时候,redis主过程会fork()一个子过程来解决所有保留工作,主过程不须要进行任何磁盘IO操作。

  3.RDB 在复原大数据集时的速度比AOF的复原速度要快。

二、劣势

  • 1、RDB形式数据没方法做到实时长久化/秒级长久化。因为bgsave每次运行都要执行fork操作创立子过程,频繁执行老本过高
  • 2、在肯定间隔时间做一次备份,所以如果redis意外down掉的话,就会失落最初一次快照之后的所有批改(数据有失落)。

如果数据相对来说比拟重要,心愿将损失降到最小,则能够应用AOF形式进行长久化。

AOF模式

AOF(Append Only File):Redis 默认不开启。AOF采纳日志的模式来记录每个写操作,并追加到文件中。开启后,执行更改Redis数据的命令时,就会把命令写入到AOF文件中。

Redis 重启时会依据日志文件的内容把写指令从前到后执行一次以实现数据的复原工作。

AOF配置开关

# 开关
appendonly no  /yes
# 文件名
appendfilename "appendonly.aof"

通过批改redis.conf重启redis之后:systemctl restart redis_6379。

再次运行redis的相干操作命令,会发现在指定的dir目录下生成appendonly.aof文件,通过vim查看该文件内容如下

*2
$6
SELECT
$1
0
*3
$3
set
$4
name
$3
mic
*3
$3
set
$4
name
$3
123

AOF配置相干问题解答

问题1:数据都是实时长久化到磁盘吗?

尽管每次执行更改Redis数据库内容的操作时,AOF都会将命令记录在AOF文件中,然而事实上,因为操作系统的缓存机制,数据并没有真正地写入硬盘,而是进入了零碎的硬盘缓存。在默认状况下零碎每30秒会执行一次同步操作。以便将硬盘缓存中的内容真正地写入硬盘。

在这30秒的过程中如果零碎异样退出则会导致硬盘缓存中的数据失落。一般来说可能启用AOF的前提是业务场景不能容忍这样的数据损失,这个时候就须要Redis在写入AOF文件后被动要求零碎将缓存内容同步到硬盘中。在redis.conf中通过如下配置来设置同步机制。

参数 阐明
appendfsync everysec AOF长久化策略(硬盘缓存到磁盘),默认everysec 1 no 示意不执行fsync,由操作系统保证数据同步到磁盘,速度最快,然而不太平安; 2 always 示意每次写入都执行fsync,以保证数据同步到磁盘,效率很低; 3 everysec示意每秒执行一次fsync,可能会导致失落这1s数据。通常抉择 everysec ,兼顾安全性和效率。

问题2:文件越来越大,怎么办?

因为AOF长久化是Redis一直将写命令记录到 AOF 文件中,随着Redis一直的运行,AOF 的文件会越来越大,文件越大,占用服务器内存越大以及 AOF 复原要求工夫越长。

例如set gupao 666,执行1000次,后果都是gupao=666。

为了解决这个问题,Redis新增了重写机制,当AOF文件的大小超过所设定的阈值时,Redis就会启动AOF文件的内容压缩,只保留能够复原数据的最小指令集。

能够应用命令上面这个命令被动触发重写

redis> bgrewriteaof

AOF 文件重写并不是对原文件进行重新整理,而是间接读取服务器现有的键值对,而后用一条命令去代替之前记录这个键值对的多条命令,生成一个新的文件后去替换原来的 AOF 文件。

重写触发机制如下

参数 阐明
auto-aof-rewrite-percentage 默认值为100。示意的是当目前的AOF文件大小超过上一次重写时的AOF文件大小的百分之多少时会再次进行重写,如果之前没有重写过,则以启动时AOF文件大小为根据
auto-aof-rewrite-min-size 默认64M。示意限度了容许重写的最小AOF文件大小,通常在AOF文件很小的状况下即便其中有很多冗余的命令咱们也并不太关怀

在启动时,Redis会一一执行AOF文件中的命令来将硬盘中的数据载入到内存中,载入的速度绝对于RDB会慢一些

问题:重写过程中,AOF文件被更改了怎么办?

Redis 能够在 AOF 文件体积变得过大时,主动地在后盾对 AOF 进行重写: 重写后的新 AOF 文件蕴含了复原以后数据集所需的最小命令汇合。

重写的流程是这样,

  • 主过程会fork一个子过程进去进行AOF重写,这个重写过程并不是基于原有的aof文件来做的,而是有点相似于快照的形式,全量遍历内存中的数据,而后一一序列到aof文件中。
  • 在fork子过程这个过程中,服务端依然能够对外提供服务,那这个时候重写的aof文件的数据和redis内存数据不统一了怎么办?不必放心,这个过程中,主过程的数据更新操作,会缓存到aof_rewrite_buf中,也就是独自开拓一块缓存来存储重写期间收到的命令,当子过程重写完当前再把缓存中的数据追加到新的aof文件。
  • 当所有的数据全副追加到新的aof文件中后,把新的aof文件重命名正式的文件名字,尔后所有的操作都会被写入新的aof文件。
  • 如果在rewrite过程中呈现故障,不会影响原来aof文件的失常工作,只有当rewrite实现后才会切换文件。因而这个rewrite过程是比拟牢靠的。

图4-26

Redis容许同时开启AOF和RDB,既保证了数据安全又使得进行备份等操作非常容易。如果同时开启后,Redis重启会应用AOF文件来复原数据,因为AOF形式的长久化可能失落的数据更少。

AOF的优劣势

长处:

1、AOF 长久化的办法提供了多种的同步频率,即便应用默认的同步频率每秒同步一次,Redis 最多也就失落 1 秒的数据而已。

毛病:

1、对于具备雷同数据的的Redis,AOF 文件通常会比 RDB 文件体积更大(RDB存的是数据快照)。

2、尽管 AOF 提供了多种同步的频率,默认状况下,每秒同步一次的频率也具备较高的性能。在高并发的状况下,RDB 比 AOF 具好更好的性能保障。