redis长久化

  • RDB 是一个紧凑压缩的二进制文件,代表 Redis 在某个工夫点上的数据备份。非常适合备份,全量复制等场景。比方每6小时执行 bgsave 备份,并把 RDB 文件拷贝到近程机器或者文件系统中,用于劫难复原。
  • Redis 加载 RDB 复原数据远远快于 AOF 的形式
  • RDB 形式数据没方法做到实时长久化,而 AOF 形式能够做到。

AOF

AOF日志存储的是redis服务器的程序指令序列,AOF日志只记录对内存进行批改的指令记录。redis是先执行指令再将日志存盘。

AOF追加

当 AOF 长久化性能处于关上状态时,Redis 在执行完一个写命令之后,会以协定格局(也就是RESP,即 Redis 客户端和服务器交互的通信协议 )将被执行的写命令追加到 Redis 服务端保护的 AOF 缓冲区开端。

对于AOF的同步策略是波及到操作系统的write函数和fsync函数的,在《Redis设计与实现》中是这样阐明的

为了进步文件写入效率,在古代操作系统中,当用户调用write函数,将一些数据写入文件时,操作系统通常会将数据暂存到一个内存缓冲区里,当缓冲区的空间被填满或超过了指定时限后,才真正将缓冲区的数据写入到磁盘里。
这样的操作尽管进步了效率,但也为数据写入带来了平安问题:如果计算机停机,内存缓冲区中的数据会失落。为此,零碎提供了fsync、fdatasync同步函数,能够强制操作系统立即将缓冲区中的数据写入到硬盘里,从而确保写入数据的安全性。

AOF重写

AOF 重写是一个有歧义的名字,理论的重写工作是针对数据库的以后值来进行的,程序既不读写、也不应用原有的 AOF 文件。

如果AOF日志太长,须要对AOF日志进行重写(bgrewriteaof指令)。原理是开拓一个子过程对内存进行遍历,转换成一系列的redis操作指令,序列化到一个新的AOF日志文件中。序列化结束后再将操作期间产生的增量AOF日志追加到这个新的AOF日志文件中,追加结束后就立刻代替旧的AOF日志文件了,瘦身工作就实现了。

AOF 重写能够由用户通过调用 BGREWRITEAOF 手动触发。
另外, 服务器在 AOF 性能开启的状况下, 会维持以下三个变量:

  • 记录以后 AOF 文件大小的变量 aof_current_size
  • 记录最初一次 AOF 重写之后, AOF 文件大小的变量 aof_rewrite_base_size
  • 增长百分比变量 aof_rewrite_perc

每次当 serverCron 函数执行时, 它都会查看以下条件是否全副满足, 如果是的话, 就会触发主动的 AOF 重写:

  1. 没有 BGSAVE 命令在进行。
  2. 没有 BGREWRITEAOF 在进行。
  3. 以后 AOF 文件大小大于 server.aof_rewrite_min_size (默认值为 1 MB)。
  4. 以后 AOF 文件大小和最初一次 AOF 重写后的大小之间的比率大于等于指定的增长百分比。

默认状况下, 增长百分比为 100% , 也即是说, 如果后面三个条件都曾经满足, 并且以后 AOF 文件大小比最初一次 AOF 重写时的大小要大一倍的话, 那么触发主动 AOF 重写。

redis在子过程中执行AOF后盾重写(bgrewriteaof

  • 子过程进行 AOF 重写期间,Redis 过程能够持续解决客户端命令申请。
  • 子过程带有父过程的内存数据拷贝正本,在不实用锁的状况下,也能够保证数据的安全性。

然而,在子过程进行 AOF 重启期间,Redis接管客户端命令,会对现有数据库状态进行批改,从而导致数据以后状态和 重写后的 AOF 文件所保留的数据库状态不统一。
为此,Redis 设置了一个 AOF 重写缓冲区,这个缓冲区在服务器创立子过程之后开始应用,当 Redis 执行完一个写命令之后,它会同时将这个写命令发送给 AOF 缓冲区和 AOF 重写缓冲区。

当子过程实现 AOF 重写工作之后,它会向父过程发送一个信号,父过程在接管到该信号之后,会调用一个信号处理函数,并执行以下工作:

  • 将 AOF 重写缓冲区中的所有内容写入到新的 AOF 文件中,保障新 AOF 文件保留的数据库状态和服务器以后状态统一。
  • 对新的 AOF 文件进行改名,原子地笼罩现有 AOF 文件,实现新旧文件的替换
  • 持续解决客户端申请命令。

在整个 AOF 后盾重写过程中,只有信号处理函数执行时会对 Redis 主过程造成阻塞,在其余时候,AOF 后盾重写都不会阻塞主过程。

AOF保留模式

当程序对AOF日志文件进行写操作时,实际上是将内容写到了内核为文件描述符调配的一个内核缓存中,而后内核会异步将脏数据刷回到磁盘中。linux的glibc提供了fsync(int fd)函数能够将指定文件的内容强制从内核缓存刷到磁盘。如果每执行一条指令就fsync一次,即执行一次文件io操作,那么会很慢,所以通常是每隔1s左右执行一次,这是在数据安全性和性能之间做的一个折衷。

Redis 目前反对三种 AOF 保留模式,它们别离是:

  1. AOF_FSYNC_NO :不保留。
  2. AOF_FSYNC_EVERYSEC :每一秒钟保留一次。
  3. AOF_FSYNC_ALWAYS :每执行一个命令保留一次。

对于三种 AOF 保留模式, 它们对服务器主过程的阻塞状况如下:

  1. 不保留(AOF_FSYNC_NO):写入和保留都由主过程执行,两个操作都会阻塞主过程。
  2. 每一秒钟保留一次(AOF_FSYNC_EVERYSEC):写入操作由主过程执行,阻塞主过程。保留操作由子线程执行,不间接阻塞主过程,但若子线程有SAVE操作正在执行,必须期待子线程实现SAVE,主线程的WRITE操作将会阻塞。

[image:D2E0A23E-77BF-4FBF-964B-300CED327180-1128-000010788BEC4F4A/F8F0D62B-6DCF-40DE-AEAB-FA7603094537.png]

  1. 每执行一个命令保留一次(AOF_FSYNC_ALWAYS):和模式 1 一样。

RDB

copy on write,写时复制

redis是单线程程序,这个线程要同时负责多个客户端套接字的并发读写操作和内存数据结构的逻辑读写。在服务线上申请的同时,redis还须要进行内存快照,内存快照要求redis必须进行文件io操作。这意味着单线程在服务线上申请的同时,还要进行文件io操作,文件io操作会连累redis的性能。另一个问题是长久化的同时,内存数据结构还在扭转,比方一个大型hash字典正在长久化,后果一个申请过去把它删掉了,此时还没长久化完。
redis应用了多过程的COW来实现快照的长久化。

由维基百科摘录:

写入时复制(英语:Copy-on-write,简称COW)是一种计算机程序设计畛域的优化策略。其核心思想是,如果有多个调用者(callers)同时申请雷同资源(如内存或磁盘上的数据存储),他们会独特获取雷同的指针指向雷同的资源,直到某个调用者试图批改资源的内容时,零碎才会真正复制一份专用正本(private copy)给该调用者,而其余调用者所见到的最后的资源依然放弃不变。这过程对其余的调用者都是通明的(transparently)。此作法次要的长处是如果调用者没有批改该资源,就不会有正本(private copy)被建设,因而多个调用者只是读取操作时能够共享同一份资源。

fork

redis在长久化时会调用glibc的函数fork出一个子过程,快照长久化齐全交给子过程来解决,父过程持续解决客户端的申请。子过程刚刚产生的时候,它和父过程共享内存里的代码段和数据段。这是linux的机制,为了节约内存资源尽可能让它们共享起来。在过程拆散的一瞬间,内存增长简直没有显著的变动。

子过程做数据长久化,不会批改现有内存数据结构,只是对数据结构进行遍历读取,而后写盘。但父过程须要继续服务客户端的申请,而后对内存数据结构进行不间断的批改。
这时会应用操作系统的cow机制进行数据段页面的拆散。

Copy On Write技术实现原理:

fork()之后,kernel把父过程中所有的内存页的权限都设为read-only,而后子过程的地址空间指向父过程。当父子过程都只读内存时,相安无事。当其中某个过程写内存时,CPU硬件检测到内存页是read-only的,于是触发页异常中断(page-fault),陷入kernel的一个中断例程。中断例程中,kernel就会把触发的异样的页复制一份,于是父子过程各自持有独立的一份。

随着父过程批改操作的继续进行,越来越多的共享页面被分离出来,内存就会持续增长,然而也不会超过原有数据内存的2倍大小。因为redis中的冷数据占的比例较高,所有很少会有所有页面都被拆散的状况。被拆散的往往只有其中一部分页面。每个页面大小只有4kb,一个redis实例外面往往有成千上万个页面。

子过程因为不会批改内存中的数据,它看到的内存数据在过程产生的一瞬间就不再扭转。只须要遍历数据,写入磁盘即可。

总结:
Copy On Write技术益处是什么?

  • COW技术可缩小调配和复制大量资源时带来的霎时延时
  • COW技术可缩小不必要的资源分配。比方fork过程时,并不是所有的页面都须要复制,父过程的代码段和只读数据段都不被容许批改,所以无需复制

Copy On Write技术毛病是什么?

  • 如果在fork()之后,父子过程都还须要持续进行写操作,那么会产生大量的分页谬误(页异常中断page-fault),这样就得失相当。

留神

  • rdbSave 会将数据库数据保留到 RDB 文件,并在保留实现之前阻塞调用者。
  • SAVE 命令间接调用 rdbSave ,阻塞 Redis 主过程; BGSAVE 用子过程调用 rdbSave ,主过程仍可持续解决命令申请。
  • SAVE 执行期间, AOF 写入能够在后盾线程进行, BGREWRITEAOF 能够在子过程进行,所以这三种操作能够同时进行。
  • 为了防止产生竞争条件, BGSAVE 执行时, SAVE 命令不能执行。
  • 为了防止性能问题, BGSAVE 和 BGREWRITEAOF 不能同时执行。

运维

RDB是通过开启子过程的形式进行的,比拟消耗资源。通常redis的主节点不会进行长久化操作,长久化操作次要在从节点进行。从节点是备份节点,没有来自客户端申请的压力,它的操作系统资源往往比拟充分。

混合长久化

rdb复原内存状态会失落大量数据,aof日志重放有很慢。
将rdb文件和aof日志存在一起。aof日志不再是全量的日志,而是自长久化开始到长久化完结这段时间产生的增量aof日志,通常这部分aof日志很小。于是在redis重启时,能够先加载rdb的内容,而后重放增量aof日志,就能够齐全代替之前的aof全量日志重放,重启效率失去大幅晋升。

参考文章

https://redisbook.readthedocs...
https://redisbook.readthedocs...
https://juejin.im/post/684490...
《redis深度历险》