关于raft:Raft算法之快照篇

一、什么是快照

快照（snapshot）是最简略的压缩形式。在快照中，全副的以后零碎状态都被写入到快照中，存储到长久化的存储中，而后在那个时刻之前的全副日志都能够被抛弃。

打个比方，像Redis这样的KV零碎，零碎的以后状态就是以后所有key的值及过期工夫，把这些信息全副写入到磁盘中就是快照。

二、Raft算法中为什么须要快照

Raft算法是通过日志来保障节点最终统一的，而日志是继续减少的，对于一个7*24小时运行的零碎，日志会始终减少，这样导致几个问题：

1、磁盘占用空间过大；

2、新的节点退出进来后，须要同步的日志太多，进一步影响零碎的可用性；

还有1点不是Raft算法中自身的性能，就是复原数据，即一个误操作须要回滚，则须要回放从前到后所有日志，这个工夫会十分长，这时如果有快照就能够疾速复原了。

mysql binlog、Redis的aof文件其实就相当于快照，只不过这些零碎没有实现Raft算法。

三、与快照相干的RPC

1、装置快照 RPC（InstallSnapshot RPC）

对于接管方规定如下

如果term < currentTerm立即回复
如果是第一个分块（offset 为 0）则创立新的快照
在指定的偏移量写入数据
如果 done为 false，则回复并持续期待之后的数据
保留快照文件，抛弃所有存在的或者局部有着更小索引号的快照
如果现存的日志领有雷同的最初任期号和索引值，则前面的数据持续保留并且回复
抛弃全副日志
可能应用快照来复原状态机（并且装载快照中的集群配置）

这些规定大部分应该好了解，局部规定解释下：

5、保留快照文件，抛弃所有存在的或者局部有着更小索引号的快照

如果说Follower曾经有快照了，并且快照最初索引为1000，而新的快照的索引为2000，则将后面的快照抛弃

6、如果现存的日志领有雷同的最初任期号和索引值，则前面的数据持续保留并且回复

意思说接管节点如果有相应的日志了，则前面的日志保留，此音讯能够间接回复。

打个比方，如果Follower B的索引曾经到2002，此索引对应的term为102，其中2000索引的term为101，如果这时收到一个装置快照的音讯，最初1条的term为101，最初1条的索引为2000，通过比照发现此日志曾经存在节点上，并且Term也对的上，因而2001之后的日志保留。

7、抛弃全副日志

下面条件满足后，将快照保留到本地，本地所有日志全副抛弃。

当然前提是后面的条件都不满足，具体不细述。

8、可能应用快照来复原状态机（并且装载快照中的集群配置）

复原状态机就不用说了，间接拿快照复原状态机的数据，举例来说KV零碎，发送的快照如果只有a=1, b=2这样的状态，即把所有数据清空，只保留下面2条数据。

并且装载快照中的集群配置，意思是说快照还蕴含集群配置信息，主是要为了反对集群成员更新；

所以快照必须以下信息：

最初一条日志的Index；

最初一条日志的Term；

生成快照时的集群配置信息；

状态机数据；

四、其它细节

1、何时生成快照

这个Raft算法并没有规定，看利用本人实现，像etcd是10000日志后产生1次快照，须要依据理论条件抉择。

2、谁生成日志快照

Raft算法并没有规定谁能够生成，即谁都能够生成，即符合条件1就能够生成，次要是为了切换为Leader的时候能够疾速应答新节点增加数据的状况。因为只有数据统一，谁生成都是一样的。

关于raft:Raft算法之快照篇

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于raft:Raft算法之快照篇

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复