关于java:分布式管理员zookeeper你需要好好了解一下

早晨好，我是卢卡，最近半个月工夫比拟缓和，一个是快过年了，公司的人员评审和评定文档也比拟多，二也是更新了一下本人之前的技术的简历，自从五月份入职，也满满有七个月的工夫，发现很多技术学的不太扎实，比方经典的zookeeper，Apache zookeeper开源的分布式协调告诉，对于电商零碎，高并发，以及微服务的零碎服务实用信息都比拟高。从新再学习了一下，总结下本人的知识点，对知识点提炼和本人的了解很有帮忙，技术人生从重学技术点开始。

zookeeper的定位

Zookeeper 是apache Zookeeper开源的我的项目,

Zookeeper的次要作用

对于微服务分布式的协调治理,元数据的治理,Master选举, 理论应用场景下,次要是三类我的项目

1.zookeeper的实用方向

① 后端以Java为主的电商类管理系统

Zookeeper次要作用于分布式锁,注册核心 ,这里Zookeeper次要放弃CAP实践中的CP(一致性和分区容错性),也就是说Zookeeper保障的是强一致性

②对于大数据存储,数据管理,主从数据切换等零碎

这里咱们熟知的Kafla,canal 等在应用Zookeeper的元数据管理 ,通过master选举出具体的主从,ZAB原子一致性协定,

③大型互联网公司,自研的分布式组件

个别以zookeeper为原型, zookeeper曾经被大规模的工业级实用于次要的分布式系统,做元数据管理,以及注册核心,个别应用于 dubbo+Zookeeper 做一个根本的微服务架构来实现根本的数据调用

小总结:

zookeeper 分布式协调系统, 封装了分布式架构中所有的外围和支流的需要和性能;

分布式锁, 元数据管理, master选举, 分布式协调和告诉

zookeeper的根本个性：

在理解zookeeper的根本架构之前，咱们来理解一下，zookeeper为什么能够实现分布式系统的协调告诉，元数据管理等；

相熟zookeeper技术栈的都比拟理解，它自身是处于告诉协调机制，数据同步方面有很强的解决能力，这也就是为什么很多自研的框架，底层都用zookeeper的起因，好了，废话不多说，咱们开干；

背景：

集群环境下，zookeeper集群搭建了3台物理机器；

1.程序一致性

 多个申请，不论是读取数据的，还是说写入数据的，都要依照程序执行；
 zookeeper外部要解决的申请，leader角色会给每一个申请调配一个全局惟一且自增的ZxID，用于申请数据
 
 //这个惟一的全局ID就保障了程序一致性
这里的zxid，先简略理解，作为一个申请的排列序号，前面会重点解说的

2.原子性

要么全副机器都胜利，要么全副机器都不胜利，在同步数据操作时
  //保障每次同步操作后果都是统一的

3.高可用性

集群化部署，防止宕机，

如果宕机，也可本人选举leader，从新提供服务
  //从恢复模式到音讯播送模式

4.数据一致性：

 集群状况下，每台机器上的数据都是统一的，然而如果说，在数据同步的时候，宕机了，
 其余机器会主动将数据保留到磁盘日志中，等到leader角色提交之后，才会同步到znode节点中，真正实现数据在每台机器都是统一的
 
 //这里说的数据一致性，是强一致性，也是zookeeper的外围的个性，依据分布式系统放弃的CAP实践，只能反对CP,
 //其中C-consistency ，一致性对于，数据的强一致性，p-为零碎的分区容错性  A-高可用性，其eureka就是反对AP个性

5.高性能性

高性能，这里提出一个zookeeper的数据模型，znode节点
//znode节点，基于纯内存的，速度很快，树形构造，相似于Linux的文件系统，每个节点都有数据
  
  存储的数据，曾经能够解决的能力也就比拟强，前面会认真讲的，接着看上来吧

小总结：

基于zookeeper的集群架构的特点图：

zookeeper的集群化：

背景：

和上述的场景统一，都是3台机器，自动化部署的zookeeper集群，当初咱们来具体拆分下每个机器的次要性能

Zookeeper的同步数据，是通过主leader提交commit而后同步到各个follow角色 ：2PC提交事务–留个念想，前面细聊

1.Zookeeper集群化角色划分：

Leader（领导）
集群启动后，依据半数选举胜利的机器，成为Leader角色，反对读写，次要用于写操作，
Follower（候选人）
残余的选举不胜利，为follower角色，反对读取数据和同步数据，（leader宕机，提供不了写数据操作时，其余Follower中选举出新的L earner来实现写数据的操作）
Observer

只是反对读取数据，不参加leader的竞争

这外面角色都是本身了解，也能够说成模式等等；

当每个角色确定性能之后，咱们能够将数据间接开始同步，提供服务；

1.1注意事项：

当一个写操作的申请间接拜访follower角色的zookeeper的过程时，follower角色解决不了写操作，因为本身没有权限，只有Leader角色解决写操作的申请，这样的话，follower角色就会转发申请到Leader角色解决此申请，解决之后，开始数据同步，而后返回到其余follower角色，实现数据同步，阿虎；

2.Zookeeper集群与客户端拜访的过程：

背景：

Zookeeper集群化，解决申请，可能来源于音讯队列，或者是独自的产生申请读取数据，等等；那么每个申请到底是怎么连贯到Zookeeper集群建设连贯的呢，这节咱们来具体聊聊？

当Zookeeper的集群环境下启动胜利，而后咱们开始调配角色，而后咱们集群于客户端开始建设TCP的长连贯，

当建设连贯后，就会产生一个服务端的session ，造成一个会话的机制，相应的也会有sessionTimeout的存在

如果以后环境下，忽然连贯中断了，在sessionTimeout工夫内连贯胜利不会影响此次长连贯的应用；

3.Zookeeper集群化的数据一致性是怎么保障的？

背景：

上述说到Zookeeper反对CAP实践中的CP ,次要是consistency，一致性；他保证数据强一致性，就很有本人的架构特点，咱们来一步步揭开Zookeeper怎么保障强一致性的面纱？

Zookeeper的强一致性是通过: ZAB(Zookeeper Atomic Broadcast) 协定：原子播送协定

这个协定是Zookeeper的数据操作的外围，也用于元数据管理的要害；

协定来进行Zookeeper集群之间的数据同步，保证数据的强一致性；

ZAB： zookeeper Atomic broadcast 协定的思维：

划分角色： leader和follower

发送一个Proposal（提议），leader给所有的follower都同步一个proposal（提议）
如果半数以上的follower，都收到事务的proposal提议，每个follower都会返回一个ack

每个提议Pproposal ->先不会写入follower中znode数据中，而是会往一个本人本地磁盘日志文件中写入，而后返回给leader一个
ack
leader会发送一个commit提交事务

半数提交：2PC
也就是两个阶段提交；
leader如果异样宕机，会从follower中从新选举；

4.Zookeeper集群化数据同步的过程：

划分的比拟细，保持看完肯定会有播种的⛽️

1⃣️当集群启动的时候，选举算法开始进行在机器中调配leader和follower角色，通过半数选举机制胜利选到leader角色的机器

2⃣️剩下的当然就是follower角色的机器了，而后能够向外提供服务了

3⃣️当一个（写操作）申请通过Zookeeper集群后，leader角色机器会优先调配一个zxid用于创立节点或者变更节点的全局惟一自增ID，而后将发动一个提议Proposal（只是一个提议，相当于通知其他人来活了，筹备一下），将提议都放入，之前给每个follow角色筹备好的队列中，（这里到能够保障程序一致性）。

4⃣️每个follower角色的机器，拿到提议proposal,而后将数据放入本身的磁盘日志文件中，（不会放入znode节点），而后给leader节点回复一个ACK(确定连贯胜利，返回的确定字符)

ACK (Acknowledge character）即是确认字符:
     
//在数据通信中，接收站发给发送站的一种传输类控制字符。示意发来的数据已确认接管无误。
    
在TCP/IP协定中，如果接管方胜利的接管到数据，那么会回复一个ACK数据。通常ACK信号有本人固定的格局,长度大小,由接管方回复给发送方。

5⃣️当leader角色的机器，拿到半数以上的follower角色机器返回的ACK之后,代表曾经筹备胜利，leader角色会推送一个commit音讯，

其余follower就会将数据从磁盘文件写入，本身进行znode节点中存储起来，提交之后，数据同步实现，也就能够读取数据了

因为这个过程，分了两阶段提交，又称为2PC事务，用于解决分布式事务的办法

5.Znode的数据模型：

1.zookeeper的数据模型是，

基于纯内存的树形构造: Znode

 znode分类：

        长久节点：客户端与zk断开连接，节点仍旧存在
        长期节点：客户端与zk断开连接，节点隐没
        程序节点： 对于创立节点的时候，自减少全局递增的序号；

zk中有一个基于分布式锁的要求环境，curator框架，咱们发展长期节点来实现的，加锁的时候创立一个程序节点

2.zk节点的用处

zookeeperk做元数据管理的时候：必定是长久节点
然而个别做分布式锁，分布式协调和告诉，都是长期节点，如果断开，长期节点隐没，

3 .znode的节点的组成部分：

6.zookeeper启动集群到数据同步过程

leader选举

集群启动，开始进行leader选举，半数机器认可以后机器作为leader，各个follower开始进行数据同步，实现就能够退出恢复模式，而后能够的对外提供服务了

宕机从新选举leader

3台机器，容许不超过一半的机器宕机

2台机器，两个机器都批准某台机器作为leader ，这个就能够选举出leader;

1台机器是没法本人选举本人的；
因为1台机器，小于半数，所有不能启动集群环境了；

数据同步

leader选举进去后，其余机器都是follower–开始数据同步

强制剩下的follower 数据与本人leader统一；

数据同步实现之后，就会进去，音讯播送模式；

音讯写入： leader写入，采纳2PC模式过半写机制，给follower进行同步

将本人数据更新到，znode数据节点中

宕机修复

leader宕机，或者follower宕机，只有存活的机器超过一半，那就能够从新选举leader
选举leader，要求有一半以上的反对，其余跟follower数据同步，音讯播送模式

zk从恢复模式到音讯播送模式开始同步数据

7.谈谈在zookeeper集群下数据一致性的了解？

在数据同步的过程中，leader 将提议proposal放入队列（先进先出），而后开始同步到follower，当过半的follower返回ACK(确认字符)之后，leader间接推送一个commit用于提交，follower同步数据；（这里咱们留神，不是全副的follower返回后果）

zk的数据同步不是强一致性，

当follower将磁盘日志文件中的数据，提交到znode之后，数据才能够被读取到，最终数据会统一的，然而

zk官网给的一个回复是，程序一致性，会依据zxid，以及提议proposal的程序保障

因为leader肯定会保障所有的proposal同步到follower上，是依照程序，最终实现程序一致性

zk也能够反对强统一行，然而须要手动调节zk的sync()操作

8.ZAB协定下，数据不统一的状况有哪些？

状况1：

当leader推送一个commit提交数据，刚本人提交了，然而他还没有吧commit提交给follower的时候，就曾经挂掉了？

简介：当客户端发送一个写操作的申请，leader曾经收到半数以上follower发来的ack，他本人本地曾经将数据写入znode中，leader本人commit胜利，然而在没有给别的follower收回commit之前就曾经挂了，客户端在收到，leader曾经commit数据之后，就默认曾经将数据更新实现，然而咱们新申请，查问数据follower机器的时候，发现没有，与之间leader返回的不一样；（导致了数据不统一）

这时，follower中的数据和刚刚宕机的leader机器上的数据必定是不统一的，接下来zk会怎么做呢？

在具体的工夫中，zk集群中的follower角色发现，老大leader无奈回复，处于失联，宕机状态，他们就说咱们再选一个leader，而后就再从新选一个leader01（新的），那之前曾经挂掉的leader，就趁势变成了follower，

状况2：

如果客户端在，申请写数据操作的leader机器上，而后leader，发送一个proposal提议，然而还没收回去，就挂了；

导致本地磁盘日志文件中存在一个proposal；然而其余的follower中没有这个数据；

当集群奔溃之后，发展恢复模式，ZAB协定的要害外围就显示进去了，依据

状况1的解决思路：

泛滥的follower,开始半数选举机制，选出新的leader之后，发现本地磁盘上有没有提交的proposal，而后查看别的follower也存在这样的状况，这里的新leader(是之前未接管到commit音讯的follower),而后咱们开始发送commit 给其余follower，将数据写入znode节点中解决客户端读取数据不统一的状况；

状况2的解决过程：

根据上述的状况，曾经宕机的leader存在一个proposal的提议，然而其余的follow没有收到，所以在恢复模式之后，新的leader被抉择进去，发展写操作，然而发优先去查问一下本地磁盘中是否有之前遗留的proposal提议，查问到一个follower(之前宕机的发送的一个proposal的leader)磁盘数据与其余的不统一，而后当初的新leader将会同步数据给其余的follower，之前宕机的leader存在一个的提议（proposal提议）会被舍弃掉；

9.奔溃复原时选举进去的新leader如何跟其余follower进行同步数据的过程

咱们还是来模仿一个场景，5台机器的zookeeper集群化部署

其中四台是follower角色用于读取数据和同步数据的，剩下的一台就是leader专门进行写操作的机器

背景：

当一个leader收回一个proposal提议后，其余三台的follower机器都收到了，唯独剩下的一个没收到proposal，然而当初曾经有三台j follower机器曾经返回了ack的确认字符，所以leader判断曾经都告诉胜利，（半数选举），而后本身开始commit，没等到给剩下的follower 角色进行提交就宕机了；

剖析一下：

目前leader曾经commit数据到本人的znode节点上了，然而曾经挂了，然而其余四台follow机器，三台曾经将proposal放到本人本地的磁盘日志文件中，残余一台啥都没有（之前半数返回ack曾经够了没有收到proposal提议），万一其余三台机器复原机制时，都选举最初一台机器，作为新的leader,那这条数据就永恒失落了，

先通知大家一个答案，就是这中事件不会产生，zookeeper集群不会抉择一个没有数据的角色选举成leader

次要是要理解一个zxid的概念：

Zxid：能够了解为一个事物的自增ID，要是对提议扭转了，他就自增，

要是这个follow没有收到提议，也就zxid相应的比收到返回ack的follower 节点的机器必定是大的；

选举leader的要求是，在follower中，收到事务zxid最大的，也就是相当于创立工夫最早的，作为新的leader

10.zxid

znode节点的状态信息中蕴含czxid, 那么什么是zxid呢?
ZooKeeper状态的每一次扭转, 都对应着一个递增的Transaction id, 该id称为zxid. 因为zxid的递增性质, 如果zxid1小于zxid2, 那么zxid1必定先于zxid2产生.
创立任意节点, 或者更新任意节点的数据, 或者删除任意节点, 都会导致Zookeeper状态产生扭转, 从而导致zxid的值减少.

ZooKeeper中ZXID是一个长度64位的数字，其中低32位是依照数字递增，即每次客户端发动一个proposal，低32位的数字简略加1。高32位是leader周期的epoch编号。也就是leader的一个版本号

比如说前面epoch编号为8，也就说以后的leader版本是8 ，挂掉之后从新选举就自增1，epoch的编号就是9

所以睡要是想之前的状况2，产生就晓得是为什么会进去丢掉的数据，因为会找leader的epocn最大的一个版本作为能够提交的领导者

从新发号命令；

11.Observer节点（角色）的作用：

须要配置文件，只会单纯的承受和同步数据，observer不会参加过半写机制，不参加选举

只是被动的承受数据，

如果读的申请需要很大，咱们能够增加几个Observer,

长处：

可一扛下很大的并发量，
不会影响过半写的机制，
不会特地影响性能

起因：

要是都是follower节点的话，当leader要发proposal提议，要期待过半的机器返回ack，而后同步数据，也是过半的，

选举的时候也是过半的，这样会很消耗工夫以及网络资源，然而只有读取的数据，不参加选举的observer就很大水平上解决了这个痛点

12.zookeeper实用于理论部署场景：

实用于小集群的部署，读多写少的场景；

奇数台机器，半数选举，

过半写+磁盘日志文件====》commit+znode 节点

次要是写入压力过大leader

关于java:分布式管理员zookeeper你需要好好了解一下

zookeeper的定位

1.zookeeper的实用方向

zookeeper的根本个性：

zookeeper的集群化：

1.Zookeeper集群化角色划分：

1.1注意事项：

2.Zookeeper集群与客户端拜访的过程：

3.Zookeeper集群化的数据一致性是怎么保障的？

4.Zookeeper集群化数据同步的过程：

5.Znode的数据模型：

6.zookeeper启动集群到数据同步过程

7.谈谈在zookeeper集群下数据一致性的了解？

8.ZAB协定下，数据不统一的状况有哪些？

9.奔溃复原时选举进去的新leader如何跟其余follower进行同步数据的过程

10.zxid

11.Observer节点（角色）的作用：

12.zookeeper实用于理论部署场景：

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于java:分布式管理员zookeeper你需要好好了解一下

zookeeper的定位

1.zookeeper的实用方向

zookeeper的根本个性：

zookeeper的集群化：

1.Zookeeper集群化角色划分：

1.1注意事项：

2.Zookeeper集群与客户端拜访的过程：

3.Zookeeper集群化的数据一致性是怎么保障的？

4.Zookeeper集群化数据同步的过程：

5.Znode的数据模型：

6.zookeeper启动集群到数据同步过程

7.谈谈在zookeeper集群下数据一致性的了解？

8.ZAB协定下，数据不统一的状况有哪些？

9.奔溃复原时选举进去的新leader如何跟其余follower进行同步数据的过程

10.zxid

11.Observer节点（角色）的作用：

12.zookeeper实用于理论部署场景：

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复