关于分布式:冰河开源了全网首个完全开源的分布式全局有序序列号分布式ID框架

写在后面

mykit-serial框架的设计参考了李艳鹏大佬开源的vesta框架，并彻底重构了vesta框架，借鉴了雪花算法（SnowFlake）的思维，并在此基础上进行了全面降级和优化。反对嵌入式（Jar包）、RPC（Dubbo，motan、sofa、SpringCloud、SpringCloud Alibaba等支流的RPC框架）、Restful API（反对SpringBoot和Netty），可反对最大峰值型和最小粒度型两种模式。

开源地址：

GitHub：https://github.com/sunshinelyz/mykit-serial

Gitee：https://gitee.com/binghe001/mykit-serial

为何不必数据库自增字段？

如果在业务零碎中应用数据库的自增字段，自增字段齐全依赖于数据库，这在数据库移植，扩容，荡涤数据，分库分表等操作时带来很多麻烦。

在数据库分库分表时，有一种方法是通过调整自增字段或者数据库sequence的步长来达到跨数据库的ID的唯一性，但依然是一种强依赖数据库的解决方案，有诸多的限度，并且强依赖数据库类型，如果咱们想减少一个数据库实例或者将业务迁徙到一种不同类型的数据库上，那是相当麻烦的。

为什么不必UUID？

UUID尽管可能保障ID的唯一性，然而，它无奈满足业务零碎须要的很多其余个性，例如：工夫粗略有序性，可反解和可制作型。另外，UUID产生的时候应用齐全的工夫数据，性能比拟差，并且UUID比拟长，占用空间大，间接导致数据库性能降落，更重要的是，UUID并不具备有序性，这就导致B+树索引在写的时候会有过多的随机写操作（间断的ID会产生局部程序写），另外写的时候因为不能产生程序的append操作，须要进行insert操作，这会读取整个B+树节点到内存，而后插入这条记录后再将整个节点写回磁盘，这种操作在记录占用空间比拟大的状况下，性能降落比拟大。所以，不倡议应用UUID。

须要思考的问题

既然数据库自增ID和UUID有诸多的限度，咱们就须要思考如何设计一款分布式全局惟一的序列号（分布式ID）服务。这里，咱们须要思考如下一些因素。

全局惟一

分布式系统保障全局惟一的一个乐观策略是应用锁或者分布式锁，然而，只有应用了锁，就会大大的升高性能。

因而，咱们能够借鉴Twitter的SnowFlake算法，利用工夫的有序性，并且在工夫的某个单元下采纳自增序列，达到全局的唯一性。

粗略有序

UUID的最大问题就是无序的，任何业务都心愿生成的ID是有序的，然而，分布式系统中要做到齐全有序，就波及到数据的汇聚，须要用到锁或者分布式锁，思考到效率，须要采纳折中的计划，粗略有序。目前有两种支流的计划，一种是秒级有序，一种是毫秒级有序，这里又有一个衡量和取舍，咱们决定反对两种形式，通过配置来决定服务应用其中的一种形式。

可反解

一个 ID 生成之后，ID自身带有很多信息量，线上排查的时候，咱们通常首先看到的是ID，如果依据ID就能晓得什么时候产生的，从哪里来的，这样一个可反解的 ID 能够帮上很多忙。

如果ID 里有了工夫而且能反解，在存储层面就会省下很多传统的timestamp 一类的字段所占用的空间了，这也是两全其美的设计。

可制作

一个零碎即便再高可用也不会保障永远不出问题，出了问题怎么办，手工解决，数据被净化怎么办，洗数据，可是手工解决或者洗数据的时候，如果应用数据库自增字段，ID曾经被起初的业务笼罩了，怎么复原到零碎出问题的工夫窗口呢？

所以，咱们应用的分布式全局序列号（分布式ID）服务肯定要可复制，可复原，可制作。

高性能

不论哪个业务，订单也好，商品也好，如果有新记录插入，那肯定是业务的外围性能，对性能的要求十分高，ID生成取决于网络IO和CPU的性能，CPU个别不是瓶颈，依据教训，单台机器TPS应该达到10000/s。

高可用

首先，分布式全局序列号（分布式ID）服务必须是一个对等的集群，一台机器挂掉，申请必须可能转发到其余机器，另外，重试机制也是必不可少的。最初，如果近程服务宕机，咱们须要有本地的容错计划，本地库的依赖形式能够作为高可用的最初一道屏障。

也就是说，咱们反对RPC公布模式，嵌入式公布模式和REST公布模式，如果某种模式不可用，能够回退到其余公布模式，如果Zookeeper不可用，能够会退到应用本地预配的机器ID。从而达到服务的最大可用。

可伸缩

作为一个分布式系统，永远都不能疏忽的就是业务在一直地增长，业务的相对容量不是掂量一个零碎的唯一标准，要晓得业务是永远增长的，所以，零碎设计岂但要思考能接受的相对容量，还必须思考业务增长的速度，零碎的程度伸缩是否能满足业务的增长速度是掂量一个零碎的另一个重要规范。

设计与实现

整体架构设计

mykit-serial的整体架构图如下所示。

mykit-serial框架各模块的含意如下：

mykit-bean：提供对立的bean类封装和整个框架应用的常量等信息。
mykit-common：封装整个框架通用的工具类。
mykit-config：提供全局配置能力。
mykit-core：整个框架的外围实现模块。
mykit-db：寄存数据库脚本。
mykit-interface：整个框架的外围形象接口。
mykit-service：基于Spring实现的外围性能。
mykit-rpc：以RPC形式对外提供服服务（后续反对Dubbo，motan、sofa、SpringCloud、SpringCloud Alibaba等支流的RPC框架）。
mykit-server：目前实现了Dubbo形式，后续迁徙到mykit-rpc模块。
mykit-rest：基于SpringBoot实现的Rest服务。
mykit-rest_netty：基于Netty实现的Rest服务。
mykit-test：整个框架的测试模块，通过此模块能够疾速把握mykit-serial的应用形式。

公布模式

依据最终的客户应用形式，可分为嵌入公布模式，RPC公布模式和Rest公布模式。

嵌入公布模式：只实用于Java客户端，提供一个本地的Jar包，Jar包是嵌入式的原生服务，须要提前配置本地机器ID（或者服务启动时，由Zookeeper动态分配惟一的分布式序列号），然而不依赖于核心服务器。
RPC公布模式：只实用于Java客户端，提供一个服务的客户端Jar包，Java程序像调用本地API一样来调用，然而依赖于核心的分布式序列号（分布式ID）产生服务器。
REST公布模式：核心服务器通过Restful API提供服务，供非Java语言客户端应用。

公布模式最初会记录在生成的全局序列号中。

序列号类型

依据工夫的位数和序列号的位数，可分为最大峰值型和最小粒度型。

1. 最大峰值型：采纳秒级有序，秒级工夫占用30位，序列号占用20位

字段	版本	类型	生成形式	秒级工夫	序列号	机器ID
位数	63	62	60-61	30-59	10-29	0-9

2. 最小粒度型：采纳毫秒级有序，毫秒级工夫占用40位，序列号占用10位

字段	版本	类型	生成形式	毫秒级工夫	序列号	机器ID
位数	63	62	60-61	20-59	10-19	0-9

最大峰值型可能接受更大的峰值压力，然而粗略有序的粒度有点大，最小粒度型有较粗疏的粒度，然而每个毫秒能接受的实践峰值无限，为1024，同一个毫秒如果有更多的申请产生，必须等到下一个毫秒再响应。

分布式序列号（分布式ID）的类型在配置时指定，须要重启服务能力相互切换。

数据结构

1. 序列号

最大峰值型

20位，实践上每秒内均匀可产生2^20= 1048576个ID，百万级别，如果零碎的网络IO和CPU足够弱小，可接受的峰值达到每毫秒百万级别。

最小粒度型

10位，每毫秒内序列号总计2^10=1024个, 也就是每个毫秒最多产生1000+个ID，实践上接受的峰值齐全不如咱们最大峰值计划。

2. 秒级工夫/毫秒级工夫

最大峰值型

30位，示意秒级工夫，2^30/60/60/24/365=34，也就是可应用30+年。

最小粒度型

40位，示意毫秒级工夫，2^40/1000/60/60/24/365=34，同样能够应用30+年。

3. 机器ID

10位， 2^10=1024, 也就是最多反对1000+个服务器。核心公布模式和REST公布模式个别不会有太多数量的机器，依照设计每台机器TPS 1万/s，10台服务器就能够有10万/s的TPS，根本能够满足大部分的业务需要。

然而思考到咱们在业务服务能够应用内嵌公布形式，对机器ID的需求量变得更大，这里最多反对1024个服务器。

4. 生成形式

2位，用来辨别三种公布模式：嵌入公布模式，RPC公布模式，REST公布模式。

00：嵌入公布模式
01：RPC公布模式
02：REST公布模式
03：保留未用

5. 序列号类型

1位，用来辨别两种ID类型：最大峰值型和最小粒度型。

0：最大峰值型
1：最小粒度型

6. 版本

1位，用来做扩大位或者扩容时候的长期计划。

0：默认值，免得转化为整型再转化回字符串被截断
1：示意扩大或者扩容中

作为30年后扩大应用，或者在30年后ID将近用光之时，扩大为秒级工夫或者毫秒级工夫来挣得零碎的移植工夫窗口，其实只有扩大一位，齐全能够再应用30年。

并发解决

对于核心服务器和REST公布形式，ID生成的过程波及到网络IO和CPU操作，ID的生成根本都是内存到高速缓存的操作，没有IO操作，网络IO是零碎的瓶颈。

绝对于CPU计算速度来说网络IO是瓶颈，因而，ID产生的服务应用多线程的形式，对于ID生成过程中的竞争点time和sequence，这里应用了多种实现形式

应用concurrent包的ReentrantLock进行互斥，这是缺省的实现形式，也是谋求性能和稳固两个指标的斗争计划。

应用传统的synchronized进行互斥，这种形式的性能略微逊色一些，通过传入JVM参数-Dmykit.serial.sync.lock.impl.key=true来开启。

应用CAS形式进行互斥，这种实现形式的性能十分高，然而在高并发环境下CPU负载会很高，通过传入JVM参数-Dmykit.serial.atomic.impl.key=true来开启。

机器ID的调配

咱们将机器ID分为两个区段，一个区段服务于RPC公布模式和REST公布模式，另外一个区段服务于嵌入公布模式。

0-923：嵌入公布模式，事后配置，（或者由Zookeeper产生），最多反对924台内嵌服务器
924 – 1023：核心服务器公布模式和REST公布模式，最多反对300台，最大反对300*1万=300万/s的TPS

如果嵌入式公布模式和RPC公布模式以及REST公布模式的使用量不合乎这个比例，咱们能够动静调整两个区间的值来适应。

另外，各个垂直业务之间具备天生的隔离性，每个业务都能够应用最多1024台服务器。

与Zookeeper集成

对于嵌入公布模式，服务启动须要连贯Zookeeper集群，Zookeeper调配一个0-923区间的一个ID，如果0-923区间的ID被用光，Zookeeper会调配一个大于923的ID，这种状况，回绝启动服务。

如果不想应用Zookeeper产生的惟一的机器ID，咱们提供缺省的预配的机器ID解决方案，每个应用对立分布式全局序列号（分布式ID）服务的服务须要事后配置一个默认的机器ID。

工夫同步

应用mykit-serial生成分布式全局序列号（分布式ID）时，须要咱们保障服务器的工夫失常。此时，咱们能够应用Linux的定时工作crontab，定时通过授时服务器虚构集群（寰球有3000多台服务器）来核准服务器的工夫。

ntpdate -u pool.ntp.orgpool.ntp.org

性能

最终的性能验证要保障每台服务器的TPS达到1万/s以上。

Restful API文档

产生分布式全局序列号

形容：依据零碎工夫产生一个全局惟一的全局序列号并且在办法体内返回。
门路：/genSerialNumber
参数：N/A
非空参数：N/A
示例：http://localhost:8080/genSerialNumber
后果：3456526092514361344

反解全局序列号

形容：对产生的serialNumber进行反解，在响应体内返回反解的JSON字符串。
门路：/expSerialNumber
参数：serialNumber=？
非空参数：serialNumber
示例：http://localhost:8080/expSerialNumber?serialNumber=3456526092514361344
后果：{“genMethod”:2,”machine”:1022,”seq”:0,”time”:12758739,”type”:0,”version”:0}

翻译工夫

形容：把长整型的工夫转化成可读的格局。
门路：/transtime
参数：time=?
非空参数：time
示例：http://localhost:8080/transtime?time=12758739
后果：Thu May 28 16:05:39 CST 2015

制作全局序列号

形容：通过给定的分布式全局序列号元素制作分布式全局序列号。
门路：/makeSerialNumber
参数：genMethod=?&machine=?&seq=?&time=?&type=?&version=?
非空参数：time,seq
示例：http://localhost:8080/makeSerialNumber?genMethod=2&machine=1022&seq=0&time=12758739&type=0&version=0
后果：3456526092514361344

Java API文档

产生全局序列号

形容：依据零碎工夫产生一个全局惟一的分布式序列号（分布式ID）并且在办法体内返回。
类：SerialNumberService
办法：genSerialNumber
参数：N/A
返回类型：long
示例：long serialNumber= serialNumberService.genSerialNumber();

反解全局序列号

形容：对产生的分布式序列号（分布式ID）进行反解，在响应体内返回反解的JSON字符串。
类：SerialNumberService
办法：expSerialNumber
参数：long serialNumber
返回类型：SerialNumber
示例：SerialNumber serialNumber = serialNumberService.expSerialNumber(3456526092514361344);

翻译工夫

形容：把长整型的工夫转化成可读的格局。
类：SerialNumberService
办法：transTime
参数：long time
返回类型：Date
示例：Date date = serialNumberService.transTime(12758739);

制作全局序列号(1)

形容：通过给定的分布式序列号元素制作分布式序列号。
类：SerialNumberService
办法：makeSerialNumber
参数：long time, long seq
返回类型：long
示例：long serialNumber= SerialNumberService.makeSerialNumber(12758739, 0);

制作全局序列号(2)

形容：通过给定的ID元素制作ID。
类：SerialNumberService
办法：makeSerialNumber
参数：long machine, long time, long seq
返回类型：long
示例：long serialNumber= serialNumberService.makeSerialNumber(1, 12758739, 0);

制作全局序列号(3)

形容：通过给定的分布式序列号元素制作ID。
类：SerialNumberService
办法：makeSerialNumber
参数：long genMethod, long machine, long time, long seq
返回类型：long
示例：long serialNumber= serialNumberService.makeSerialNumber(0, 1, 12758739, 0);

制作全局序列号（4)

形容：通过给定的分布式序列号元素制作ID。
类：SerialNumberService
办法：makeSerialNumber
参数：long type, long genMethod, long machine, long time, long seq
返回类型：long
示例：long serialNumber= serialNumberService.makeSerialNumber(0, 2, 1, 12758739, 0);

制作全局序列号(5)

形容：通过给定的ID元素制作ID。
类：SerialNumberService
办法：makeSerialNumber
参数：long version, long type, long genMethod, long machine, long time, long seq
返回类型：long
示例：long serialNumber = serialNumberService.makeSerialNumber(0, 0, 2, 1, 12758739, 0);

FAQ

1.调整工夫是否会影响ID产生性能？

未重启机器调慢工夫，mykit-serial抛出异样，回绝产生ID。重启机器调快工夫，调整后失常产生ID，调整时段内没有ID产生。

2.重启调慢或调快工夫有何影响？

重启机器调慢工夫，mykit-serial将可能产生反复的工夫，系统管理员须要保障不会产生这种状况。重启机器调快工夫，调整后失常产生ID，调整时段内没有ID产生。

3.每4年一次同步润秒会不会影响ID产生性能？

原子时钟和电子时钟每四年误差为1秒，也就是说电子时钟每4年会比原子时钟慢1秒，所以，每隔四年，网络时钟都会同步一次工夫，然而本地机器Windows,Linux等不会主动同步工夫，须要手工同步，或者应用ntpupdate向网络时钟同步。因为时钟是调快1秒，调整后不影响ID产生，调整的1s内没有ID产生。

好了明天就到这儿吧，我是冰河，咱们下期见~~

重磅福利

微信搜一搜【冰河技术】微信公众号，关注这个有深度的程序员，每天浏览超硬核技术干货，公众号内回复【PDF】有我筹备的一线大厂面试材料和我原创的超硬核PDF技术文档，以及我为大家精心筹备的多套简历模板（不断更新中），心愿大家都能找到心仪的工作，学习是一条时而郁郁寡欢，时而开怀大笑的路，加油。如果你通过致力胜利进入到了心仪的公司，肯定不要懈怠放松，职场成长和新技术学习一样，逆水行舟。如果有幸咱们江湖再见！

另外，我开源的各个PDF，后续我都会继续更新和保护，感激大家长期以来对冰河的反对！！

关于分布式:冰河开源了全网首个完全开源的分布式全局有序序列号分布式ID框架

写在后面

为何不必数据库自增字段？

为什么不必UUID？

须要思考的问题

全局惟一

粗略有序

可反解

可制作

高性能

高可用

可伸缩

设计与实现

整体架构设计

公布模式

序列号类型

数据结构

并发解决

机器ID的调配

与Zookeeper集成

工夫同步

性能

Restful API文档

产生分布式全局序列号

反解全局序列号

翻译工夫

制作全局序列号

Java API文档

产生全局序列号

反解全局序列号

翻译工夫

制作全局序列号(1)

制作全局序列号(2)

制作全局序列号(3)

制作全局序列号（4)

制作全局序列号(5)

FAQ

重磅福利

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复