关于数据库:昆仑分布式数据库Sequence功能及其实现机制

昆仑分布式数据库（下文简称昆仑或者昆仑数据库）的计算节点源自 PostgreSQL，因而继承了 PostgreSQL 的 Sequence 性能，本文介绍昆仑分布式数据库的 Sequence 的性能用法、用例和实现。

用法和用例

昆仑数据库的 Sequence 与 MySQL 的 autoincrement（自增列）相比，其性能更加弱小和灵便。次要体现在以下几方面：

昆仑的 Sequence 与表是多对多的关系，而 MySQL 的自增列与表是 1 对 1 关系

具体来说，昆仑数据库的每个表能够有任意数量的 sequence 列应用雷同或者不同的 sequence 产生序列值；

并且每一个 sequence 能够被任意多个表的任意多个列应用来产生 ID 值。

而 MySQL 的每个表最多只能有一个自增列并且这个自增列只能被这个表应用（这是废话，然而为了内容对称还是要提一下）。

能够在任何时候调整 sequence 的初始值，最大值，步长，范畴等属性而后持续应用，而后 sequence 就会依照新的属性产生新序列值。

不依赖索引，清空表后序列值不回绕。

昆仑数据库集群多个计算节点间接或者间接应用同一个 sequence 都能够产生全局惟一的序列值。

让咱们看一个例子，首先创立一个表 t1，t1 的主键列 serial 类型表明它应用一个隐式创立的 sequence 来产生字段值，所以插入时候能够不为它指定字段值。

create table t1(a serial primary key, b int);

而后创立 sequence seq_b，筹备用 seq_b 来产生字段值。创立时能够可选地指定 sequence 的属性，不指定就应用默认值。

create sequence seq_b;

先执行这个语句插入 9 行，显式调用 seq_b 产生字段值。

insert into t1(b) values(nextval('seq_b'));

能够看到 t1 的数据如下：

select*from t1;

而后创立表 t2，它的 b 和 c 列都应用 seq_b 产生缺省字段值，并且其主键列也实用隐式 sequence 来产生字段值。

create table t2(a serial primary key, b int default nextval('seq_b'), c int default nextval('seq_b'));

因为 t2 的所有字段都有缺省值，所以用如下语句插入表 t2 3 行。

insert into t2 default values;

查看 t2 的数据，能够看到每行 b 和 c 字段是应用 seq_b 顺次产生的字段值，并且从 seq_b 上次产生的 9 之后开始产生序列值。

select*from t2;

最初，还能够应用 select nextval(‘seq_b’); 这样的语句来间接产生序列值。

批改 sequence 元数据及其他

能够应用 ALTER SEQUENCE 语句来批改 sequence 的属性，也能够应用 ALTER TABLE … ALTER COLUMN … SET seqoptions 语句来批改列的隐式 sequence 的属性。

还能够应用上述 alter table 语句 restart 一个 sequence。并且能够应用 lastval() 函数取得 sequence 上次返回的值。

sequence 实现

昆仑数据库的 sequence 实现继承了 PostgreSQL 原有的 sequence 机制。

为了使 sequence 数据具备容灾能力并且可能被任意数量的计算节点同时应用，因而 sequence 的与序列值散发无关的数值数据存储在存储节点的 mysql.sequences 表中，每行对应一个 sequence。

一个 sequence 的元数据具体存储在哪个存储集群中，是在创立 sequence 时由计算节点动态分配的。

sequence 的其余元数据存储在计算节点，能够应用上面的语句查看 sequence 在计算节点中的元数据：

select t2.relname, t2.oid, seqstart, seqincrement, seqmax, seqmin, seqcache, seqcycle from pg_sequence t1, pg_class t2 where t1.seqrelid = t2.oid;

能够看到 t1 和 t2 的主键列的隐式 sequence 别离是 t1_a_seq 和 t2_a_seq，还有显式创立的 seq_b，这些 sequence 的数值元数据所在的存储集群别离是 1,2,1。

同时，能够看到 sequence 的根本元数据也存储在 pg_class 元数据表中，而其特有属性存储在 pg_sequence 表中。

别离连贯到编号为 1 和 2 的 shard 查看这 3 个 sequence 在这两个存储集群的 mysql.sequence 表中的数值元数据，能够看到以下信息：

当首次应用一个 sequence 或者其预约的数值范畴用尽时，一个计算节点 CN 就会通过其 cluster_log_applier 过程到这个 sequence 所在的存储集群中去 reserve (curval, cur_val + max(10, seqcache)) 这个范畴的字段值，而后 CN 应用这个 reserve 的范畴来为这个 sequence 散发序列值，直到再次用尽。

这样，即便有多个计算节点应用同一个 sequence 来散发序列值，依然能够放弃高性能并且放弃所有计算节点散发的序列值都惟一。

结语

艰深来讲，如果对数据库的读和写都在同一个数据库服务器中操作，业务零碎性能会升高。

为了晋升业务零碎性能，优化用户体验，能够通过做主从复制来加重主数据库的负载。

而且如果主数据库宕机，可疾速将业务零碎切换到从数据库上，可防止数据失落。

*KunlunDB 我的项目已开源

【GitHub：】
https://github.com/zettadb

【Gitee：】
https://gitee.com/zettadb

END