关于数据库:昆仑分布式数据库Sequence功能及其实现机制

昆仑分布式数据库（下文简称昆仑或者昆仑数据库）的计算节点源自PostgreSQL，因而继承了PostgreSQL的Sequence性能，本文介绍昆仑分布式数据库的Sequence的性能用法、用例和实现。

用法和用例

昆仑数据库的Sequence与MySQL的autoincrement（自增列）相比，其性能更加弱小和灵便。次要体现在以下几方面：

昆仑的Sequence与表是多对多的关系，而MySQL的自增列与表是1对1关系

具体来说，昆仑数据库的每个表能够有任意数量的sequence列应用雷同或者不同的sequence产生序列值；

并且每一个sequence能够被任意多个表的任意多个列应用来产生ID值。

而MySQL的每个表最多只能有一个自增列并且这个自增列只能被这个表应用（这是废话，然而为了内容对称还是要提一下）。

能够在任何时候调整sequence的初始值，最大值，步长，范畴等属性而后持续应用，而后sequence就会依照新的属性产生新序列值。

不依赖索引，清空表后序列值不回绕。

昆仑数据库集群多个计算节点间接或者间接应用同一个sequence 都能够产生全局惟一的序列值。

让咱们看一个例子，首先创立一个表t1，t1的主键列serial类型表明它应用一个隐式创立的sequence来产生字段值，所以插入时候能够不为它指定字段值。

create table t1(a serial primary key, b int);

而后创立sequence seq_b，筹备用seq_b来产生字段值。创立时能够可选地指定sequence的属性，不指定就应用默认值。

create sequence seq_b;

先执行这个语句插入9行，显式调用seq_b产生字段值。

insert into t1(b) values(nextval('seq_b'));

能够看到t1的数据如下：

select*from t1;

而后创立表t2，它的b和c列都应用seq_b产生缺省字段值，并且其主键列也实用隐式sequence来产生字段值。

create table t2(a serial primary key, b int default nextval('seq_b'), c int default nextval('seq_b'));

因为t2的所有字段都有缺省值，所以用如下语句插入表t2 3行。

insert into t2 default values;

查看t2的数据，能够看到每行b和c字段是应用seq_b顺次产生的字段值，并且从seq_b上次产生的9之后开始产生序列值。

select*from t2;

最初，还能够应用 select nextval('seq_b'); 这样的语句来间接产生序列值。

批改sequence元数据及其他

能够应用ALTER SEQUENCE 语句来批改sequence的属性，也能够应用ALTER TABLE ... ALTER COLUMN ... SET seqoptions 语句来批改列的隐式sequence的属性。

还能够应用上述alter table语句restart一个sequence。并且能够应用lastval()函数取得sequence上次返回的值。

sequence实现

昆仑数据库的sequence实现继承了PostgreSQL原有的sequence机制。

为了使sequence数据具备容灾能力并且可能被任意数量的计算节点同时应用，因而sequence的与序列值散发无关的数值数据存储在存储节点的mysql.sequences表中，每行对应一个sequence。

一个sequence的元数据具体存储在哪个存储集群中，是在创立sequence时由计算节点动态分配的。

sequence的其余元数据存储在计算节点，能够应用上面的语句查看sequence在计算节点中的元数据：

select t2.relname, t2.oid, seqstart, seqincrement, seqmax, seqmin, seqcache, seqcycle from pg_sequence t1, pg_class t2 where t1.seqrelid = t2.oid;

能够看到 t1和t2的主键列的隐式sequence别离是t1_a_seq和 t2_a_seq，还有显式创立的seq_b ，这些sequence的数值元数据所在的存储集群别离是1,2,1。

同时，能够看到sequence的根本元数据也存储在pg_class元数据表中，而其特有属性存储在pg_sequence表中。

别离连贯到编号为1和2的shard查看这3个sequence在这两个存储集群的mysql.sequence表中的数值元数据，能够看到以下信息：

当首次应用一个sequence或者其预约的数值范畴用尽时，一个计算节点CN就会通过其cluster_log_applier过程到这个sequence所在的存储集群中去reserve (curval, cur_val + max(10, seqcache)) 这个范畴的字段值，而后CN应用这个reserve的范畴来为这个sequence散发序列值，直到再次用尽。

这样，即便有多个计算节点应用同一个sequence来散发序列值，依然能够放弃高性能并且放弃所有计算节点散发的序列值都惟一。

结语

艰深来讲，如果对数据库的读和写都在同一个数据库服务器中操作，业务零碎性能会升高。

为了晋升业务零碎性能，优化用户体验，能够通过做主从复制来加重主数据库的负载。

而且如果主数据库宕机，可疾速将业务零碎切换到从数据库上，可防止数据失落。

*KunlunDB我的项目已开源

【GitHub：】
https://github.com/zettadb

【Gitee：】
https://gitee.com/zettadb

END