昆仑分布式数据库(下文简称昆仑或者昆仑数据库)的计算节点源自PostgreSQL,因而继承了PostgreSQL的Sequence性能,本文介绍昆仑分布式数据库的Sequence的性能用法、用例和实现。

用法和用例

昆仑数据库的Sequence与MySQL的autoincrement(自增列)相比,其性能更加弱小和灵便。次要体现在以下几方面:

  1. 昆仑的Sequence与表是多对多的关系,而MySQL的自增列与表是1对1关系

具体来说,昆仑数据库的每个表能够有任意数量的sequence列应用雷同或者不同的sequence产生序列值;

并且每一个sequence能够被任意多个表的任意多个列应用来产生ID值。

而MySQL的每个表最多只能有一个自增列并且这个自增列只能被这个表应用(这是废话,然而为了内容对称还是要提一下)。

  1. 能够在任何时候调整sequence的初始值,最大值,步长,范畴等属性而后持续应用,而后sequence就会依照新的属性产生新序列值。
  1. 不依赖索引,清空表后序列值不回绕。
  1. 昆仑数据库集群多个计算节点间接或者间接应用同一个sequence 都能够产生全局惟一的序列值。

让咱们看一个例子,首先创立一个表t1,t1的主键列serial类型表明它应用一个隐式创立的sequence来产生字段值,所以插入时候能够不为它指定字段值。

create table t1(a serial primary key, b int);

而后创立sequence seq_b,筹备用seq_b来产生字段值。创立时能够可选地指定sequence的属性,不指定就应用默认值。

create sequence seq_b;

先执行这个语句插入9行,显式调用seq_b产生字段值。

insert into t1(b) values(nextval('seq_b'));

能够看到t1的数据如下:

select*from t1;

而后创立表t2,它的b和c列都应用seq_b产生缺省字段值,并且其主键列也实用隐式sequence来产生字段值。

create table t2(a serial primary key, b int default nextval('seq_b'), c int default nextval('seq_b'));

因为t2的所有字段都有缺省值,所以用如下语句插入表t2 3行。

insert into t2 default values;

查看t2的数据,能够看到每行b和c字段是应用seq_b顺次产生的字段值,并且从seq_b上次产生的9之后开始产生序列值。

select*from t2;

最初,还能够应用 select nextval('seq_b'); 这样的语句来间接产生序列值。

批改sequence元数据及其他

能够应用ALTER SEQUENCE 语句来批改sequence的属性,也能够应用ALTER TABLE ... ALTER COLUMN ... SET seqoptions 语句来批改列的隐式sequence的属性。

还能够应用上述alter table语句restart一个sequence。并且能够应用lastval()函数取得sequence上次返回的值。

sequence实现

昆仑数据库的sequence实现继承了PostgreSQL原有的sequence机制。

为了使sequence数据具备容灾能力并且可能被任意数量的计算节点同时应用,因而sequence的与序列值散发无关的数值数据存储在存储节点的mysql.sequences表中,每行对应一个sequence。

一个sequence的元数据具体存储在哪个存储集群中,是在创立sequence时由计算节点动态分配的。

sequence的其余元数据存储在计算节点,能够应用上面的语句查看sequence在计算节点中的元数据:

select t2.relname, t2.oid, seqstart, seqincrement, seqmax, seqmin, seqcache, seqcycle from pg_sequence t1, pg_class t2 where t1.seqrelid = t2.oid;

能够看到 t1和t2的主键列的隐式sequence别离是t1_a_seq和 t2_a_seq,还有显式创立的seq_b ,这些sequence的数值元数据所在的存储集群别离是1,2,1。

同时,能够看到sequence的根本元数据也存储在pg_class元数据表中,而其特有属性存储在pg_sequence表中。

别离连贯到编号为1和2的shard查看这3个sequence在这两个存储集群的mysql.sequence表中的数值元数据,能够看到以下信息:

当首次应用一个sequence或者其预约的数值范畴用尽时,一个计算节点CN就会通过其cluster_log_applier过程到这个sequence所在的存储集群中去reserve (curval, cur_val + max(10, seqcache)) 这个范畴的字段值,而后CN应用这个reserve的范畴来为这个sequence散发序列值,直到再次用尽。

这样,即便有多个计算节点应用同一个sequence来散发序列值,依然能够放弃高性能并且放弃所有计算节点散发的序列值都惟一。

结语

艰深来讲,如果对数据库的读和写都在同一个数据库服务器中操作,业务零碎性能会升高。

为了晋升业务零碎性能,优化用户体验,能够通过做主从复制来加重主数据库的负载。

而且如果主数据库宕机,可疾速将业务零碎切换到从数据库上,可防止数据失落。

*KunlunDB我的项目已开源

【GitHub:】
https://github.com/zettadb

【Gitee:】
https://gitee.com/zettadb

END