关于数据库:TDSQL分布式数据库的架构与解耦

TDSQL团队在研发分布式事务型数据库的过程中，除了思考分布式事务处理技术（ACID实现的所有技术）外，还深度摸索测试验证、架构扩大、模块解耦等等各种重要的问题。

新硬件和AI等技术，在云环境下，如何影响着数据库的架构？

数据库各个模块间是否能解耦以升高研发的复杂度，同时缩短研发人才的造就周期？

新硬件和AI等技术，从架构上深深地影响了传统的数据库，这体现在如何交融这些新技术：

首先，数据库可能会“减少”很多新模块进去，如图7中的左下子图，AI调优数据库技术使得数据库系统被扩大了，减少了很多新组件进来。
其次，数据库的传统模块会被扭转，如图8中的左下子图，在并行的事务型数据库系统中，提出基于AI技术对事务进行优化的模型。该模型采取存储过程的形式（此点相似H-Store、VoltDB），向数据库引擎提前提供所执行的事务，而后利用AI技术（Markov model，马尔可夫模型）对存储过程进行剖析，确定那些存储过程所代表的事务间的语义，排定事务并发执行时哪些是互相冲突的，失去一个有固定构造的事务执行模型，如图8左下子图中右侧，是对TPC-C模型NewOrder进行的剖析失去的事务调度图。
当多个Client收回SQL语句执行存储过程代表的并发事务时，据此模型即能推断事务的调度形式。这是AI技术扭转事务处理中并发访问控制模块的一个典型事例。

下图中“d”模型是基于RDMA从2个方面对事务处理形成影响，一是事务处理的控制流，二是事务执行过程中产生的数据流。影响分布式事务处理效率的，不仅仅是宏大的数据流，而绝对数据量小的控制流，也是瓶颈，因而须要引入RDMA来加以解决网络带宽瓶颈。

数据库中的模块发生变化

传统的数据库系统，其复杂度极高，从外看高内聚，从内看高耦合，这使得数据库的复杂度骤然晋升。当各种新技术产生，影响了数据库的架构时，数据库的复杂性被再提上一个台阶。在这种背景下，研发人才的培养，其成长周期就会更长。因而，咱们在思考的一个问题是：从技术上看，如何解耦数据库外部间的诸多模块？耦合度高，研发人员须要把握数个相干模块能力良好推动工作；如果模块间解耦较好，把握单个模块就能不便推动工作，这样人才的培养周期相应也会缩短，软件的品质也会失去进步。

所以，数据库架构背景下各个模块解耦问题，是一个技术问题。解耦工作，能够在许多档次、许多模块间开展。解耦技术，各有其妙。

上子图所示，AWS的Aurora提出的存储计算拆散，就是存储和计算两大模块的解耦。而微软Deuteronomy零碎在08年-16年也有过一系列相干工作。Deuteronomy一开始采纳的计划是在存储层下面实现事务，而底层的存储采纳的是KV模型。存储层只须要提供KV的原子性和幂等性，下层就能够比拟容易实现事务的并发访问控制和复原。

起初的Percolator、Spanner/F1、CockroachDB、TiDB其实也是沿着这个思路在倒退，底层是Bigtable/Spanner或者RocksDB这样的KV存储引擎，在存储之上封装一层事务。然而在相似RocksDB这样的KV存储中，对于KV记录的并发管制还是和存储紧耦合的。

存储和计算两大模块的解耦，促成了各自所囊括的子模块之间再次进行解耦，事务和存储层的解耦，该怎么进行？有的研究者，把事务处理性能提取到客户端进行（左子图），有的把事务处理性能放到中间件层履行按（两头子图），这2种形式不同于传统的在Server端进行事务处理（右子图）。

事务和存储层解耦

另外，解耦工作，其实无处不在。下图展现了算法与数据结构之间的解耦。下图的左子图，是数据库的长久化局部和内存中数据之间的设计解耦。下图的右子图，是索引的数据结构与物理存储层之间的解耦。

下图左子图，对应VLDB 2018的论文”FineLine: Log-structured Transactional Storage and Recovery”，提出了一种事务存储和复原机制FineLine，舍弃了传统的WAL，把所有须要长久化的数据存储到一个繁多的数据结构，心愿将数据库的长久化局部和内存中数据存储之间达到设计解耦。

FineLine无需将内存中数据落盘到DB，仅将内存中的log信息长久化到Indexed log中，而后通过fetch操作从Indexed log读取到数据的最新状态。通过将内存中的数据结构与其持久性示意尽量地解耦，打消了与传统基于磁盘的RDBMS相干的许多开销。除此之外，这种繁多的长久化存储架构带来的另一个益处是，在零碎产生故障后复原的开销很低。因为Indexed log放弃了与原子操作的一致性，当产生故障并重启时，能够从Indexed log中读取到已提交的最新数据记录。基于no-steal的策略，Undo操作，Checkpoint这些也都不须要。

计算与数据结构之间的解耦

数据库外部，各个模块之间的解耦，与模块粒度的划分，与具体实现的零碎，都有密切关系。如图11展现了几个支流数据库之间解耦的关系，期待能抛砖引玉，引发更多思考。

结语

数据库作为外围根底技术之一，在自主可控的时代倒退潮流下，是咱们必将要跨过的大山。路虽弥，不行则不至，历经十数年的研发演进，至多明天咱们都已达成了许多重要的里程碑。当下而言，国产数据库从技术、人才、工业生态等各方面，都有待欠缺和倒退，而将来更严密的产学研联合、科技与传统产业交融趋势下，将进一步促成数据库自主可控倒退。

关于数据库:TDSQL分布式数据库的架构与解耦

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于数据库:TDSQL分布式数据库的架构与解耦

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复