关于后端:我PolarDB云原生数据库5年来实现这些重磅技术创新

简介：过来 5 年，阿里云针对 PolarDB 进行了诸多翻新，通过采纳存储计算拆散、软硬一体化设计，PolarDB 实现老本仅为传统商业数据库的十分之一。所实现的计算、内存与存储资源的“三层解耦”架构、多主多写、基于 IMCI（内存列存索引）的 HTAP、Serverless 等性能已是寰球独创或业内当先的技术。从 PolarDB 公布以来，它在技术和商业化上都取得了迅猛发展，现在曾经成为阿里云数据库产品家族中最闪耀的产品。本文咱们将向大家具体介绍，PolarDB 公布 5 年来所实现的技术创新。

作者 | PolarDB 数据库起源 | 阿里开发者公众号数据库与芯片、操作系统并列为寰球信息技术三大件，也是企业 IT 零碎必不可少的核心技术，同时也是所有数字解决、计算力和智能化的基石。上世纪 70 年代，E.F.Codd 发表了一篇划时代的论文“A Relational Model of Data for Large Shared Data Banks”。从这篇论文开始，关系型数据库软件反动的尾声被拉开了。80 年代初期反对 SQL 的商用关系型数据库 Oracle 和 DB2 相继面市，以及 90 年代诞生的 SQL Server，开源的 MySQL、PostgreSQL 等都是关系型数据库胜利的代表。时至今日，随着寰球不同类型数据的指数级增长，市场上涌现出越来越多的新型数据库，然而关系型数据库依然占据主导地位。依据市场钻研机构 IDC 的最新统计数据显示，关系型在寰球数据库中占据约 80% 的份额。关系型数据库禁受住工夫的考验，为全世界用户的钟爱，最次要的起因之一就是关系型数据库采纳了 SQL 规范，这种高级的非过程化编程接口语言，将计算机科学和易于人类了解认知的数据管理形式完满的连接在了一起。到明天，这种编程语言还没有更加完满的替代品。数十年来，关系型数据库都利用在以 IOE 为代表的软硬件紧耦合的技术架构环境之下，然而明天，关系型数据库面对着云计算是承载工作流的次要环境的微小扭转。这种应用环境的变革性迁徙之下，客户对关系型数据库也提出了新的要求，比方能够反对更大的存储、弹性扩缩容上更灵便，甚至数据库能够实现“主动驾驶”。阿里云的数据库团队意识到，如果基于传统关系型数据库的架构进行小修小补，很难解决这些客户提出的问题，必须从根本上演进云上的关系型数据库架构，做一个全新的云原生关系型数据库。PolarDB 云原生关系型数据库也就此诞生。

过来 5 年，阿里云针对 PolarDB 进行了诸多翻新，通过采纳存储计算拆散、软硬一体化设计，PolarDB 实现老本仅为传统商业数据库的十分之一。所实现的计算、内存与存储资源的“三层解耦”架构、多主多写、基于 IMCI（内存列存索引）的 HTAP、Serverless 等性能已是寰球独创或业内当先的技术。从 PolarDB 公布以来，它在技术和商业化上都取得了迅猛发展，现在曾经成为阿里云数据库产品家族中最闪耀的产品。在本文中，咱们将向大家具体介绍，PolarDB 公布 5 年来所实现的技术创新。“三层解耦”：资源解耦的极致从 40 多年前数据库诞生开始，数据库的 CPU 和内存都是绑定在一起的，最多做到计算和存储解耦，没有数据库能做到 CPU 和内存的解耦，即便演进到目前的云原生数据库阶段，在 PolarDB 之前也没有任何数据库可能做到这一点。然而在云计算时代，每一层的资源解耦都能够使得弹性能力带来数量级的晋升。以后云原生数据库尽管实现了计算存储的解耦，绝对于传统数据库，其弹性能力有了不小的晋升，然而 CPU 和内存的强耦合极大地限度了弹性能力的进一步晋升，难以实现秒级跨机迁徙；同时也限度了内存的横向扩大，使得内存受到单机容量限度。PolarDB 历史性地提出并实现了基于 CPU、内存和存储资源拆散的“三层解耦”架构，构建了独立的 CPU 资源池、分布式内存资源池、分布式存储资源池，实现了资源的彻底解耦，CPU 和内存分别独立计费。同时通过分布式内存和数据库秒级跨机迁徙，使得弹性能力有了数量级的晋升，大幅降本增效。

多主架构：云原生数据库不再是单写数据库云原生数据库从诞生开始，就和一写多读绑定在了一起，仿佛云原生数据库天生只能是单写。写扩大能力的缺失，给用户带来了很大的困扰，很多用户在写节点达到甚至靠近最大规格一半的时候，就开始担心后续业务快速增长会导致数据库呈现瓶颈，因而不得不重新考虑其余数据库架构计划，而放弃云原生数据库；亦或是依赖传统数据库的横向扩大计划，例如中间件来实现横向扩大。尽管业内也有个别厂商开始尝试多主节点，单受限于节点数，并不能实现真正的横向写扩大。作为应云而生的云原生数据库，有没有一个云原生的解决方案来实现写扩大呢？“PolarDB 多主架构”由此而生。这是业内第一个反对大规模多主多写的云原生数据库，最大反对 32 个写节点。在 PolarDB 多主架构中，阿里云在整体架构从元数据、事务、锁、Undo/Redo、IO、代理等所有子系统均做了多主化革新；并采纳了 PolarFusion 技术，实现了多个写节点的高效数据交互。PolarDB 多主架构从根本上解决了用户的单主焦虑，使得 PolarDB 第一次冲破了单主限度，实现了横向写扩大；数据互通后的主主互备通过打消备节点在 RTO 不变的状况下节约一半的老本；跨主节点秒级流量切换也为 SaaS、游戏等行业解决了多租户 / 游戏服的跨节点调度提供了强有力的伎俩。

Serverless 的跨机冲破 Serverless 是最适宜云数据库的一种交付模式，实现了 On-demand Provision，使得用户不须要再为数据库布局容量，在顶峰时主动升配晋升稳定性，在低峰时主动降配降低成本。因而一时间云数据库厂商都纷纷推出了本人的 Serverless 状态。然而，以后业内的数据库 Serverless 状态均为单机 Serverless，其容量下限受到了很大的限度（8~32 core），并不能很好的实现其顶峰时主动升配以保障稳定性的指标，也限度了企业级客户的应用，同时读写节点本身的升降配对本节点的吞吐同样存在影响。这些限度的实质是目前云数据库的无感跨机弹性和强统一跨机扩大能力都尚不成熟，导致以后的 Serverless 只能实现单节点下无限的 Serverless。跨机弹性的限度是节点无奈跨机调度，因而单节点弹性下限只能限度到一个远小于物理机限度的值；而跨机强统一读扩大的能力缺失，导致其无奈通过增删强统一的只读节点来实现读流量的弹性。为解决单机 Serverless 的局限性，阿里云在业内第一次冲破了这两个技术难点：基于事务续传和秒级切换的无感秒切技术，解决跨机弹性问题；性能无损的强统一读技术，联合热节点池技术，解决跨机通明读扩大问题。基于以上技术冲破，PolarDB Serverless 的下限规格冲破了 1000core，带来了数量级的 Serverless 能力晋升，使得 Serverless 技术有了撑持企业级业务的能力。HTAP：同时解决交易和剖析性负载传统面向 OLTP 场景设计的关系型数据库，个别优化指标是晋升单核性能 / 多核扩展性 / 加强集群能力以晋升可用性等，其剖析性能往往不佳。然而实在业务的 SQL 又人造是 TP/AP 混合的，其须要事务处理和实时数据分析兼具的 HTAP 零碎。面对此问题，传统计划是应用一套数据同步零碎串联起上游的 TP 零碎和上游的数仓零碎，造成一套搭积木的计划，用多套零碎的组合来实现工作。在云数据库时代这种架构因为串联了 OLTP 数据库，消息中间件，OLAP 数据库三套零碎，上下游协定不兼容，运行保护简单。在云上很难规模部署以满足各种客户的需要。针对这些问题，在 PolarDB 云原生数据库畛域的技术积攒根底上，阿里云在 PolarDB 上推出了 In-Memory Column Index 性能，其为 PolarDB 带来列式存储以及内存计算能力，让用户能够在一套 PolarDB 数据库上同时运行 OLTP 和 OLAP 型混合负载，在保障现有 PolarDB 优异的 OLTP 性能的同时，大幅晋升 PolarDB 在大数据量上运行简单查问的性能，让 PolarDB 真正成为一款 HTAP 数据库。

PolarDB HTAP 蕴含如下几个要害技术创新：PolarDB 存储引擎新增对列式索引（Columnar Index）的反对，用户能够抉择通过 DDL 将一张表的全部列或者局部列创立为列索引，同时列索引采纳列压缩存储，其存储空间耗费会远小于行存格局。在 PolarDB 的 SQL 执行器层，阿里云重写了一套面向列存的执行器引擎框架 (Column-oriented), 该执行器框架充分利用列式存储的劣势，应用向量化执行办法晋升算子解决海量数据的效率。同时充分发挥古代 CPU 的 SIMD 指令能力，晋升 CPU 单核心解决数据的吞吐，且所有要害算子均反对并行执行。在列式存储上，新的执行器比照 MySQL 原有的行存执行器性有几个数量级的性能晋升。反对行列混合执行的优化器框架，该优化器会依据兼容性及执行打算代价两方面的因素，以选中最优的执行门路。同时阿里云还充分利用了 PolarDB 云原生数据库的技术劣势，反对 HTAP 节点的规格异构及按需弹性（Serverless），为用户提供一体化 HTAP 体验的同时兼具极致的性价比。并行查问：冲破单节点的资源和性能瓶颈传统的基于 MySQL 的关系型数据库在部署到云上后，仍然采纳了主备复制的数据同步模式来提供实例的高牢靠和高可用，但基于逻辑复制导致实例提早增大、多份存储等问题。PolarDB 通过共享存储和物理复制实现了云上的计存拆散和资源池化能力，为用户提供了最优的弹性能力和性价比。而从线上的长期运维能够发现，云上用户实例对 CPU 资源的均匀利用率是较低的，同时 MySQL 对查问的单线程解决形式又无奈满足业务上基于海量数据的实时剖析需要，这造成了极大的资源节约。为此阿里云推出了节点内以及跨节点并行查问(Parallel Query) 性能，针对性的利用多核 CPU 并行计算来晋升查问响应速度。但随着共享存储层的数据量进一步增长，单机的扩大能力将遇到瓶颈，包含 CPU、Memory 和 IO 等，传统数据库通过 share nothing 的分片架构和 MPP 计算引擎来冲破单机的资源瓶颈，但这毁坏了云上计存拆散带来的独立扩展性和极致弹性能力，有悖于古代云原生数据库的发展趋势。PolarDB 解决这个问题的计划是更为先进的计算、内存、存储 ” 三层解耦 ” 模式，通过将资源进一步拆解，在各个层面上各自独立扩大。而针对大数据量剖析查问，咱们在计算这一层层基于 Parallel Query 进一步演进，推出了基于共享存储的分布式弹性并行查问(Elastic Parallel Query)，通过节点间 + 节点内两层并行的联合以及基于分布式资源视图的智能调度策略，买通了集群内的多节点计算资源，与传统的固化的 MPP 架构相比，这带来了多方面的技术和老本劣势：通过多粒度的并行，更充沛的利用集群级的计算资源，冲破单节点的资源和性能瓶颈，PolarDB 在利用并行查问晋升 CPU 利用率的同时，也开发了并行 DDL 等能力，大大缩短了 DDL 的工夫，解决了一些大表用户的一个重要痛点，实现和传统 MPP 零碎雷同甚至更优的极致查问性能。基于分布式的全局资源视图，并联合数据的亲和性特色，对查问内的子计算工作进行智能调度，在尽可能防止 IO 的状况下实现各节点计算资源的平衡利用，防止部分热点带来的性能和保护问题。与云上的主动弹性无缝联合，随着实例计算层的 scale up/scale out 自适应的调整并行计算策略，既满足了用户的老本和性能需求，又无需额定的配置保护动作。灵便管制实例级别的计算资源拓扑，通过不同接入地址（子集群），实现不同业务的互相隔离和各自独立配置，满足具备不同个性的查问业务需要。架构演进的示意图如下：

分布式：实现通明分布式体验

数据库经验过来 40 多年的倒退，随着互联网、大数据的飞速发展，单台务器上的性能极限曾经缓缓露出，在这种状况下，技术人员逐步开始摸索数据库的扩大能力，目前整体扩大架构又两种状态：基于共享存储的 share-storage 架构、以及基于 share-nothing 的分布式架构，这两种架构别离代表了两个不同的扩大思路，有各自的优缺点。基于 scale-up 的单机扩大架构，在面向高并发场景下，容易遇到单机扩展性的天花板，因而在 2019 年开始，PolarDB 基于 share-nothing 的分布式架构，正式推出了云原生分布式版(PolarDB-X)，反对多写多读、以及低成本的冷热拆散分层架构。PolarDB 云原生分布式版（PolarDB-X）作为一款基于原生 MySQL 的云原生分布式数据库，高度兼容 MySQL 的协定和开源生态，引入 Paxos 多数派共识协定，聚焦国产化 MySQL 代替、分布式线性扩大、以及 HTAP 混合负载等场景。

PolarDB 云原生分布式版（PolarDB-X）蕴含如下几个要害技术创新：1. 通明分布式体验，引入主动数据分区与数据主动亲和性汇集技术，自动识别数据的业务属性进行相关性绑定和对立调度，在晋升数据库线性扩大能力的同时，防止因为跨分区的事务和简单查问带来的性能开销，最大水平将事务波及范畴局限在单个物理节点，以及最大化下推计算算子缩小数据交换。联合全局二级索引、在线数据变更，做到分布式数据库靠近单机数据库体验，突破了分布式能力利用事实场景中的要害阻碍。2. 冷热拆散存储架构，引入数据分区的 Time-to-Live(TTL)策略，随着工夫推动，能够将历史不常拜访的冷数据进行定期归档，PolarDB 分布式联合云对象存储 OSS 作为冷存储介质，采纳编码压缩、以及 OSS 自身的老本劣势，冷数据仅有 MySQL InnoDB 在线数据 1 /20 的存储老本，同时提供单个数据库实例的通明应用体验，对立 SQL 拜访、备份操作等。3. 全面拥抱国产化，基于全内核开源的策略，保持基于 MySQL 的麻利可控路线，目前 PolarDB 曾经顺利高分通过分布式数据库的金融行业标准认证、信通院的分布式数据库性能和高可用认证等。除了满足私有云的交付外，PolarDB 能够面向传统金融、政府行业的公有云交付、以及基于开源内核的纯软部署能力，全面反对数据库的多场景、多状态的交付能力。PolarDB 云原生分布式版（PolarDB-X）的数据库状态，联合云原生 + 分布式 + 国产化的技术，将来也会进一步交融 HTAP 混合负载能力，引入行列混存架构，更好的满足数据实时性的要求。性能演进：提出一系列优化办法设计之初，PolarDB 的理念就是为云上用户提供具备极致弹性、高性能、海量存储、安全可靠的数据库服务。PolarDB 采纳计算和存储拆散的架构，通过物理复制技术和共享存储架构，在满足业务容量弹性扩大需要的同时极大的升高了用户的存储老本。在设计上，PolarDB 既交融了商业数据库稳固牢靠、高性能、可扩大的特色，又具备开源云数据库简略凋谢、自我迭代的劣势。依靠于阿里云先进牢靠的硬件平台，PolarDB 采纳 RoCE RDMA 网络、3DXpoint 存储介质等先进技术，并面向新硬件架构实现软硬一体优化。从数据库内核、文件系统到网络通讯协定和分布式存储系统，PolarDB 实现了纵贯软件栈各层次的深度优化。仅仅构建高性能硬件底座并不能齐全解决云原生数据库的性能问题。例如即使领有高吞吐的 RDMA 网络但聚合带宽难以充分利用；远端节点 I / O 拜访、多正本长久化等要求使得云存储 I / O 延时远高于本地存储；又比方更长的数据链路中有更多的排队，导致 I / O 间的隔离性变低；共享存储架构 cache concurrence 代价等。针对云原生数据库面临的性能挑战，PolarDB 的存储引擎提出了一系列优化办法：并行化多任务：例如对集中 Log buffer 按 Page Partition 分片，实现并行写入并基于分片进行并行 Recovery。预取和读取裁剪：例如通过收集并聚合原扩散 meta 至对立的 superblock，将多个 I / O 合一实现 fast validating；通过预读利用聚合读带宽、缩小读工作延时等。锁优化：针对零碎瓶颈，实现无锁刷脏、基于 blink-tree 的无锁 SMO 等。拜访打散和优先级调度：例如将单个大 I / O 并发扩散至不同存储节点扩散拜访，充分利用云存储聚合带宽；在 DB 层面对不同 I / O 进行打标、调度优先级，打消长链路、低隔离 I / O 工作的影响。通过 Bypassing Caches 来防止分布式文件系统的 cache coherence，并在 DB 层面优化 I / O 格局匹配存储最佳 request 格局。上述例子也只是露出了冰山一角，PolarDB 在性能演进之路上也将一直向前迈进。展望未来：所有才刚刚开始上市 5 年来，PolarDB 在架构、性能、性能等方面不断创新，其实这些翻新都是围绕一个目标，就是一直开释云计算资源池化的后劲，最大化云计算资源池化的价值。不仅如此，PolarDB 还保持开源凋谢的理念，将 PolarDB-PG 和 PolarDB- X 进行了全内核开源，推动了整个行业的技术改革。2021 年杭州云栖大会上，阿里云智能数据库产品事业部与达摩院数据库与存储实验室负责人李飞飞提出，PolarDB 要将云原生进行到底。因为他早在 2019 年就断言，将来的数据库肯定是云原生数据库。他说，云原生数据库在老本、灵便度、平安、技术进化层面都优于传统数据库，“传统数据库会像马车一样被淘汰”。古代数据库技术曾经有 40 多年倒退历史，比照之下，新一代云原生数据库的翻新也不过几年工夫。一个全新的云原生数据库时代曾经到来，翻新才刚刚开始。举荐浏览 1. 研发效力的思考总结 2. 对于技术能力的思考和总结 3. 如何结构化和清晰地进行表白原文链接：https://click.aliyun.com/m/10… 本文为阿里云原创内容，未经容许不得转载。