关于数据库:16-台服务器达成-1000-万-tpmC挑战分布式数据库性能极限

近日，Apache ShardingSphere 社区与 openGauss 社区再度开展单干，Apache ShardingSphere + openGauss 的分布式解决方案，冲破了单机性能瓶颈，应用 16 台服务器在超过 1 小时的测试中，失去了均匀超过 1000 万 tpmC 的后果。

ShardingSphere + openGauss，达成 1000 万 tpmC

在本次测试中，openGauss 社区基于规范 BenchmarkSQL 5.0 工具，进行本轮 TPC-C 测试。

在单机性能方面，openGauss 冲破了多核 CPU 的瓶颈，实现两路鲲鹏 128 核达到 150 万 tpmC，内存优化表（MOT）引擎达到 350 万 tpmC。但业务场景及用户体验对于性能的谋求是无止境的，尤其在现在海量数据的场景下，谋求性能极限依然是每一款数据库的指标。

在此状况下，openGauss 团队采纳了 7 台机器运行适配了 ShardingSphere-JDBC 的 BenchmarkSQL 测试工具，连贯 8 台 openGauss 数据库，并部署了 1 台 ShardingSphere-Proxy 用于数据初始化、一致性校验等保护操作。通过数据分片能力，ShardingSphere 使总共 8000 仓数据（超过 800 GB）被扩散在 8 台 openGauss 节点。在完满 Sharding 的状况下进行继续超过 1 小时的测试后，失去了均匀超过 1000 万 tpmC 的后果，行业等同规模下性能最好。

这极大冲破了 openGauss 现有的性能极限，冲破了单机性能瓶颈，满足 openGauss 在海量数据场景下对于性能、可用性以及运维老本这三方面的诉求。两者的联合，正在继续挑战分布式数据库的性能极限。

ShardingSphere 与 openGauss 的生态单干

Apache ShardingSphere 社区自 2021 年起就开始与 openGauss 社区开展密切合作。

随着业务场景的细分以及数据体量的增长，将数据集中存储至繁多节点的传统解决方案，曾经难以在性能、可用性和运维老本等方面满足业务需要。诚然，数据分片能力可能解决单机数据库在性能、可用性以及单点备份复原等问题，但也带来了分布式架构较高的零碎复杂性。

作为 Database Plus 理念的提出者和实践者，Apache ShardingSphere 旨在构建异构数据库下层的规范和生态，以叠加扩大数据分片、弹性伸缩、数据加密等更多计算能力为根底，站在数据库的下层视角来关注数据库之间的合作形式，以可能正当且充沛地利用数据库计算与存储能力。目前，Apache ShardingSphere 曾经造成了微内核 & 可插拔架构模型，并在此基础上继续欠缺内核及性能层面的能力，为企业及开发者用户提供更多更灵便的解决方案，以满足在不同场景下的特定需要。

得益于 ShardingSphere 可插拔架构的设计理念，在 ShardingSphere 中实现对 openGauss 的反对毋庸进行额定革新，只须要基于 ShardingSphere 各个模块所提供的 SPI 扩大点，减少对应 openGauss 数据库的实现。在 Apache ShardingSphere 5.0.0 版本，已正式实现对 openGauss 数据库的反对。

单方在单干过程中，通过将 openGauss 弱小的单机性能与 Apache ShardingSphere 生态所提供的分布式能力联合，打造出了实用于高并发 OLTP 场景的国产分布式数据库解决方案；除性能层面的单干外，ShardingSphere 与 openGauss 在性能方面一直磨合，充分利用 openGauss 内核技术的翻新，一直地将 ShardingSphere 与 openGauss 组成的国产分布式数据库解决方案的性能与性能推向极致，此次对于 TPC-C 的性能测试，就是单方密切合作的一次典型案例。

应用 ShardingSphere 打造基于 openGauss 的分布式数据库解决方案

当然，Apache ShardingSphere 的能力不仅有数据分片，还有读写拆散、数据加密、影子库等性能，在不同的场景下各项性能既能够独自应用，也能够联合应用，用户齐全能够依照本人的需要组合 ShardingSphere 的能力。

Apache ShardingSphere 目前提供两种接入形式，别离为 ShardingSphere-JDBC 和 ShardingSphere-Proxy。在业务中应用 ShardingSphere-JDBC 对数据库轻松进行分库分表以及读写拆散等透明化操作，来解决其对于“高并发”、“低提早” 场景的需要。同时在 JDBC 的根底上，ShardingSphere 提供 Proxy 端的部署模式，将数据库局部能力和操作部署在 Proxy 层面，让用户能够像应用原生数据库一样应用 Apache ShardingSphere，为用户带来更加优质的应用体验。

因而，倡议 ShardingSphere-JDBC 和 ShardingSphere-Proxy 混合部署应用，这样能够实现保护敌对与性能兼顾的均衡。

在 openGauss 的体系中，Apache ShardingSphere 可能通过程度拆分以使 openGauss 的计算与存储能力实现线性扩大，性能也随着扩大准线性增长，从而无效解决单表数据量收缩问题；此外联合业务流量，灵便平滑进行数据节点的扩缩容，智能读写拆散，实现分布式数据库的主动负载平衡。

后续倒退

本次 Apache ShardingSphere 与 openGauss 两家社区的单干，向外界展现了开源社区之间的单干后劲。随着利用场景的细化以及数据体量的增长，将来对于数据库性能的要求只会更高。此次单干的胜利只是单方构筑数据库合作生态的一个开始，置信 ShardingSphere 与 openGauss 这种单干模式，肯定会有更加广大的倒退空间。

💡 对于 openGauss

openGauss 是一款开源的关系型数据库管理系统，它具备多核高性能、全链路安全性、智能运维等企业级个性，交融了华为在数据库畛域多年的内核教训，在架构、事务、存储引擎、优化器及 ARM 架构上进行了适配与优化。

💡 对于 TPC-C

TPC-C（Transaction Processing Performance Council Benchmark C）用于比拟在线事务处理（OLTP）零碎性能的基准测试标准规范，由 TPC 于 1992 年公布，目前最新的标准为 2010 年更新的 TPC-C v5.11。TPC-C 具备多种事务类型、简单的数据库和整体执行构造。TPC-C 波及五个不同类型和复杂性的并发事务的混合，事务会实时执行或进入队列提早执行。数据分布在数据库九种类型的表中，表的数据量各不相同。TPC-C 以每分钟事务数（tpmC, transactions per minute C）掂量。尽管 TPC-C 模仿了零售供应商的业务，但 TPC-C 并不限于任何特定业务部门的流动，而是代表必须治理、销售或分销产品或服务的任何行业。

欢送增加社区经理微信（ss_assistant_1）退出交换群，与泛滥 ShardingSphere 爱好者一起交换。

关于数据库:16-台服务器达成-1000-万-tpmC挑战分布式数据库性能极限

ShardingSphere + openGauss，达成 1000 万 tpmC

ShardingSphere 与 openGauss 的生态单干

应用 ShardingSphere 打造基于 openGauss 的分布式数据库解决方案

后续倒退

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于数据库:16-台服务器达成-1000-万-tpmC挑战分布式数据库性能极限

ShardingSphere + openGauss，达成 1000 万 tpmC

ShardingSphere 与 openGauss 的生态单干

应用 ShardingSphere 打造基于 openGauss 的分布式数据库解决方案

后续倒退

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复