关于数据库:迈向企业级核心场景的-TiDB-50

随着 2021 年春天的降临和 PingCAP 年满 6 周岁纪念日的到来，TiDB 5.0 迎来正式 GA。通过近一年紧锣密鼓的开发和打磨，TiDB 5.0 成为迈向企业级外围场景的里程碑版本：TiDB 5.0 的性能和稳定性失去显著晋升，从而具备更弱小的 OLTP 金融级外围场景的服务能力；在原有 HTAP 引擎 TiFlash 的根底上引入 MPP 架构，TiDB 使得泛滥企业的实时 / 交互式 BI 成为事实，为高成长企业和数字化翻新场景提供了一栈式的数据服务底座，减速带动 HTAP 进入更多大型企业的数字化场景。

此外，TiDB 5.0 新增多项企业级个性，集成更丰盛的大数据生态，提供更加繁难的运维体验，帮忙企业更高效地基于 TiDB 构建和扩大利用。秉持开源、凋谢、翻新的倒退门路，TiDB 将继续为企业构建“交融，简化，牢靠”的分布式数据库平台。

相比于 TiDB 4.0，TiDB 5.0 在性能方面获得了微小的提高，通过提供聚簇索引、异步提交事务、TiFlash MPP 等性能，在 Sysbench 和 TPC-C 等 OLTP 的基准测试中，取得 20% ~ 80% 的性能晋升。基于 100 GB 数据量 TPC-H 查问的结果显示：TiDB 5.0 在等同资源下，MPP 引擎的总体性能是 Greenplum 6.15.0 与 Apache Spark 3.1.1 两到三倍之间，局部查问可达 8 倍性能差别。如下是在一些通用性能测试场景上面的数据：

组件名称	配置信息	数量
PD	m5.xlarge (AWS)	3
TiDB	c5.4xlarge (AWS)	3
TiKV	i3.4xlarge (AWS)	3

16 张表，每张表有 1000 万行数据

相比于 TiDB 4.0，TiDB 5.0 在稳定性下面获得了微小的提高。通过优化 TiDB 调度过程中对 I/O、网络、CPU、内存等资源的占用，大幅缩小 QPS 和延时因为资源被抢占而呈现的性能抖动问题，在 TPC-C OLTP 的基准测试中，掂量 TPC-C tpmC 抖动标准差的值小于等于 2%。

Intel(R) Xeon(R) CPU E5-2630 v4 @ 2.20GHz 40Core 189GB Memory 3TB SSD

用户在排查 SQL 语句性能问题时，须要具体的信息来判断起因。TiDB 5.0 通过 EXPLAIN 可查看日志、监控等详细信息，帮忙用户晋升排查问题的效率。

在 TiDB 5.0 中，TiUP 反对一键式环境查看并给出修复倡议，主动修复查看过程中发现的环境问题，优化了多项集群部署的操作逻辑，便于 DBA 更快地部署规范的 TiDB 生产集群。新版本的 TiUP 提供业务无感知的降级体验，降级过程中的性能抖动管制在 10~30 秒。

在降级 TiDB 时，新增主动捕捉并绑定查问打算的性能，由零碎主动捕捉并绑定最近一次查问打算而后存储在零碎表中，确保降级过程中的 SQL 依然走绑定的执行打算，

确保稳定性。降级实现后，DBA 能够导出绑定的查问打算，剖析并决策是否要删除绑定。

TiDB 5.0 反对不可见索引 (Invisible Indexes)，DBA 在调试和抉择绝对最优的索引时，能够通过 SQL 语句将某个索引设置成 Visible 或者 Invisible，防止执行耗费资源较多的操作，例如：DROP INDEX 或 ADD INDEX。

在 TiDB 5.0 性能调优或者运维过程中，用户能够依据理论须要或者基于 EXPLAIN ANALYZE 测试抉择优化过的 SQL 语句，通过 SQL BINDING 将优化过的 SQL 语句与业务代码执行的 SQL 语句绑定，确保稳定性。

数据迁徙类工具反对 AWS S3（也蕴含反对 S3 协定的其余存储服务）作为数据迁徙的两头转存介质，同时反对将 Aurora 快照数据间接初始化到 TiDB 中，丰盛了数据从 AWS S3/Aurora 迁徙到 TiDB 的抉择。

数据导入工具 TiDB Lightning 针对 DBaaS AWS T1.standard 配置（及其等同配置）的 TiDB 集群进行了数据导入性能优化，测试结果显示应用 TiDB Lightning 导入 1TB TPCC 数据到 TiDB，性能晋升了 40%，由 254 GiB/h 晋升到了 366 GiB/h。

TiCDC 集成 Kafka Connect (Confluent Platform)，通过 Kafka Connectors 协定，反对将 TiDB 的数据变更同步到不同关系型或非关系型数据库，例如：Kafka, Hadoop, Oracle 等，帮忙企业将业务数据流转到异构数据库，造成数据闭环。

TiCDC 反对在多套 TiDB 集群之间互相复制数据，可用于多个 TiDB 集群之间数据的备份、容灾与数据汇聚等场景。

乐观事务模式下，如果事务所波及到的表存在并发的 DDL 操作或者 SCHEMA VERSION 变更，零碎主动将该事务的 SCHEMA VERSION 更新到最新版本，以此确保事务的胜利提交。

TiDB 5.0 引入 Raft Joint Consensus 算法将 Region 成员变更操作中的“增加”和“删除”合并为一个操作，并发送给所有成员，晋升 Region 成员变更时的可用性。在变更过程中，Region 处于两头的状态，如果任何被批改的成员失败，零碎依然具备高可用能力。

为满足企业平安合规例如《通用数据保护条例》(GDPR) 的要求，TiDB 在输入错误信息和日志信息时，反对对敏感信息（例如身份证信息、信用卡号等）进行脱敏解决，防止敏感信息泄露。

此外，新版本进一步优化了内存治理模块，跟踪统计聚合函数的内存应用状况，从而升高零碎 OOM 的危险。在 SQL 性能方面，TiDB 5.0 反对 INTERSECT 和 EXCEPT 操作符、反对 List 和 List Column 分区表，在字符集和排序规定方面反对 utf8mb4_unicode_ci 和 utf8_unicode_ci 排序规定。

作为企业级开源分布式数据库，TiDB 5.0 在性能、稳定性、易用性、高可用与平安合规等方面都获得了微小的提高，并减少了多个企业级个性，在 OLTP Scale 的根底之上实现了一栈式数据实时剖析的需要，将带动企业用户借助增强性 HTAP 的能力，减速推动数字化转型与降级。

明天就去下载吧！

TiDB 5.0 Download

TiDB 5.0 GA Release Notes

特别感谢，TiDB 的开发者社区和用户社区的所有小伙伴为 TiDB 倒退所作出的奉献。从 TiDB 4.0 公布以来总计有 538 位 Contributor 提交了 12513 个 PR 帮忙咱们一起实现企业级外围场景的里程碑版本的开发。如何让 TiDB 在这个时代最优良的场景中打磨从而不停的迭代和进化？咱们置信唯有极致的凋谢能力让这所有变为可能：凋谢的源代码，凋谢的社区，凋谢的生态和凋谢的心态！

关于数据库:迈向企业级核心场景的-TiDB-50

高性能：多项性能指标实现冲破

配置信息

负载信息

性能数据

稳定性：掂量 TPC-C tpm-C 抖动的规范差值小于等于 2%

配置信息

易用性：更精准，更高效，更全面

更精准的性能排查

更高效的集群运维

更全面的 SQL 调优

数据生态：减少多个数据迁徙、数据导入、数据共享组件，不便用户在异构环境应用 TiDB

数据迁徙方面

数据共享方面

企业级个性：企业级个性取得整体加强

事务方面

高可用与容灾

平安合规

总结