关于数据库:师文汇OceanBase-40-产品核心能力解读

46次阅读

共计 5174 个字符,预计需要花费 13 分钟才能阅读完成。

8 月 10 日,2022 OceanBase 年度发布会在京沪深三地同时召开,OceanBase 解决方案和产品部总经理师文汇分享了《OceanBase 4.0 产品外围能力解读》的主题演讲,为大家介绍了 OceanBase 整个产品在 4.0 上的建设历程。

以下为演讲实录:

大家好,明天很开心给大家分享 OceanBase 4.0 产品外围能力的解读。OceanBase 4.0 版本在咱们的产品倒退过程中是具备里程碑意义的产品,基于分布式一体化架构,OceanBase 的产品能力以及边界失去了极大晋升。 明天我分为两局部给大家分享一下 OceanBase 整个产品在 4.0 版本上的重大变动。

OceanBase 演进三部曲

咱们简略回顾一下 OceanBase 产品倒退的历史,以及数据库产业面临的要害挑战。

首先,过来几年随着互联网的倒退,寰球的数据以飞快的速度积攒,预计到 2025 年寰球数据能达到 175 ZB, 这么大规模的数据增长,带来的存储老本和管理效率问题成为数据库面临的要害挑战。 方才就有嘉宾提到了“如何用更低的老本存储数据,如何高效地施展数据的价值是十分大的挑战”。

其次,NoSQL 数据库通过十几年的倒退,在整个数据库市场有了肯定的份额,然而从寰球数据库市场的角度来看,80% 的企业依然在应用关系型数据库存储和治理他们的业务数据。 如何晋升关系型数据库的能力,也是数据库产业面临的关键问题。

第三,中国有 30 万的 DBA,近 800 万的开发者,数据库作为服务各行各业的基础设施,在面临不同业务、不同场景的时候有十分高的复杂度, 如何帮忙 DBA 和开发者升高应用数据库的门槛也是十分大的问题。带着这三个问题,也就有了 OceanBase 产品倒退的三个阶段。

第一阶段,OceanBase 通过分布式能力解决数据库的扩展性,实现了海量数据的存储管理;第二阶段,继续欠缺 OceanBase SQL 和 PLSQL 的能力,使得在海量数据上,能够更好地撑持数据库 SQL 等要害能力;第三阶段,重视建设 OceanBase 的产品和生态,让更多的 DBA 能够把 OceanBase 不便地应用起来。

如果数据库的内核是一辆车的发动机,那么数据库相干的产品就是形成这辆车的所有其余整机,咱们心愿能给 OceanBase 的使用者提供像汽车一样的简略易用的应用体验。OceanBase 4.0 在我看来在 3.0 的根底上,产品力层面又做了十分大的晋升。

过来几年里,无论是 OceanBase 做商业拓展的时候,还是服务蚂蚁以及阿里巴巴团体所有业务的时候,OceanBase 产品力的首要服务指标都是帮忙这些企业业务的外围零碎运行得更好。 但随着整个商业化的深刻,OceanBase 作为数据库开始真正走向宽广的通用型数据库市场,在这个阶段中,客户给咱们提出了很多新的诉求,咱们把这些诉求总结成了四大方面。

第一,外围零碎的迁徙能力。 过来咱们很多搭档、客户用 OceanBase 的分布式能力,帮他们解决了外围业务零碎的可扩展性以及海量数据的存储问题。然而也有很多客户的部署场景绝对比较复杂,他们还有很多业务外围零碎部署在只有 4C8G、8C16G 等小规格的虚拟机或者物理设施里,咱们在 3.0 时代是很难服务好这些客户的。

在外围迁徙过程中还遇到了分布式场景下的易用性问题。比方分布式 Online DDL、分区决裂合并、分布式场景下简单 SQL 查问的问题,3.0 版本架构很难解决这些问题。

第二,基础设施的多样化。 明天客户会应用到 ARM 处理器、鲲鹏、Intel、x86 AMD 等不同类型的服务器,另外客户还会用到有很多不同类型的云厂商。在这种状况下,客户都心愿用对立的视图治理所有的数据库系统。

第三,全球化。 最近很多中国客户在做出海的业务,比方近年来火爆的电商出海、游戏出海、物流出海等业务场景,但出海过程中面临两个十分大的问题,首先是地区安全监管问题,其次是全球化的基础设施的多样性带来了运维简单的问题,客户心愿咱们在数据库畛域帮他们更好地解决这些问题。

第四,凋谢化。 从 2021 年开始,OceanBase 开始加大在开源畛域和生态畛域的建设,很多生态搭档退出到 OceanBase 的生态建设里,整个过程中咱们的搭档提出了很多诉求,例如产品及产品外围能力是否更加凋谢?产品是否更多地适配到生态工具?开源版本如何能力真正用到业务的外围零碎里?当然这些也是 OceanBase 4.0 始终想要致力达成的指标。

4.0 产品外围能力解读

明天公布的 OceanBase 4.0,其外围指标就是解决下面所说的这四个比拟大的挑战。对于一家企业来说,业务通常分为外围业务、非核心业务以及一些创新型业务。

  • OceanBase 4.0 的外围指标是可能满足企业全生命周期的业务撑持。

首先,外围系统对稳定性、可靠性有十分严苛的要求。为此,咱们在 3.0 的根底上把 RTO 的工夫从 30 秒做到 8 秒,这是业界最早能把 RTO 工夫做到 8 秒的数据库。当零碎呈现故障的时候,咱们只须要 8 秒就能够切换到一个衰弱的节点上。

其次,对于非核心业务或者一般业务来说,大部分业务更关注的是性价比、易用性、以及多种规格多种部署形式的灵活性。OceanBase 4.0 版本做了十分大的降级。咱们的数据库能跑在 4C8G 的树莓派上,也能够跑在 4C8G 的虚拟机里来撑持咱们的线上业务。为了晋升 OceanBase 的性价比,咱们还做了十分多的性能优化,大家能够看一下数据,咱们在业务写场景的性能晋升了 80%,在读写混合场景的性能晋升了 50%,更好地帮忙非核心业务晋升整体的性价比。

最初,对于翻新类业务,咱们心愿可能帮忙这些翻新业务聚焦在业务逻辑的凋谢上,帮忙他们把大部分的精力投入在产品力的翻新上。所以在 OceanBase 4.0 上针对翻新类业务开发了很多新个性。 翻新类业务通常会有两个特点,一是它非常灵活,二是它通常会对容量的弹性能力有十分强的诉求。 一个业务流动或一个营销流动的业务流量有 50 倍甚至 100 倍的晋升。OceanBase 4.0 上做了主动分区分列的性能,客户能够不必关怀上面存储的容量问题,联合 HTAP 以及超强的 SQL 剖析能力,业务只须要关注业务逻辑的开发,更加灵便的应用数据库基础设施。

  • 从业务部署模式来看,OceanBase 4.0 面向多种业务场景都有较大的能力晋升。

面对多样化的基础设施,有一类客户抉择部署在裸机上,这部分客户会对数据资产和数据安全性有十分高的诉求;还有一些客户部署在公有云和混合云里,对整个资源的利用率和对立的运维治理有十分高的诉求;除此之外,还有很多客户是部署在私有云上的,依据 Gartner 的统计,均匀一家云上的企业大略会用到三四朵云,这部分客户对多云有十分高的诉求。

在 OceanBase 4.0 外面咱们综合思考了这三类不同客户的场景,整合了产品能力。

首先,对于公有云和公有部署的客户,咱们提供了残缺的一致性部署、运维、应用的视图,在 OceanBase 产品以及 OceanBase 数据库外部都反对了平安加密、TDE,保证数据资产的平安。 咱们在 OceanBase 4.0 上对多租户的能力及 DBPaaS 能力做了晋升,帮忙客户更好地进行资源整合。在 OceanBase 4.0 上,多租户有一个十分重大的 feature 公布,以前只反对 CPU 的隔离,接下来反对了 IOPS 的强隔离。

其次,对于私有云和多云上的客户,咱们在 OceanBase 4.0 里动摇地反对了多云的策略, 咱们行将会公布在 AWS 上的 OceanBase 云服务,接下来也会公布腾讯云、华为云、Azure 等云厂商的反对。(点击:《尹博学:OceanBase Cloud 正式开服,助力寰球中小企业数智化降级》理解更多!)

  • OceanBase 面向全球化业务的反对能力

在全球化过程中,因为企业会遇到非常复杂的数据库和数据库基础设施的治理,咱们在 OceanBase 4.0 外面对产品体系的国际化进行了全面降级, 这个全面降级分两局部。

第一局部是整个产品能力的国际化降级。 整个 OceanBase 的全系列产品包含 OCP、ODC、OMS、OMA 所有的产品以及产品的相干文档进行了国际化,同时反对了多时区、多编码、多语言。为了更好地反对业务的国际化,OceanBase 也在和海内区域搭档对 OceanBase 的整套产品进行平安合规认证,帮忙客户更好地适应海内的监管需要。

第二局部是托管的云服务。 目前咱们在寰球的 11 个 Region 提供了和中国大陆一样的云服务,且不同地区提供的云服务能力是等同的,接下来 OceanBase 会在全世界的 4 朵云上,13 个 Region 公布近 40 个可用区,帮忙咱们的海内用户更好地应用海内的云根底资源。

  • 面向开发者和 DBA 能力晋升

面向开发者以及运维生态,OceanBase 4.0 的外围指标是要让咱们的搭档更简略地应用数据库。

首先,用户和开发者关注的是 SQL 的兼容性和整个数据库的可调试性,在 SQL 兼容性方面, 咱们在 4.0 上公布了 35 个重大 feature:

  1. OceanBase 4.0 反对 GIS JSON、反对超过 1TB LOB、且反对 DBlink 的写能力;
  1. 在 MySQL 模式下开始全面兼容 MySQL 8.0。业务在应用 MySQL 时遇到问题,能够很平滑地迁徙到 OceanBase 4.0 上;
  1. 在 ODC 上提供了更好的面向开发者的 Debug 工具,用户能够对他的 SQL、PLSQL 在 ODC 上进行调试,咱们反对 Intel 的芯片,也能够反对 ARM 的芯片。

其次,对于开发者以及开发者生态来说,会全面凋谢企业版 MySQL 的能力。 我认为最要害的也是蚂蚁最关注的能力——就是 Encoding 的能力,帮忙蚂蚁每年节俭了近 10 亿的老本,还有在 AP 和向量化上的加强。OceanBase 4.0 会提供更多凋谢产品的反对,可能帮忙客户或开源生态开箱即用——开箱即能够用到外围业务里,同时保障自主可控。

第三,面向凋谢的生态,咱们还在做更多事件。 比方正在和整个开源生态、软件生态做了很多适配和对接;面向运维人员和运维生态,也在对接更多的开发语言,这是一个十分挑战的事件。

最初,咱们在面向 DBA 等运维能力,在 4.0 也做了十分重大的改良。 咱们在 OceanBase 4.0 公布了 ASH 和实时 SQL 监控两个新的 feature,这两个 feature 能够帮忙零碎开发者和运维人员,很快地发现 SQL 运行问题,疾速发现解决问题。

在运维能力上,咱们公布了两个新能力—— 全链路追踪和数据库自治服务能力。

首先是可视化的全链路追踪能力。 能够把业务发的一条 SQL 在 OceanBase 的全生命周期执行,所有的信息都会被记录下来,从 SQL 解析到分布式存储,所有这些信息都会被可视化地记录下来,帮忙您发现零碎中的瓶颈。同时全链路追踪能力也能够和 SOA 下的分布式追踪能力整合到一起,一个 RPC 服务到底拜访了哪些数据库、拜访了哪些 SQL、拜访了哪些数据表,咱们有标记,能够把全链路的分布式追踪整合到一套体系里。

其次是数据库自治能力。 它源于蚂蚁团体的机器学习工程能力以及过来十年里 OceanBase 在服务和撑持业务的实践经验整合而成。这套零碎最外围的目标是帮忙运维人员能更简略地应用 OceanBase,它可能帮咱们主动解决告警、主动治理容量、主动做实时的应急。

给大家分享个例子,蚂蚁团体有数万个业务研发,但只有十几个 DBA。每天有近千次业务公布,所有的这些变动都可能会带来稳定性的问题,然而这十几个同学根本是不必做任何应急或故障解决策略的,咱们的自治零碎会帮忙他们实现这件事。明天也会把 OceanBase 这些运维的优良实际分享给业界的用户。

  • 凋谢的 OceanBase 数据库产品体系

OceanBase 的产品体系十分凋谢,咱们提供了丰盛的 API,能够帮忙大家把原来基于本人的数据库运维体系的产品和工具集成到 OceanBase 中,也能够把 OceanBase 现有的体系集成到已有零碎中。为了让 OceanBase 可能和生态更加靠近,咱们做了很多兼容性的适配:比方 OceanBase 开始反对 MySQL binlog 的日志格局,应用 MySQL 的业务能够很容易、很轻松地把 MySQL 的生态工具对接到 OceanBase。此外,咱们还反对了 HBase,TableAPI 的语义接口,客户能够把 HBase、MySQL、Oracle 整合到对立的一套 OceanBase 数据库外面,只运维一套数据库也能够服务十分多的业务。

咱们对 OceanBase 的文档也做了比拟大的降级。 一方面心愿用户通过咱们的文档把握应用 OceanBase 的所有常识,实现 Self-Service;另一方面是所有的文档都会逐渐变成交互式文档,帮忙大家在学习和实际中把握 OceanBase 的根底能力;咱们还会凋谢更多的企业级以及开源的产品,帮忙开源客户像应用商业化工具或商业化产品一样应用 OceanBase 开源版数据库。

我明天给大家分享的产品就到这里,谢谢大家!

正文完
 0