关于数据库:OceanBase-CTO杨传辉单机分布式一体化助力企业降本增效

11次阅读

共计 5844 个字符,预计需要花费 15 分钟才能阅读完成。

11 月 3 日,2022 云栖大会在杭州揭幕,在本届云栖大会上,OceanBase CTO 杨传辉发表了《单机分布式一体化助力企业降本增效》的主题演讲,正式公布了 OceanBase 社区版 4.0(代号:小鱼),并开启了 OceanBase Cloud 4.0 版本的邀测。

 

 


以下为演讲实录:

 

各位来宾、各位蚂蚁团体和 OceanBase 的客户,大家下午好!我是杨传辉,来自 OceanBase,明天我给大家分享的主题叫做 《单机分布式一体化助力企业降本增效》

在 8 月 10 日 OceanBase 的年度产品发布会上,咱们颁布了最新的单机分布式一体化架构 OceanBase 4.0,其对于客户来讲最重要的外围价值就是降本增效,帮忙每一个客户更好地开掘数据的价值,明天我的演讲将围绕此进行开展。

 

经济承压,企业在关怀什么?

 

国际货币基金组织的一份数据表明:2022 年寰球经济增速曾经降落到 3.2%,可能大家对这个数字不肯定有感觉,借用最近很风行的一句话叫“让寒意传递到每一个人”,置信大家就明确了。无论身处哪个行业,大家或多或少都感觉到了一些寒意。在明天这样一个经济承压的大背景下,不同行业的客户到底在关怀什么样的问题?我给大家简略举几个例子。

首先,给大家分享一下 OceanBase 在不同行业的客户案例。

云南红塔银行: 原来应用的是 IBM 的小型机、高端存储,是十分经典的集中式数据库。应用集中式数据库面临着很多问题:硬件老本昂扬、集中式数据库解决能力十分无限等,而通过降级到 OceanBase 的分布式核心技术最终使得整个红塔银行的和零碎整体老本升高了 90%,解决能力也由原来每秒钟 200TPS 晋升到每秒钟 8000TPS,并且具备了两地三核心无损容灾能力。

中石化加油卡: 原来其应用集中式数据库的架构,即每一个省份都有本人独立的 IT 零碎和数据库,所以带来了运维简单、零碎危险等很多问题,没有方法满足业务管制危险和疾速倒退的需要。通过降级到 OceanBase 分布式数据库,实现了资源利用率的大幅度晋升,零碎也实现了整个业务的全国大集中,最终咱们做到 HTAP 混合负载并发解决能力达到每分钟 5 万笔。

致欧家居: 一家跨境电商企业,原来应用的是扩散的开源数据库 MySQL,其治理运维比较复杂,客户研发效率比拟低,通过 OceanBase Cloud 最终大幅度晋升了研发效率和运维效率,使致欧家居的客户能够把更多精力放在业务翻新上,大幅度晋升了业务迭代效率。

GCash: 这是菲律宾版的在线钱包,原来也是应用扩散的 MySQL 数据库,通过 OceanBase Cloud 的分布式数据库托管服务,最终使得资源利用率大幅度晋升,存储空间降落 70%,资源老本升高 40%,这正是 OceanBase 具备向多租户极致压缩等做数据交融、做数据极限压缩的能力。

 

“降本”解决生存问题,“增效”解决倒退问题

 

咱们看到国内外不同行业的客户,在这样一个寰球经济承压的局势下,总是偏向于做两件事件:降本、增效。 通过“降本”解决生存问题,“增效”解决倒退问题。

大家都晓得,寰球经济是一个螺旋式回升的过程,有低谷也有顶峰,有一些卓越的公司借“低谷”契机,实现了更快的倒退速度,成为了行业的领导者,但另外一些一般的公司通过经济低谷当前增长就失速了。他们最大的差异在于卓越公司在经济低谷的时候除了通过降本增效解决生存问题,还会做更多面向未来晋升效率的事件,会把更多资源投入到将来的人才和业务布局上。

再说回咱们的 OceanBase 4.0,咱们称其为单机分布式一体化架构,一方面它具备单机数据库高性能、低成本的劣势,这个劣势能够帮忙客户降低成本;另外一方面具备分布式数据库高可用、可扩大、面向云,面向未来的劣势,帮忙客户更好地开掘数据价值,也就是说,通过 OceanBase 4.0 能够同时帮忙客户降本增效,博得将来。

 

▋85 天,4.0 经验了什么

 

间隔 8 月 10 日 OceanBase 年度产品发布会到当初正好 85 天工夫,OceanBase 的研发团队做了几件事。

首先,研发版本的疾速迭代。 上次的产品发布会咱们公布的是 Alpha 版本,明天咱们公布的是 Beta 版本。OceanBase 有一个十分弱小的劣势,即背靠蚂蚁团体的外围业务场景,每当 OceanBase 有一些重大技术创新的时候,咱们总是可能在蚂蚁团体外围业务场景中找到试验场景,从而打磨 OceanBase 的稳定性。OceanBase Alpha 版本实现当前,在团体和不同行业用户进行了小范畴邀测,通过实在的业务场景来打磨 OceanBase 的稳定性。

所以明天咱们看到的 4.0 版本,也变更了研发模式,最终咱们做到了将社区版与企业版交融成一个骨干代码的研发分支,通过这种模式可能实现企业版做的每一个性能都可能实时融入到社区版本,做到 MySQL 兼容能力全面凋谢,包含企业版所有的能力,最终做到社区版与企业版等同性能。

 

▋由社区驱动的开源,能力一直冲破

 

去年 6 月 1 日,OceanBase 首次对外发表开源,到明天一年多的工夫,OceanBase 在社区和用户的驱动下失去了飞速发展,整个 OceanBase 的外围能力也失去了十分大的冲破。

OceanBase 的开源次要经验了三个阶段:

 

 

第一,外围引擎凋谢阶段。 外围内核引擎的 300 万行代码齐全对外开放开源,这个阶段只有一个内核引擎,没有残缺的生态工具的反对。

第二,生态建设阶段。 基于第一批开源用户和他们的实在需要不断完善咱们的生态工具,反对超过 20 个生态工具,反对 8 个支流 Linux12 个版本、反对 K8s-operator、反对监控 Prometheus、反对数据同步工具 Canal 和 DataX 以及客户端工具 Navicat / Dbeaver。

第三,易用性改良阶段。 这个阶段曾经有少部分开源用户把其外围业务场景放在 OceanBase 的开源版,此时咱们的外围指标就是从“能用”到“更好用”,所以在易用性上怎么做监控、怎么做运维、怎么做数据同步链路可视化等等成了咱们亟待解决的问题,咱们做了很大易用性的晋升,最终使越来越多的用户把 OceanBase 的开源版本用在外围业务场景。

我置信基于最新的 4.0 单机一体化架构,能够使 OceanBase 社区版成为每一个客户数据库开源的首选。

 

OceanBase 社区版 4.0 正式公布

 

明天咱们正式公布 OceanBase 社区版 4.0:寰球首个兼容 MySQL 的单机分布式一体化数据库,兼具单机数据库高性能、低成本,与分布式数据库高可用、可扩大、弹性双重技术劣势。同时,咱们也将 OceanBase 十几年来在蚂蚁团体“双 11”、TPC-H 寰球前三、TPC-C 寰球第一等外围业务场景中的技术创新能力融入到了最新的 OceanBase 社区版 4.0,既可能反对大企业,也可能反对中小企业,甚至是初创企业,“从小到大”一站式满足客户全生命周期的数据管理和存储需要。

 

 

OceanBase 社区版 4.0 代号“小鱼”,我认为其对于行业最大的奉献在于极大升高了分布式数据库的门槛。 以前很多人认为分布式数据库有很高的门槛,对硬件要求比拟高,运维比较复杂,社区版 4.0 进去当前这个行业产生了扭转。

 

▋4C16G 可在生产环境稳固运行

 

目前,很多用户曾经认可了分布式数据库的价值,但仍旧也有一些具体的需要,比方心愿可能升高分布式数据库的部署门槛;晋升分布式数据库的易用性;心愿分布式数据库既能做好 OLTP 交易,也可能做好 OLAP 剖析。

此次公布的社区版 4.0,通过单机一体化架构、单机部署、小规格部署升高分布式数据库的部署老本,通过一键装置部署晋升分布式数据库的易用性,通过 HTAP 和更强的 OLAP 能力晋升分布式数据库的剖析能力,最终实现 OceanBase 社区版 4.0 在 4C 16G 的生产零碎可能稳固运行。

 

▋从 5 步到 1 步,2 分钟疾速部署

 

咱们由原来须要 5 步手动装置部署,优化为一步,两分钟能够实现 Demo 体验。在蚂蚁团体展区的 OceanBase 展台有体验环节,其在装置部署的后面放了一个计时器,我昨天试了一下,2 分钟之内即可实现。与此同时,咱们还将 TPC-H 寰球前三的能力融入到了最新的 OceanBase 社区版 4.0 中。

 

OceanBase 社区版 4.0 AP 性能压测

 

在 8 月 10 日 OceanBase 的年度产品发布会上,咱们比照了 OceanBase 和 MySQL 的性能,过后应用的是 MySQL 企业版 8.0 与 OceanBase 的企业版 4.0,在等同硬件条件下,OceanBase 企业版 4.0 的性能是 MySQL 企业版 8.0 的 1.9 倍,明天,咱们做了另外一个事件,将企业版与社区版交融到一个分支,做到企业版与社区版完全相同的性能,最终做到 OceanBase 4.0 社区版本性能达到 MySQL 企业版版本性能 1.9 倍。

对于一个数据库来说,既能用 OLTP 做交易,也能用 OLAP 做剖析,这是一件很棒的事。明天我非常高兴在这里和大家一起见证 OceanBase 社区版 4.0 的 TPC-H 性能。

咱们曾经在云端别离部署了 OceanBase 社区版 4.0 和 Greenplum 6.22.1 两个数据库,采纳截然不同的硬件配置,都是三台机器,每台机器 32C 128G,别离对这两个数据库进行跑分测试。

 

 

如上图所示,右边屏幕是压测的画面,有两个数据库,接下来咱们将同时启动两个测试脚本,一个是 OceanBase 社区版 4.0 的测试脚本,一个是 Greenplum 6.22.1 的版本,咱们在左边做了一个实时画面,同时做了一个工具每秒钟实时读取左侧画面的压测数据,并在左边转化为实时画面。左边这个画面中是一系列的柱状图,柱子有两种色彩:蓝色示意 OceanBase 社区版 4.0,橙色示意 Greenplum 6.22.1,这个柱子长短示意压测的工夫,总共 22 条查问,柱子越长跑的越快,能够看到 OceanBase 跑的速度比拟快。第一个查问 OceanBase 跑的 2.29 秒,Greenplum 跑的 22.47 秒;第一个查问在 TPC-H 是单张表格做聚合的查问,次要考查的是数据库的并行执行能力,OceanBase 在并行执行上,尤其是分区内做并行执行有显著劣势。Greenplum 跑到第 9 条,有一些跑得更快一些,一些跑得更慢一些。

测试表明,等同硬件的环境之下,OceanBase 社区版 4.0 版本的性能是 Greenplum6.22 的 5-6 倍,局部性能场景性能达到 20-60 倍,侧面表明了 OceanBase 社区版 4.0 具备弱小的 OLAP 解决能力,是一个同时可能解决 OLTP 与 OLAP 的 HTAP 数据库。

在测试序幕,我给大家分享一下 OceanBase 在 HTAP 的一些利用场景。以前数据库个别分为 OLTP 数据库和 OLAP 数据库,通过 ETL 工具实时或定期把 OLTP 的数据库拉取到 OLAP 的数据库中, 这种模式带来两个问题:第一,数据可能有提早。第二,OLAP 与 OLTP 数据库之间数据不统一, 有了 HTAP 数据库当前,能够在一个数据引擎里实现 TP 和 AP 的混合负载,最终防止了数据提早和数据一致性的问题。

这个数据库有什么样的益处?我给大家举几个例子。

最近正好是“双 11”,当买家实现一笔交易或一笔付款操作的时候,商家心愿依据你的付款操作实时调整营销策略。如果是以前 OLTP 和 OLAP 拆散的模式必定做不到,因为会有提早,有了 HTAP 数据库之后,可能实现在“双 11”当天实时依据交易领取的状况调整最优的营销策略。

大家晓得 DBA 常常保护在线库和历史库,在线库次要是一些并发量比拟高的数据,算是一个 OLTP 数据库,历史库是一个并发量很低,然而数据量很大、查问很简单的数据库,它是一个 OLAP 的数据库。此时,DBA 常常须要干一个事件:把在线库数据定期拉到历史库,并且删除在线库数据,这个操作非常复杂, 有了 HTAP 数据库,能够防止这样的一些操作,大大降低业务的复杂度。

 

 

最初,OceanBase 社区版 4.0 还有一个专属特色叫“从小到大”:既能反对大企业,也可能反对中小企业,甚至是初创企业,可能从小到大反对一个企业全生命周期的数据库需要,帮忙企业更好地降本增效以及做数据库的业务翻新。 既可能反对分布式多机场景,也可能反对利用在单机场景,既能用在一些比拟大规格、高配置的机器,也可能用在低配置的机器,既能用在关系型数据模型,也可能用在多模模型,既可能解决 OLTP 外围业务场景,也可能用来解决 OLAP 实时剖析场景。

 

OceanBase Cloud 正式凋谢 4.0 邀测

 

上面进入到明天的第二个公布环节,OceanBase 是一个面向多云设计的一体化架构数据库,既反对专有云部署也反对私有云部署,反对混合云部署、多云部署,而且能够做到在不同云的模式下,OceanBase 对用户提供的是完全一致的体验。

原来 OceanBase 曾经有私有云的托管服务,然而最多可能反对到私有云 3.2 的版本,明天咱们全托管的 OceanBase Cloud 正式凋谢 4.0 的邀测:规格更小,部署老本更低、降本增效能力更好、可观测性更强,大家能够进入官网退出到 OceanBase Cloud 4.0 版本邀测体验过程当中。

OceanBase Cloud 4.0 版本通过单机分布式一体化架构助力云上客户实现降本增效,其反对更小的规格,曾经可能反对到 4C 16G 这样从小到大的全倒退过程,从 4C 16G 到 8C 32G,到 16C 64G,再到 42C 400G,乃至多机分布式部署,OceanBase Cloud 4.0 有更好的降本增效的能力,TP 性能相比之前的版本晋升 50%,AP 性能也失去大幅度晋升,并且有更好的多租户隔离能力。

OceanBase Cloud 4.0 版本具备更强的可观测性,反对了几个性能,包含全链路诊断的能力、数据迁徙的可观测性,最终实现了对于每一个 DBA 来说更加好的运维体验。

 

 

咱们始终认为,对于一个数据库来说,降低成本只是第一步,OceanBase Cloud 4.0 版本不仅仅是降老本,更是在地面换上面向未来的数据发动机,这是其外围意义。 不仅仅可能用来做适宜分布式场景的大型用户,也可能用来做适宜单机场景的中小规模用户,甚至是初创企业。通过 4.0 版本的技术创新,包含小型化、小规格部署能力,更强的降本增效能力,社区版和企业版的交融,社区版能力的加强、易用性晋升、可观测性的晋升,最终实现“小就是大”——一个企业从小到大倒退的过程当中,可能实现一次抉择,一生受用。在这个倒退过程当中,OceanBase 也可能在前方做好服务,保障稳固牢靠,使企业可能更释怀、更平安地享受到数据处理的价值。

正文完
 0