关于开放源代码:开源数据库这么香为什么我们还要下功夫自研

4次阅读

共计 2375 个字符,预计需要花费 6 分钟才能阅读完成。

摘要: 从开源到自研,数据库畛域的那些门门道道。

谈到数据库,必然谈判及开源。

但在很长的一段时间内,以关系型数据库为例,它始终是商业公司握在手中的专利,整个数据库市场被这些大公司所垄断瓜分,直到 90 年代 MySQL 第一个开源版本的呈现,才有了现在开源凋谢的数据库市场。

依据 DB-Engines 最新颁布的数据库受欢迎度排名,前 10 名中,仅开源数据库就占据了 7 席,具体包含关系型数据库 MySQL、Postgre SQL,非关系数据库 MangoDB、Redis、Elasticsearch 和 Cassandra。

也正是因为开源数据库如此广受欢迎,越来越多的商业公司也违心基于这些开源数据库做更深度的优化。

为什么要基于开源数据库自研?

尽管开源数据库没有昂扬的商业受权许可费用,但应用开源数据库却存在许多问题,尤其是在以数据撑持的互联网时代,人多势众不可能扛住各种意外情况。

不少开源数据库的易用性差、配套能力也较弱,须要一直地保护,而且一旦遇到数据失落问题,很难疾速复原,造成的损失不可估量。与此同时,开源数据库还得面临服务器、数据库保护降级、人力运维等各种大大小小的老本收入,很难满足业务的疾速扩张以及可继续倒退。

这种时候,不少云厂商就会做一些让 DBA 运维人员一劳永逸的工作,让开源数据库上云,包揽底层那些“琐碎”的运维工作。

以华为云 RDS 系列产品为例,RDS for MySQL、RDS for PostgreSQL 服务,以及 DDS 文档数据库服务(文档类型 Mongo),都是基于开源打造的数据库服务,聚焦最根底的云原生开发对云数据库的要求,次要面向数据规模较小,性能要求个别的业务场景,提供极致性价比的解决方案。

但问题随之而来,开源数据库上云只能解决中小企业的简化部署、运维、调优,极致性价比等诉求,却无奈满足金融、政企等对数据安全、响应速度、牢靠、可用有严苛要求的大型企业。

权衡利弊下,许多企业都会抉择开源数据库 + 商业数据库的组合模式,保证数据的可用牢靠。

GaussDB 系列就是联合华为积攒多年的数据库研发教训打造的新一代分布式数据库产品系列,立足自研翻新,基于对立的架构,一方面拥抱并兼容 MySQL、Mongo 等生态,另一方面打造 openGauss 生态,次要面向政企客户,强调高性能、高牢靠、高平安等方面诉求。

在关系型数据库方面,华为云往年 7 月正式公布上线了云原生 GaussDB(for MySQL)数据库。同时,基于华为凋谢生态的 openGauss 内核打造的分布式数据库 GaussDB(openGauss)也会在年内正式商用公布。

非关系型数据库方面,重点打造云原生 GaussDB NoSQL 多模数据库系列,反对文档类型(Mongo)、宽表类型 (Cassandra)、时序(Influx),K-V(Redis)等多协定接口。目前,GaussDB(for Mongo)、GaussDB(for Cassandra)、GaussDB(for Redis) 已上线。

相较于开源数据库,GaussDB 系列数据库反对 NDP(near data process)技术,能够让计算和数据进行交融,减速数据的解决,从而大幅晋升整体的性能。

以 GaussDB(for MySQL)为例,其基于华为最新一代 DFV 分布式存储,采纳计算存储拆散架构,反对 1 写 15 读的只读节点的极速扩大,最高反对 128TB 的海量存储,可实现超百万级 QPS 吞吐,单节点相比原生 MySQL 性能晋升 7 倍。

GaussDB NoSQL 则领有极强的多模数据管理能力,在并发读写能力、扩容伸缩、故障重构工夫、备份效率、复原效率等方面,相比纯开源软件能力有了质的飞跃。

最要害的是,华为 GaussDB 数据库全面反对蕴含鲲鹏和 x86 在内的多样化算力,具备从芯片到服务器、存储、操作系统、数据库的 E2E 研发能力,因而具备了数据库软硬性能调优的独特劣势,比方 GaussDB 数据库 DB 算子下推存储,进而实现性能较友商数据库晋升了 30%。

openGauss,打造新的开源数据库生态

一方面踊跃拥抱既有的开源数据库生态,华为云也在打造 openGauss 生态。

openGauss 是一款开源关系型数据库管理系统,采纳木兰宽松许可证 v2 发行,其内核源自 PostgreSQL,并着重在架构、事务、存储引擎、优化器等方向继续构建竞争力个性。在 ARM 架构的芯片上深度优化,并兼容 x86 架构。其技术特点如下:

基于多核架构的并发控制技术、NUMA-Aware 存储引擎、SQL-Bypass 智能选路执行技术,开释处理器多核扩大能力,实现两路鲲鹏 128 核场景 150 万 tpmC 性能;

反对 RTO<10S 的疾速故障倒换,全链路数据保护,满足平安及可靠性要求;

通过智能参数调优、慢 SQL 诊断、多维性能自监控、在线 SQL 工夫预测等能力,让运维由繁至简。

华为于 2020 年 6 月凋谢了 openGauss 社区版本源代码(https://opengauss.org),激励有能力的合作伙伴推出基于 openGauss 的数据库,独特凋敝数据库产业生态。

目前,华为云曾经推出了基于 openGauss 内核,加强分布式能力的商业版本 GaussDB(openGuass),后续也会有更多商业合作伙伴退出。

须要强调的是,openGauss 是凋谢的生态:架构凋谢、代码凋谢、技术凋谢和社区凋谢,不会因为是华为主推的,就让数据库生态从关闭的 Oracle 走向另外一个关闭的“新的 Oracle”。openGauss 这种形式,能让更多“同道中人”一起来解决缺点,了解这个架构,从而保护起来更加不便。

对于企业来讲,只有抉择凋谢的生态,能力让本人的业务具备更好的连续性,如果从一个关闭的生态革新为另外一个关闭的生态,实质上并没有解决业务连续性的问题。

毕竟不凋谢的生态是没有生机的,数据库软件尤甚。

点击关注,第一工夫理解华为云陈腐技术~

正文完
 0