关于数据库:国产数据库未来将如何发展

45次阅读

共计 6444 个字符,预计需要花费 17 分钟才能阅读完成。

当下,国产数据库的倒退之路从摸索逐步到百花齐放,在愈演愈烈的局势下,国产数据库代替之路再次置于风口,到底国产化之路倒退如何?

《对话 ACE》首期流动便以当下数据库局势为背景,邀请到 OceanBase CTO 杨传辉,Oracle MySQL ACE Director、万里数据库开源生态负责人叶金荣,独特摸索“国产数据库代替与倒退之路”,以此推动国产数据库技术、人才及生态建设的倒退。

国产数据库将来将如何倒退?
直播干货满满没工夫看视频没关系!小编对直播的内容也进行了汇总分享,欢送大家浏览、珍藏!

Q:在海内,分布式数据库是否有利用场景?主攻方向是怎么的?

A:杨传辉:大家认为分布式数据库到底是一个高铁,还是一个电动车?假如经典的数据库是一个燃油车,那么我听到两种观点。一种观点,分布式数据库次要利用在一些规模比拟大的客户,因为中国人数较多,那我就须要高铁。那如果人口比拟少,比如说很多欧洲国家,是不是就不须要分布式数据库?另外一个观点,认为分布式是一个电动车。对于 OceanBase 来说,咱们是认同第二种观点的。

明天的分布式数据库,它跟集中式数据库,其实有点像电动车跟燃油车的关系。十几年前 OceanBase 就开始自研打造分布式数据库。晚期其实是搭建了一套分布式架构,能够比喻成先把电动车的引擎做好了,然而它的外壳装璜都还是有待欠缺的。起初,OceanBase 缓缓过渡到 1.x、2.x、3.x 等版本,逐渐具备了相似整车的性能,曾经可能利用在像工行、建行等数据体量特地大的一些企业。再之后,OceanBase 研发的分布式数据库技术越来越像是特斯拉研制的 Model 3,性价比很高,同时能够利用在经典数据库适宜的中小企业,例如一些单机场景。

OceanBase 的设计理念是一体化的原生分布式数据库,心愿一方面能有分布式的可扩大,高可用的能力;另一方面,具备对标集中式数据库的单机性能和性能。在小规模场景下,单机性能和集中式数据库根本相当。即使是中小企业,同样也心愿可能疾速倒退,将来甚至成为大企业。只有企业有疾速倒退的诉求,他就能够抉择 OceanBase 这样的原生分布式数据库。

原理很简略,分布式数据库能够解决企业将来几年的疾速倒退的需要。而且在单机模式下,新技术能做到比 MySQL Oracle 更低成本的,性价比更高。这样实现了一个真正的便当,好比实现高铁的技术,但老本比汽车还要低。

Q:分布式架构如何实现在单机上应用,且性价比很高?

A:杨传辉:明天支流的一些分布式数据库,以前是 NoSQL,缓缓到 NewSQL,这些产品的性能和性能往往离集中式数据库有很大的差距。例如,很多 NoSQL/NewSQL 零碎的单机性能不到 MySQL 的二分之一甚至三分之一。这就使得很多人把分布式与集中式对抗起来。然而,OceanBase 保持一体化的技术理念,谋求单机性能和性能兼容性。OceanBase 从 3.X 版本开始,单机跑 Sysbench TPCC 这样的 workload,性能和 MySQL 5.7 版本是根本相当的。而且用了在线压缩当前,存储老本大幅低于 MySQL。

OceanBase 明天利用在蚂蚁团体的所有业务场景中,最终的存储老本只有 MySQL Oracle 的三分之一左右。同时,咱们也心愿将这些技术利用到中小企业中去。OceanBase 自身就是一个自研的分布式数据库,只有保持将单机性能性能做到最好,它能力变成是一个电动车,才会有越来越多的用户去应用,像以前的 MySQL.Oracle 一样,实现让百万级用户去应用,最终变成所有人都可能简略应用的通用数据库。

所以从这个角度来看,一是说不必把分布式跟集中式齐全对抗起来对待。另外,中国有一个劣势在于人多,像双十一这样的流动,可能把高并发、可扩大等一些底层的技术打磨成熟。在这些能力上,尤其在海量数据处理的能力上,中国还是比拟当先的。海内也会有和国内相似的业务场景,这类场景同样会抉择中国最优良的分布式数据库。实质上还是产品和技术做的如何,通用的技术没有国界。

Q:OceanBase 的海内业务目前停顿如何?

A:杨传辉:海内目前处于一个摸索的阶段。OceanBase 因为十几年的技术积攒,稳固撑持双十一,再加上背靠团体,所以在海内有一些劣势。例如,东南亚很多国家都有相似支付宝的钱包利用,这些钱包背地的外围零碎背地都采纳了 OceanBase。包含印度版的支付宝 Paytm,底层的交易、领取、账务等业务都是 OceanBase 在撑持的。除了东南亚之外,咱们也通过云平台,逐步笼罩其它国家的一些客户。

Q:作为一个数据库研发从业者,如何看 Oracle 暂停俄罗斯业务?

A:杨传辉:这个事件,从数据库的角度来讲,他肯定会更快的减速咱们国家自研数据库的一个倒退,OceanBase 在 2021 年的 6 月 1 号,把大略 300 万行的外围代码齐全开源。截至目前,咱们开源社区的沉闷水平已达到国内顶级开源我的项目的三年左右的程度。当然,将来还有很大的晋升空间。

从技术趋势的角度来看,这件事件没有那么乐观,为什么?以前的时候大家都感觉 Oracle 很完满,OceanBase 在设计之初,很多方向也借鉴了 Oracle 的做法。然而,任何一个产品都有它的生命周期。如果不减速改革,是没有方法适应大环境的变动,也无奈反对好客户需要。在海内,除了 Oracle,还有很多数据库的抉择,比方 MongoDB,Elastic Search,Snowflake 等等。

当初数据库曾经到了云原生、分布式转型的一个工夫窗口,所以从技术趋势角度来看,OceanBase 保持做下一代云原生分布式的方向。它是可能代表将来的。越来越多的用户缓缓会降级到在云上的原生分布式数据库。所以说,大趋势上没有那么乐观。

另外,咱们在一些要害行业,例如运营商、保险、人社等行业,曾经实现了由 Oracle 到分布式数据库的胜利替换。通过 OceanBase 的 Oracle 兼容模式和配套的平滑迁徙工具,可能做到不改业务代码将 Oracle 迁徙到一体化架构的 OceanBase 上。

国产数据库曾经迎来很好的机会,这个事件对数据库从业者和技术爱好者来讲,肯定要把数据库根底打牢。十几年前 OceanBase 在做数据库的时候,会有一种孤单的感觉。但当初越来越多的人涌入到这个行业,资本市场也越来越关注根底软件的倒退,这个行业将来肯定会很好。所以要保持,放弃初心。

Q:国内大部分数据库厂商的产品都是基于开源产品做的二次革新,你怎么看?

A:杨传辉:无论基于开源二次革新还是齐全自研,最终的指标都是解决用户需要。我感觉实质上是一个技术抉择,基于开源的益处在于后期会比拟快一点,然而前面会越来越难。因为越到前面,会遇到越多深刻的需要,须要大范畴批改内核,基于开源比拟难做到彻底掌控内核。

OceanBase 走的是齐全自研的技术路线,打个比方,OceanBase 有点像在练九阳神功。会有两个益处。第一个是如果练成了,必定是一个武林高手。第二个益处在于学会了九阳神功,再去学其余的文治都会比拟快。通过自研可能彻底掌控内核,当面对客户新需要或新变动的时候,都能十分快地去满足客户的需要。而且客户所有的外围业务场景 OceanBase 都能够承接住,这个是做自研最大的益处。

二次开发的话,取决于开发的深度。如果只是简略开发的话,只具备开源产品已有的能力,但获取额定能力是很难的。很多时候须要业务做革新来适应开源产品。这是两类的差异。

Q:如果想成为新一代风行的数据库,以后国内的数据库技术还应做哪些改良?将来国产数据库要成为国内企业数字化建设的首选须要具备哪些指标和个性?

A:杨传辉:首先数据库最终还是用进去的,利用是数据库研发的第一推动力。通过利用的需要到数据库能力晋升,再反馈给利用,这样的一个循环,能力成就一款成熟的数据库产品。

面对企业级用户,首先数据库产品是否进入到外围零碎内,如果不能实现,那前面被代替的可能性就会很大。基于这样的假如,咱们总结过企业级数据库大略会有哪些要害的需要:高可用、可扩大、强兼容、易治理。同样数据库产品本身的性能、性能、稳定性也很重要。

还有一个点就是是否有要害业务场景的实战经验,这个也很重要。OceanBase 最大的劣势在于通过了蚂蚁团体多年双十一外围业务场景的打磨,锤炼了 OceanBase 的并发性能、稳定性、提早等核心技术能力。明天再研发一个新的 OLTP 数据库是比拟难的,因为首先须要有相似蚂蚁这样的业务违心交给你撑持它的外围零碎。

Q:将来国产数据库厂商之间应该如何竞争与合作,能力促成行业更好更快的倒退?

A:杨传辉:明天从技术路线角度来讲,我会比拟保持原生分布式的技术路线。

首先,以前走集中式技术路线,比方 Oracle,db2。花了很多年,通过线下客户一直打磨进去,到明天曾经很成熟。但对于分布式技术路线,国产数据库当初有一个换道超车的机会。

第二,须要更加聚焦。明天数据库翻新十分多,有一些是做根底性能性能的优化。比如说简单查问等等,还有一些新技术,比如说软硬联合,平安隐衷,面向 AI 的自治数据库,多模数据库等等。咱们应该将最次要的精力聚焦在根底性能和性能的晋升上,解决用户的实在需要。数据库最难的,并不是如何用新技术,或者如何做技术创新,而是基本功。

OceanBase 性能也是一样的,目前能做到跟这个 Oracle、MySQL 相当。然而很多场景尤其是简单查问,还须要很多工夫去优化。所以须要更加聚焦,把更多的精力放到如何把引擎做到最好。

第三,国产数据库须要更多的去兼容规范。比如说 OceanBase 兼容 MySQL,兼容 Oracle,通过标准化升高数据库的迁徙老本。

OceanBase 也始终在跟行业协会在做适配核心和实验室。国产数据库必须退出到一些组织,让技术更加标准化。而后牵动产学研,推动整个数据库产业的倒退。

Q:国产数据库在代替商业数据库过程中, 次要会遇到哪些问题?

A:叶金荣:首先是让更多用户能认知和应用国产数据库,能让更多场景利用到。不论是分布式,还是集中式都能够,得先把第一批的种子用户拿下,想尽一切办法去拿下。一个新的根底软件,不论是开源还是非开源的,第一批种子用户都十分重要,要把他们服务好。有了第一批用户积攒的口碑和案例,大家能力有根底信赖。

第二个就是业内同行的认可,须要持续保持一个良好的品牌形象,同行的口碑流传也是十分重要的。

当遇到一些问题或场景的时候,要可能疾速响应,这样能力让用户认为这个产品(或者说做这个产品的团队)是靠谱的。遇到问题时,还能借助社区的力量帮忙解决,相干的配套生态等方面都是短缺的,那就能够释怀地去应用,去尝试。

替换是大势所趋,要尽早布局。如果不做的话,未来迟早有一天是要出事的。另外肯定要找国内自主可控稳固的数据库产品。

Q:过来国产数据库代替的过程中还有很多人会有所放心和顾虑?将来如何更好地解决?

A:叶金荣:这个放心必定是存在的,也是必不可少的。咱们要做的就是如何帮忙他们去想方法,如何真正无缝降级。咱们能够跟着客户一起,把他们面临的问题,一起解决,让他们晓得咱们是站在同一条阵线的,能一起做事件。

另外还有一些须要思考的问题。首先是稳定性,接下来是兼容性,比方要降级整个数据库。那兼容性方面做得如何?有没有足够的测试案例?如果说测试不够欠缺的话,还有一些其余的形式能帮忙去提前找进去可能潜在的一些危险。

如果说有一些足够的配套形式办法,或者说配套的生态工具等,能帮忙他们。比方把线上所有的业务场景花肯定的工夫全副跑一遍。再新的数据库再去跑一遍,也能展现进去这个新数据库是靠谱的。不论性能、性能还是稳定性等方面。只有解决了这个问题,置信前面再去替换,可能只是工夫的问题。

Q:如何对待 Oracle 暂停俄罗斯业务这件事件?这会对国内数据库行业乃至寰球带来什么样的影响与启发?

A:叶金荣:凡事都有两面性,或者这个事件短期内会有一些影响,但长期来看,能够借这个机会更好地倒退根底软件。不论是操作系统,硬件还是数据库,都是一个十分好的契机,所以须要大家更好的反对国产的数据库。

线上答疑解惑环节

Q:MySQL 也归属 Oracle,在将来,基于 MySQL 协定的国产数据库产品是否存在法律上的危险?

A:叶金荣:尽管 MySQL 归属 Oracle,但它也是在 GPL 协定框架内的,只有咱们做的事件也是在 GPL 协定这个框架内,我感觉这块就没有法律的危险,或者说这个危险就很低了。

因为自身只有是遵循 GPL 协定,你的根底代码是开源的。那我置信只有在这个框架内,做什么事件,都是合规的,法律上的危险大家是不必放心的。

Q:OceanBase 将来在 HTAP 倒退上如何发展工作?

A:杨传辉:我对 HTAP 的定义,认为它是蕴含两个方面。第一个方面是 TP 能力的加强。很多的产品,它的 TP 能力往往可能只有一些简略的查问,然而一个商业数据库产品除了简略性能,还会有很多简单的查问,简单的 SQL,它也能跑得很好。优化器、并行执行这些能力都是很强的。这是一个 TP 能力的加强。另外一个方面是偏实时的 AP 能力。因为随着 TP 数据库具备分布式架构解决大数据量的能力,那当前会逐渐往 AP 畛域浸透,尤其是实时 AP 畛域。绝大部分实时剖析的场景,既有实时剖析的需要,同时也有一部分实时事务处理的需要。

OceanBase 始终保持在做 HTAP 的路线上,外围还是一个原生的分布式架构,可能反对大的数据量。既能做 TP 也能做 AP,那么当前的空间会越来越大。

Q:国产的是否有轻量级数据库,可能跟 MySQL 一样?目前接触下来的都是分布式重型的。理论场景用不到?

A:杨传辉:OceanBase 其实是一个一体化的分布式数据库产品。尽管也没有齐全做到跟 MySQL 一样轻量,然而会逐渐的去趋近它。明天 OceanBase 最新的一些产品,其实在单机的性能上,比方 32G 甚至 16G 左右内存的一个场景。跟 MySQL 的性能是差不多的。比 MySQL 5.6 还要好一些,跟 5.7 差不多。咱们也在逐渐轻量化,在之后 8G 的内存环境,甚至有可能 4G 的内存环境下,做到和 MySQL 差不多。这样才是一个现实的、同时具备分布式扩展性与集中式的轻量化的一体化产品。

Q 数据库内核开发的学习门路是什么?

A:杨传辉:咱们在招内核研发的时候。次要看技术的根底和对技术的激情。绝大部分公司和高校,都很难有一个实际的环境去造就能写内核代码并有教训的人。所以咱们更多时候看重的是后劲。

后劲的话,一个是说计算机的基础知识,比如说数据结构,算法,操作系统,数据库原理,这些专业课程是否都可能把握得很好。另一个是是否特地有激情做这个事件。包含我和叶老师,都保持十几年做这个畛域,十几年, 如果没有肯定的激情,到前面有很多让你放弃的时候,很难保持的下来。所以,激情很多时候甚至比能力更重要。

当然了,当初有些速成的办法,参加到开源我的项目外面,尤其是国内的一些开源我的项目,你能够近距离地和这个我的项目的作者间接去交换,把学到的理论知识变成能力,这也是一个十分好的方法。

Q:除了金融、电信、政企外,还有哪些目前没有在将来可能成为潜在大客户的行业?

A:杨传辉:比如说互联网行业,包含 OceanBase 就是在互联网场景外面诞生的。双十一的抢购,高铁抢票的场景,对数据库的要求都很高。还有包含制造业,比如说芯片,台积电,中芯国内等这样的企业,很多中央都要用到数据库。能够把数据库了解为工业母机,每个行业的重要客户都是强依赖于数据库的解决能力。不会仅限于金融、电信、政企。

叶金荣:咱们的生产生存中无处不在都存储着数据,每个都是数据库可施展的场景。比方物流机器人,电力,水力等。数据库作为一个根底软件曾经渗透到国计民生当中。

《对话 ACE》第一期通过两位老师对热点趋势、核心技术等的探讨与摸索,可能帮忙更多的企业技术从业人员,晋升企业国内从业人员对国产数据库的理解,升高国产软件倒退的门槛,减速国产软件后退的过程。

将来 OceanBase 将继续发展不同主题的《对话 ACE》流动,敬请关注!

正文完
 0