关于数据库:专访阿里云王伟民一站式全链路阿里云向云原生数据库20跃迁

1次阅读

共计 4454 个字符,预计需要花费 12 分钟才能阅读完成。

简介:阿里云间断第二年进入 Gartner《寰球云数据库魔力象限》领导者象限,意味着国产数据库正在迅速崛起。

数据库与操作系统、中间件并称为根底软件,“核高基”中的“基”指的就是这三类根底软件产品,它们在软件产业中有无足轻重的作用。很长时间以来,数据库始终是甲骨文、IBM、微软等国内厂商的天下,国产数据库始终处于市场边缘。不过,这所有正在悄悄产生扭转。在迈向大数据时代的明天,受害于中国经济的蓬勃发展和云计算等技术红利,市场格局正在轻轻变动,国产数据库从市场边缘逐步走上舞台地方,成为一股不可漠视的新兴力量。

不久前,Gartner 公布了 2021 年《寰球云数据库魔力象限》,阿里云间断第二年被评为领导者。去年,阿里云首次挺进领导者象限,这也是中国数据库 40 多年来首次跻身寰球顶级数据库行列。此番再次入选,代表阿里云数据库综合实力已稳居寰球第一营垒。除了阿里云,往年入选的中国企业还有位列“Niche Players”象限的华为云,2021 年入选 Gartner 魔力象限共有 20 家数据库厂商,中国占据两席,表明中国数据库厂商整体实力有了很大晋升。

01 因云而生的云原生数据库

为了跻身寰球数据库第一营垒,中国数据库行业为之致力了 40 多年,一路走来实属不易。这期间先后涌现了包含人大金仓、南大通用、达梦、神州通用等优良的国产数据库厂商,国家也先后推出了不少搀扶政策和打算,包含“核高基”专项等,但国产数据库始终被 Oracle、DB2、SQL Server 等传统商业数据库压抑,始终游离在支流市场之外。究其原因,国外数据库厂商起步早,产品成熟稳固、用户信赖,更为重要的是它们曾经建设了欠缺的生态,建立了很高的市场门槛。作为追赶者,国产数据库始终在追随,而外围技术创新有余,迟迟无奈获得冲破。

这所有随着云时代的到来呈现了转折,挪动化、物联网的遍及使得数据出现爆炸性增长,对数据存储和计算剖析的能力要求不断加强,衍生了企业对数据库的诸多新需要,诸如 TB 级乃至 PB 级的数据规模、更高并发、灵便按需扩大等对传统数据库提出了重大挑战。特地是,随着技术的提高,IT 架构从传统物理机向云架构转换,企业上云趋势让越来越多的企业将利用向云转移,利用数据上云天然须要云上的数据库,给新一代数据库带来了新的机会和挑战。云原生数据库就此应运而生,阿里云 PolarDB 便是其中之一。

与传统数据库相比,云原生数据库能更充分利用云计算的后劲。“从传统数据库到云原生数据库,最大的技术改革是资源池化与资源解耦,以及由此而带来的弹性、高可用、容器化部署、智能化运维等外围能力。”阿里云数据库产品事业部负责人、达摩院首席数据库科学家李飞飞曾多次对外表白这样的观点。

实际上,阿里云数据库就充沛了利用云技术的红利。PolarDB 采纳了分布式共享存储架构,通过计算与存储拆散实现了数据库的高可扩展性。2021 年 PolarDB 在存算拆散上又后退了一步,实现了计算、内存、存储三层解耦的架构,通过内存池化让 PolarDB 实现秒级弹性。另外,作为全栈的云服务商,阿里云还提供 IaaS 层服务,这使得阿里云在软硬件协同方面有机会做一步优化,实现数据库整体性能的晋升。

“比方,因为存储咱们有机会参加定义,很多工作(如数据的过滤、解压缩)都能够放到存储层来做,通过 offloading 从而获得更多性能劣势。”阿里云数据库事业部产品与解决方案部总经理王伟民在承受采访时示意。


阿里云数据库事业部产品与解决方案部总经理 王伟民

另外,因为阿里云同时提供 RDS、ECS 等服务,使得 RDS 能够充沛享受底层 ECS 的能力。比方,ECS 对底层异构资源技术进行了无效屏蔽,通过 RDS ON ECS,能够疾速实现异构架构的反对。此外,云计算带来了海量的租户和先进的大规模分布式技术,使得云服务商能够用 AI 技术大幅晋升运维经营的人效,从而降低成本。

“通常一名成熟的 DBA 可治理 15~20 个数据库实例。如果数据库部署在客户的数据中心,按咱们以后的数据库实例规模须要数千人的运维团队,而通过引入了‘数据库主动驾驶技术(即数据库自治服务 DAS)’, 很多工作都能够主动实现,运维老本明显降低。”王伟民示意。

正是因为云数据库充分利用了云计算的技术红利,使得其在老本、扩展性等方面领有先天性的劣势,云数据库也被认为代表了数据库的将来。Gartner 早在 2018 年就在《The Future of the Database Management System (DBMS) Market Is Cloud》这份报告中明确提出,传统自行部署数据库的形式曾经过期,并预测到 2023 年云数据库的支出将占整个数据库的一半,起初又修改了预测,将这个工夫提前了一年,认为 2022 年这个指标就能够实现。

02 向云原生数据库 2.0 跃迁

在传统数据库时代,企业须要解决的数据以结构化为主,传统数据库也都基于此来进行架构设计。明天,越来越多的半结构化和非结构化数据的呈现,比方,视频、日志以及物联网设施带来品种繁多的数据类型,也带来各种新的解决需要。面对多样化的需要,在传统数据库、数据仓库之外,一批新产品和技术开始衰亡,包含图数据库、数据湖、各种数据迁徙工具、剖析和发现工具等。如何满足各种新兴的需要,对于新生代数据库厂商既是挑战也是机会。

基于十余年的深厚技术积攒和弱小的自研能力,明天的阿里云曾经能为用户提供全面的数据库产品、服务和解决方案。截至目前,阿里云数据库技术与产品体系涵盖关系型数据库、非关系型数据库、数据仓库、数据库生态工具四大版块,从数据生产和集成(DTS、DMS 和 DBS)、数据实时处理与存储(RDS、PolarDB 产品系列、Lindorm、Tair)、数据分析和发现(AnalyticDB 产品系列)、数据开发、治理和智能运维(DMS、DAS)。阿里云通过一站式全链路、全生命周期、全场景的数据管理与服务,以及触手可及、简略易用、安全可靠的云数据库,能够让数据无缝的自在流动。这也就是阿里云数据库所说“一站式全链路数据管理与服务”,阿里云数据库将此作为新的战略目标,并将此定义为“云原生数据库 2.0”的外围特色。

“云原生数据库 2.0 是一次降级,有两个降级方向:第一个是继续对原有的服务进行晋升,比方内存、存储、计算三层解耦;另一个是一站式、全生命周期,也就是用户想要的负载和解决场景都有相应的服务能满足,并能残缺笼罩数据的生产、发现、剖析、洞察、展示、甚至到沦亡的整个生命周期。”王伟民解释说。不仅如此,阿里云还通过线上线下交融将云原生数据库的能力赋能线下客户,混合云数据库平台 DBStack 就是一个很好的例子。这款产品在 2021 云栖大会上正式公布,次要面向政企客户。DBStack 容许客户在自有数据中心部署,在享受公有部署的安全性的同时还能享受云原生数据库稳固、平安、低成本等能力。而且,DBStack 还提供数据库一键迁徙能力,不便政企客户替换传统商业数据库,疾速上云。

家喻户晓,政企市场是测验云数据库产品竞争力的试金石,也是数据库是否真正站稳市场的基本。现在,阿里云数据库已失去越来越多政企客户的高度认可,其中包含自然人税收管理系统、中国邮政、中国太平洋保险、申万宏源证券、中国北方航空、友邦保险等一批行业头部客户。

这个问题的背地,离不开阿里云的合作伙伴和阿里云数据库生态系统的建设。王伟民介绍,打造一个凋谢凋敝的生态是阿里云数据库的重点工作之一,阿里云正从以下几个方面发力:

与重点行业和区域的头部 ISV 单干,在银行、证券、保险行业遴选出一些合作伙伴,在联结解决方案方面进行产品的联调、对接、优化。
推出相干的培训和认证。阿里云有面向集体的认证(如 ACA、ACP),也有面向合作伙伴解决方案的认证(PSA)。对于合作伙伴,阿里云心愿不只是能转售阿里云的产品和服务,还可能基于这些进行翻新,开发出新的解决方案。

另外,阿里云正在筹备生态联盟,一方面是心愿让更多的用户参加进来,另一方面也心愿和一些大规模、有能力、有志愿的用户一起共创,单方分工、合作推出新的解决方案。

03 认认真真地开源

近年来,随着开源的遍及,不少数据库抉择了开源模式。2021 年,阿里云数据库也走上了开源之路,先是在 2021 年 5 月率先开源了 PolarDB for PostgreSQL 分布式版,随后又在 10 月底的云栖大会上发表开源云原生分布式数据库 PolarDB- X 和 PolarDB for PostgreSQL 共享存储版,后续还将开源云原生多模数据库 Lindorm。与很多公司不同,阿里云开源的数据库产品都是在阿里云外部失去充沛验证的原创性技术,阿里云的开源是真正残缺、彻底的开源。

阿里云数据库开源的背地是阿里云对开源的高度认可以及本身的开源文化。其实,阿里云数据库的倒退就与开源数据库有着颇深的渊源,当初就是用开源数据库 MySQL 替换了商业数据库,并在此基础上有了阿里云版的 MySQL——AliSQL,而且阿里云的技术人员在 MySQL、MariaDB 等开源社区也十分沉闷。

“咱们认为开源是数据库将来的支流趋势,因为数据库的倒退离不开宏大的生态反对,外围产品开源是充分利用社区力量建设生态的最佳办法。”王伟民说。

阿里云数据库开源的目标之一就是让更多人参加到数据库产业之中,做大生态。“因为云是规模经济,要让更多的用户未来更彻底地生于云、长于云。咱们心愿他从第一天开始就用咱们这个产品,这样如果未来业务要上云了,他可能会抉择咱们云上对应的服务。”王伟民说。

第二个目标是减速技术的更新。在王伟民看来,“开源相当于智力的众筹,无论是缺点的发现还是信赖的建设、还是新性能个性的倒退,都可能疾速迭代。这也是云时代对传统软件时代的一个超过,是一种软件的进化。”。

当然,开源还体现了阿里云数据库的自信,开源作为一种能够让用户测验软件品质的形式,可能把信赖建设过程中的挑战大幅度降低。

不过,王伟民同时也示意,开源不是灵丹妙药。开源的实质是回馈开发者和技术社区,让更多人参加并融入技术最前沿,是可能让技术倒退更快的一个伎俩而已,并不是决定数据库公司、厂商是否在将来竞争中怀才不遇的必要条件。

“这里重要的是保持凋谢的态度,要汇集众人的力量一起致力,以建设多元化的生态。”王伟民说,有了这个态度之后,至于如何开源这些细节其实不重要。比方,你能够拿开源做商业化,也能够拿开源做科研。

04 结束语

明天,国家正在大力发展数字经济,而数据量的激增必将持续推动数据库市场的快速增长。另一方面,新的数据类型和解决需要不断涌现,库仓一体、实时数仓、湖仓一体等新概念频出,传统数据库面临新的挑战,这正是国产数据库怀才不遇的机会。

作为中国数据库厂商的优良代表,阿里云可能进入并蝉联 Gartner 寰球数据库魔力象限的领导者位置,背地体现的正是国产数据库提高。“一花不是春, 孤雁难成行”,咱们心愿在阿里云等厂商的率领下有更多的国产数据库涌现进去,为我国数字经济的落地与倒退提供更为强力的反对。

原文链接
本文为阿里云原创内容,未经容许不得转载。

正文完
 0