关于数据库:阿里云李飞飞中国数据库的时与势

3次阅读

共计 4626 个字符,预计需要花费 12 分钟才能阅读完成。

简介:数据库、操作系统和中间件并列为三大根底软件,无论是在银行存取款,还是进行衰弱码查问,咱们的日常利用和企业业务背地都离不开数据库。能够说,没有数据库,就难以构建数字化底座。过来的 40 多年,数据库技术始终在翻新与迭代,经验了不亚于挪动通信技术从 1G 到 5G 的微小逾越。云计算的呈现,让寰球数据库市场格局迎来了 40 年以来的最大拐点。而这一次,时与势站在中国厂商一边。

作者简介:

李飞飞,阿里巴巴团体副总裁,阿里云数据库产品事业部负责人、达摩院首席数据库科学家。IEEE Fellow、ACM 卓越科学家

决定冰山高度的,是水面之下你看不见的 80%。

如果咱们将企业业务比作一座冰山,将数据比作数字时代的新石油,那么数据就是埋藏在水面之下的“宏大基底”,其蕴藏的能源潜能令人期待。如何帮忙千行百业的用户存好、用好、管好数据,为企业数字化转型赋能,须要承载数据的主体、外围根底软件——数据库作为松软底座。

数据库、操作系统和中间件并列为三大根底软件,企业业务和日常利用都离不开数据库。无论是在银行存取款,还是进行衰弱码查问,背地都离不开数据库。能够说,没有数据库,就难以构建数字化底座。

在国内权威机构 Gartner 刚刚颁布的 2021 年寰球云数据库魔力象限评估后果中,作为中国科技公司代表,阿里云数据库蝉联了“领导者”(LEADERS)象限,意味着阿里云数据库综合实力已稳居寰球第一营垒。

这既是对阿里云数据库实力的必定,同时也证实了阿里云围绕云原生数据库新赛道进行前瞻布局和自研翻新的策略是正确的。2020 年,阿里云首次挺进寰球云数据库“领导者”象限,是中国数据库 40 年来第一次进入寰球顶级数据库行列。往年,阿里云仍是惟一进入“领导者”象限的中国企业,可能在国际舞台上为中国数据库博得认可,我感到十分骄傲。

往年入选 Gartner 寰球云数据库魔力象限的企业共有 20 家,中国 2 家,占比 10%。这与中国微小的市场空间和产业利用前景并不相称。在我看来,将来肯定会有更多中国厂商呈现在这份榜单上,并且一直向着“领导者”象限迈进。

我之所以有这样的判断,是因为云计算的呈现,让寰球数据库市场格局迎来了 40 年以来的最大拐点。而这一次,时与势会站在中国厂商一边。

数据库的 40 年大变局

数据库是数字经济里最重要的基石,人们已切身感受到挪动通信、智能手机、AI 所带来的突飞猛进的变动,但数据库仿佛变动不大。不过在数据库从业者眼里,在过来的 40 多年,数据库技术始终在继续翻新与迭代,经验了不亚于挪动通信技术从 1G 到 5G 的微小逾越。

上世纪 80 年代初,数据库系统逐渐走进信息技术舞台的地方。2000 年前后,大数据技术衰亡;再到 2010 年后,云计算热度继续升温,云原生、分布式等技术的一直倒退。展望未来,数据库技术会因为云计算实现技术上的极大跃迁。

随着企业业务全面向数字化、在线化、智能化演进,企业面临呈指数级递增的海量存储需要和挑战,包含并不限于诸如业务热点和突发流量带来的挑战。企业不仅须要降本增效,还须要进行数据分析、数据洞察,从而产生可领导口头的智能决策,传统的商业数据库曾经难以满足和响应快速增长的业务诉求:

一:零碎面临继续扩容的挑战。传统数据库是在冯·诺依曼架构下倒退而来,其外围特色是计算、存储等资源的紧耦合。当业务须要的资源超过底层零碎所能提供的容量后,须要对现有零碎进行灵便弹性的扩容。

二:零碎永远会存在宕机的危险。如果撑持外围在线业务的数据库出了问题,将导致业务零碎无奈失常运行。数据库须要高可用,确保无论底层资源产生任何问题,数据库都能够实现不同服务器、不同虚拟机、甚至是不同可用区和地区之间的切换,保障下层业务系统对底层硬件资源的谬误或者危险的无感知容错。

面对这两个外围挑战,云原生数据库利用虚拟化技术将计算、存储等资源进行池化,将存储计算拆散。打个比方,以前创立独立的数据库,好比每家每户各打一口水井。现在的云原生数据库,则是把这些水井底部的水资源连接起来,外表上还是一口口独立的水井,然而水井的底部曾经连在一起,造成了一个隐形的池塘,能实现随时按需用水。

概而言之,从传统数据库到云原生数据库,最大的技术改革是资源池化与资源解耦,以及由此而带来的弹性、高可用、容器化部署、智能化运维等为外围能力。这背地是技术的一直解耦,是技术的解构与重组。通过在技术上把存储计算池化并且拆散,为各企业提供不间断、弹性扩大、高可用的数据库服务。

云计算的实质,是利用分布式和虚拟化技术将资源高效池化,而对利用进行通明的集中式部署。业界目前支流的发展趋势,是将资源池化、资源解耦,以云原生、分布式的技术为根底。阿里云所打造的云原生数据库 2.0 —— 一站式全链路数据管理与服务,将云原生技术和分布式技术合二为一:下层是分布式,上层以云原生的形式实现,每个分区都能够享受云原生带来弹性、高可用的能力,同时下面有分布式带来的程度拓展的能力,解决高并发可能带来的瓶颈问题。在这个根底上,打造面向不同利用场景和需要的专属数据库和数据仓库零碎,做到专库专用;同时,利用 HTAP、在离线一体化、库仓一体、多模数据处理等核心技术,实现数据处理与剖析的交融,以及数据在不同利用场景和零碎之间的自在流转。最初,通过在线数据管理平台来实现一站式全链路数据管理与服务。

举例来说,在传统架构下,企业部署一套 IT 零碎,就须要部署一个数据库,并且要依照可预知的业务峰值来规划设计零碎容量和冗余,进行装置部署。这一模式带来的问题和挑战,是高老本和低使用率,因为大部分工夫零碎是闲置的、资源是错配的。云原生数据库的资源解耦很好地解决了这个问题。

去年,咱们为钉钉疾速扩容了 10 万多台云服务器的软硬件资源,然而数据库系统并不需要像传统数据库那样进行简单且耗时的扩容部署,而是通过云原生技术,采纳层级拆散、弹性解耦的形式满足业务须要。在云原生数据库系统中,咱们能够通过 AI 和机器学习技术实现智能自动化的运维过程,疾速调动资源,匹配业务需要,须要多少资源就扩大多少资源。就像自来水零碎,用户可对水量进行实时灵便的管制。如果需要回升,就开大水龙头,需要降落就调小水龙头。业务峰值过后,能够疾速开释资源,大幅晋升系统资源应用效率。反过来对业务零碎来讲,运维繁难化水平和效率也大大晋升。

双 11 是寰球最大的超级数字工程之一,是阿里巴巴技术的练兵场,但阿里云数据库禁受住了最严苛的测验。如 2020 年双 11 零点的峰值 58 万笔 / 秒,每一笔交易还会有一个拆单的动作,到数据库系统就是每秒几百万 TPS(Transactions Per Second,每秒处理事务数)。这种霎时暴发的场景,如果不是利用云原生的技术,简略依赖传统技术根本无法满足这种高并发、弹性、高可用的要求。

2021 年是数字化转型的遍及年,千行百业的业务减速上云过程。即便是繁多客户,也领有多样化的简单业务以及丰盛的业务负载个性,繁多产品和架构已很难满足客户须要。阿里云数据库全面拥抱云原生,首次从客户场景视角,提出了“一站式全链路数据管理与服务”的理念,心愿通过产品及产品组合,满足企业多样化的业务诉求。

面向云原生数据库 2.0 时代,阿里云数据库提供了涵盖数据生产和集成(DTS、DMS 和 DBS)、数据实时处理与存储(RDS、PolarDB 产品系列、Lindorm、Tair)、数据分析和发现(AnalyticDB 产品系列)、数据开发、治理和智能运维(DMS、DAS)的一站式全链路、全生命周期、全场景的数据管理与服务,通过触手可及、简略易用、安全可靠的云数据库,让数据无缝的自在流动。

中国数据库厂商的时与势

数据库作为应用型技术,先发劣势和生态建设十分重要,如果没有技术上的突破性翻新,后来者想要超过,可能性很小。在云时代的滚滚洪流之下,云计算已成为数据库倒退的新赛道,中国数据库企业迎来了绝佳的改革机遇期。

据 Gartner 预测,到 2022 年,云数据库管理系统(DBMS)的支出将占 DBMS 市场总收入的 50%,比 2020 年预测的提前了一年。数据库持续向云迈进,寰球数据库产业结构正在减速重构。

云计算作为一种全新的科技服务,对数据库的研发、应用、销售等方方面面带来了彻底的改革,也让寰球厂商在数据库赛道上站在了同一起跑线上。中国有着泛滥的数字用户,有很多独特业务场景。没有胜利应答双 11 流量洪峰、“衰弱码”等场景的数据库厂商,很难晓得如何解决海量数据、超高并发交易洪峰等理论业务问题。放眼寰球,中国厂商独享这样的机会。这一次,中国厂商乘“云”而上,领有了比肩国外数据库的技术和创新能力。

以阿里云自研云原生数据库 PolarDB 为例,2017 年才启动自主研发,但到明天很多性能,如内存、计算与存储三层解耦架构实现秒级弹性、多主多写、基于内存池化的列存索引反对 HTAP 等曾经是寰球独创或业内当先的技术,翻新步调曾经当先国外同行。

中国信息通信研究院往年 6 月公布的《数据库倒退钻研报告(2021 年)》指出,我国数据库产业进入重大倒退机遇期。报告显示,2020 年,中国数据库市场规模约为 241 亿元,寰球市场占比约 5.2%。预计到 2025 年,中国数据库市场总规模将达到 688 亿元,市场年复合增长率(CAGR)为 23.4%,寰球占比 12.3% 左右。

数字经济的蓬勃发展,必然推动了中国数据库市场的快速增长。中国的数据库行业可能挺进并蝉联 Gartner 魔力象限的领导者位置,是几代人不懈努力的后果。数据库行业获得明天的问题,与国家对根底软件产品的搀扶、以及政策的疏导和加持是分不开的。

如果说,过来中国数据库技术打不开市场,有很多客观原因,然而明天中国乃至海内的企业,曾经开始大规模承受中国数据库技术,并且金融、政务等外围利用开始尝试用云数据库大规模代替传统数据库。随着科技自立自强的重大策略施行,这种全面代替会是一个确定的趋势,会有越来越多的企业应用中国数据库技术。云原生与分布式一体化、在离线一体化、HTAP 混合负载查问与解决、物联网及多模数据交融解决与剖析、平安可信与隐衷爱护、智能化运维与调优、机器学习和 AI 负载以及智能化算子与利用反对、新型硬件的适配和优化将成为云原生数据库重点发力和冲破的技术方向。

明天,中国提供数据库产品的厂商已超过 80 家,其中很多企业受到资本的高度关注和追捧,成为新锐的独角兽厂商。尽管国内数据库企业繁多厂商的人员规模还不足以与寰球巨头企业抗衡,然而产业人才曾经造成了肯定的规模和梯队。这为中国数据库产业的稳步发展打下了松软的人才根底。阿里云数据库也致力于造就数据库畛域的技术人才,建设开源云原生分布式数据库社区与组织,撰写云原生数据库教材,心愿吸引更多人参加、学习、奉献数据库技术,实现人才生态的凋敝。

此外,通过产学研单干的携手翻新,在数据库畛域 VLDB、SIGMOD 和 ICDE 三大顶会的论文中,中国厂商的论文数量也出现了逐年回升趋势,近几年的奉献占比放弃在 23% 左右,局部论文提出的数据库技术创新甚至取得寰球同行的认可。这也是中国数据库企业趁势而起的标记之一。

“因天之时,就地之势,依人之利,则所向者无敌,所击者万全矣。”在这样的产业大变革时代,粗浅意识和正确把握咱们所面临的时与势,有利于中国数据库厂商看清方向,找到疾速成长的门路。我置信,时与势也必然转化为中国数据库产业疾速倒退的能源,让咱们在这样要害的信息技术畛域领有应有的一席之地。

原文链接
本文为阿里云原创内容,未经容许不得转载。

正文完
 0