关于程序员:DTCC-2021-华为云数据库战略启示录

39次阅读

共计 4962 个字符,预计需要花费 13 分钟才能阅读完成。

以下文章来源于 ITPUB,作者老鱼

人不知; 鬼不觉,华为携 GaussDB 正式产业化运作曾经有两年多了。这两年,国内数据库市场在多维度产生着微小的变动,国际局势、疫情、数字化转型、信创等减速了全社会对国产数据库的认知和接受程度,而 GaussDB 本身也变动极大。

  • 2019 年 5 月 15 日,华为正式推出 GaussDB 数据库,过后老鱼有幸采访到了 GaussDB 多位骨干研发成员,并写下了《华为“高斯”战记》。
  • 2020 年 5 月初,华为 GaussDB 做了策略降级,笼罩关系型、非关系型数据库以及生态工具类产品,聚焦客户业务,打造全场景云数据库服务。
  • 2020 年 6 月 30 日,华为正式将 GaussDB 单机主备能力开源到 openGauss 社区,激励有能力的合作伙伴打造基于 openGauss 的自有品牌商业数据库。

……

这些变动与调整的背地意味着什么?显然,是华为对数据库的思考在变动,随之而来的是倒退策略也有所调整。GaussDB 为什么会并入华为云?华为为什么要开源 openGauss?openGauss 与 GaussDB 是怎么的关系?GaussDB 将来将如何倒退?这些就成为外界关注的焦点。

在刚刚完结的 DTCC2021 大会上,老鱼带着很多问题及想法,围绕数据库产业趋势及华为策略,华为数据库根底钻研方向,GaussDB 商业实际及生态建设,与华为云数据库首席架构师冯柯、华为云数据库副总经理丁晨进行了一场深刻交换。

华为对数据库的思考及策略

当初议论数据库不可回避的须要探讨的另一个话题,就是云计算。

云计算给明天的中国数据库产业带来的不仅是技术上的更新,更重要的是商业模式的重塑。在云化大潮下,作为信息系统外围软件的数据库倒退出了云数据库的技术路线。

Gartner 预测,云将主导数据库市场的将来,到 2021 年,云数据库在整个数据库市场中的占比将首次达到 50%;到 2022 年,75% 的数据库将被部署或迁徙至云平台。

冯柯示意,这几年咱们可能越来越粗浅地感触到整个行业在全面走向云化,即便是一些传统的政企企业,它的整个数字化也在一直减速。这当中咱们也看到了很多客户,他们曾经实现了从 ON Cloud 到 IN Cloud 的转变,能够说现在业务是真正生于云、长于云。

中国云计算产业曾经逐渐进入下半场,冯柯指出,进入下半场一个很显著的特色是大中型金融政企的利用减速云化,而这将主导云数据库市场高速增长。

华为预测,大中型金融政企客户在云数据库方面的收入会占到整个中国云数据库市场的 3 /4,其中 OLTP 类型数据库市场空间为 60%,OLAP 为 23%,NoSQL 为 17%。

冯柯强调,华为对于整个中国数据库市场是动摇长期看好的,所以,会继续策略投入去做。而基于对整个行业的趋势的判断,华为对数据库进行了策略聚焦,即把云数据库作为华为在数据库方向上的主赛道,尽管冯柯并没有间接答复,但老鱼认为,这或者就是为什么 GaussDB 会并入华为云的次要起因。

华为数据库倒退策略,用一句话总结即“施展软硬件全栈劣势,共建凋谢生态,打造 GaussDB 全场景云服务”。

数据库是一个十分有黏性的行业,因为数据是外围资产,牵一发而动全身,间接影响客户业务,所以一旦下来,根本就很难下来。数据库行业倒退的这 40 年来,以 Oracle、SQL Server 为首的支流数据库占据了大量的数据库市场,但也带来了很多问题。尤其是这两年来和 A 国的科技战,卡脖子问题,所以无论是国产化,还是行业,都须要凋谢的生态,不能从一个传统关闭生态再走向另一个关闭生态。

而华为开源 openGauss,其外围次要两点,其一、华为在拥抱 MySQL 等凋谢生态的同时,也会以 openGauss 开源生态为主体,打造凋谢的数据库生态。其二、反对客户多样化(非云)的诉求。

将来投入数据库六大技术方向

基于新需要、新场景、新技术,最终,华为抉择了六大数据库畛域根底钻研方向来构筑竞争力,这是此次大会上,华为走漏出的另外一个要点。也就是说,将来华为在数据库上将在这六个方向重点投入,打造根技术的竞争力。

一、高可用
高可用是目前大多数金融政企客户首要关注的问题,特地是对于多地、多核心容灾有要求的客户。冯柯示意,针对这样的客户,华为云数据库曾经提供了多种解决方案,如反对同城双活、异地容灾、两地三核心的解决方案,反对同城双活强同步的解决方案,反对异步数据复制、多地多活的高可用解决方案。

在这当中,华为两地三核心的高可用解决方案曾经在国有大行,从 A 类到 D 类全类业务进行了验证,满足金融监管的要求。基于双集群 RPO= 0 的计划,华为也行将迎来正式投产。在所有的解决方案当中,华为既提供通过软件机制自身来实现高可用解决方案,也提供基于华为企业级存储,通过软硬协同实现的高可用解决方案,以不同的解决方案来满足不同行业、不同客户对于高可用的需要。

    面向未来,华为也在探讨物理间隔在一千公里以上,真正具备寰球部署能力的多活架构。

二、软硬深度协同
得益于华为从芯片、服务器、存储、网络、操作系统、数据库全栈软硬件能力,华为云 GaussDB 能够实现软硬件垂直整合,晋升性能和高可用能力。

首先,数据库的长久化逻辑,深度整合到了计算与存储拆散的技术底座中,基于这样一个公共技术底座,华为云数据库全系列产品都能够取得在容量、弹性、扩展性方面的微小晋升,同时能提供给客户统一的体验。

其次,据冯柯走漏,华为这两年的投入重点是把数据库里的各种计算逻辑,从计算节点卸载下来,下推到存储当中去,特地是对一些简单的查询处理,同时叠加并行处理能力,使得这些计算逻辑能充分利用上面整个存储池的能力,同时最要害的是能做到对业务通明。

第三,就是高性能,高性能的实现除了 IO 聚合之外,单条交易的实质就是网络的时延和解决的时延。所以,网络对于分布式数据库的时延 (性能) 影响是微小的。

总而言之,软硬协同带给咱们的不仅仅是性能扩大方面的劣势,更是能够通过软硬协同打造真正企业级的可靠性。

三、企业级混合负载
为什么会将混合负载(HTAP)作为华为云数据库根技术方向之一,这样抉择的背地有着怎么的思考?冯柯示意,这是因为性能对明天的金融政企客户来说,有两层重要的事实含意:

第一层:性能晋升可能真正升高业务迁徙的危险,过来始终在谈怎么升高业务迁徙危险,谈怎么进步产品的兼容性,怎么保证数据迁徙的品质,可是会有怎么的危险比性能有余而导致业务必须在架构上做重大变更所带来的危险更大呢?用户增长曾经十分确定的阐明了这一点,这是第一层含意。

第二层:对分布式数据库而言,在分布式数据库上性能意味着什么?意味着老本。在很多实际中,华为发现一个法则和问题,就是当把客户基于主机或者基于小机的业务下移到开放式的分布式系统中,很多时候客户老本反而回升了,这是十分有意思的话题。

通过对这些问题反思,华为明确了一个情理,这个行业最终还是要回到对于数据库自身能力的关注上。

四、云原生多主
繁多架构其实并不能解决明天行业所碰到的所有问题,这两年,华为也在打造另外一款基于云原生的多主架构,心愿通过这种架构可能解决两个阶段的问题,冯柯说。

第一个问题,是高可用的问题,华为心愿能基于多主架构,能解决切换时业务中断的问题。

第二个问题,是扩展性的问题,华为心愿基于多主架构,交融软硬协同的停顿,真正能在计算节点以下,在微小冰山水面以下的局部继续晋升这个产品性能和弹性,最终,华为心愿提供给行业客户另一种抉择,一种不须要通过数据拆分也能够取得通明扩大能力的抉择,从而更好的匹配另外一些行业客户,特地是一些传统的政企客户的模型。

不久前,华为也公布了基于多主架构的路线图。据理解,华为打算到今年年底或者明年年初,会正式将基于这种架构的第一代产品投入商用。

五、数据安全与可信
当今世界,每个组织,每个国家,每个人都在关注平安、合规和隐衷的问题,几年前数据无爱护随便应用的红利是不可能了,这也促成了技术的提高和落地。

将来,全行业都会面临越来越严格的对于可信平安方面的要求。

全密态是华为数据库为了晋升隐衷爱护能力研制的一项关键技术,全密态跟以前议论的脱敏加密不同,数据存储和传输过程中是匿名性存在的脱敏加密,全密态反对数据在整个计算过程中同样是以密钥模式存在的,这就实现了让整个敏感数据在全生命周期当中都失去爱护。华为心愿通过全密态的技术可能给对于平安可信,有更高要求的利用场景更多抉择。

如果把云数据库看成是一种根底专利,这种根底专利供给方和需求方之间不须要当时建设可信关系,就能够达成服务契约,华为心愿通过这样的技术,通过在整个平安可信方面的投入来拓展明天的云数据库,整个云基础设施的业务边界,这是华为想做的事件。

六、AI-Native(智能运维与调优)
云计算所带来的规模化挑战,在运维侧的复杂度和经营老本是明天所有云服务提供商面临的独特挑战。

另一方面,因为分布式数据库本身架构决定,在开发侧,运维侧复杂度的减少,这种复杂度会反过来妨碍架构实际在行业进一步的利用,而解法就一个智能化。

华为在智能化停顿体现在 2 个次要运维场景,其一,参数自调优,通过深度学习 / 强化学习与全局调优算法,曾经笼罩了 500+ 重点参数。相比 DBA 人工依据教训调优,性能晋升 30% 的同时,消耗工夫从天缩短到分钟级。

其二、智能索引举荐,通过启发式举荐算法,实现了语句级和负载级智能索引举荐,将效率从小时级晋升到秒级,并在 benchmark 测试中实测性能晋升了约 40 倍。

同时,GaussDB 还在散布列举荐、慢 SQL 发现与诊断、负载趋势预测与异样检测等畛域,引入 AI 技术,大幅晋升管理效率。

华为这两年正在继续将 AI 技术融入数据库内核中,实现数据库主动优化与调优等性能。

华为云数据库竞争力

在冯柯看来,华为云数据库的竞争力有三个方面:

其一,研发投入,华为在数据库研发投入上是世界领先的,布局了寰球 7 大研究所来构建数据库研发能力,包含(爱尔兰研究所、欧洲德国研究所、以色列研究所、俄罗斯研究所、印度研究所、中国深圳、北京、上海、西安研究所、加拿大多伦多研究所)。长期的策略投入保障华为在数据库专家人才方面储备短缺。依据理解,目前华为荟聚了寰球 1000+ 的数据库专家人才。

其二、技术策略布局,华为在整个根底软硬件的根底上,如芯片、存储、网络、操作系统、数据库有着残缺的软硬件布局。这意味着华为能够通过软硬的全栈零碎,来打造全场景的云服务。

其三、生态,数据库生态是数据库重要的一环,也是华为明天最大的劣势,冯柯说,GaussDB 从一开始就重视生态和社区的构建。华为做生态是认真的且富有经验的。冯柯强调,最要害的一点是,华为把生态当做业务来做,而且首先须要解决生态中怎么实现商业利益共享,华为违心去跟搭档分享市场机会。目前,曾经有 12 家 DBV 基于 openGauss 社区版公布了本人的品牌数据库。

应答线下市场之争

云数据库上半场,是线上市场(私有云)之争,目前大局已定,云数据库之战逐渐进行到下半场,即线下市场(公有云、混合云)之争。

线下市场之争,华为云又将如何应答?冯柯强调,华为策略聚焦云数据库,云数据库包含私有云服务,也蕴含专有云、混合云服务。华为舍弃的只是线下纯软件(光盘)销售和交付,而非云部署形式。华为云数据库副总经理丁晨也强调,华为并没有舍弃线下市场,而是通过华为云 Stack+GaussDB 部署到客户数据中心,为客户提供与华为云统一的服务体验。

线下市场对于有着 ToB 基因的华为无疑是劣势畛域,IDC2020《中国关系型数据库软件市场跟踪报告》显示,华为云 Stack 在中国政务云,金融云市场长期保持市场份额第一。GaussDB 数据库在中国关系型数据库本地部署市场中,国产第一。

面向金融政企市场,华为云 Stack+GaussDB,为客户提供合乎政策监管要求本地部署的云服务。目前,华为云 GaussDB 曾经在助力国有大行外围交易与数仓零碎分布式革新,并曾经在 4 家国有大行和多家股份制银行商用,并通过联创攻克要害核心技术。

最初,丁晨强调,国产数据库齐全能满足企业外围业务需要,只不过绝对 Oracle 而言,国产数据库还没有那么完满,这须要工夫,当初最欠缺的是信念,而信念是须要工夫来造就的。

更多华为云数据库详情理解,请返回华为云官网:https://www.huaweicloud.com/p…

本文由华为云公布

正文完
 0