关于数据库:腾讯云数据库TDSQL新基建大潮下的弄潮儿

39次阅读

共计 3917 个字符,预计需要花费 10 分钟才能阅读完成。

数据库行业倒退分析

中国数据库行业发展史

首先咱们回溯一下中国数据库行业发展史。中国数据库行业的起源是在复原高考之后(1978 年),过后萨师煊老师出版了中国第一部数据库教材《数据库技术概论》,过后国防、军工等很多外围畛域开始利用数据库。90 年代初,中国商业数据库的格局初步造成。1989 年,Oracle 正式进军中国,依附弱小的生态、服务体系和产品劣势,垄断了金融、电信等许多行业,占据了中国数据库市场份额的半壁江山。

2000 年起 BAT 相继创建,而过后 Oracle 价格昂贵,互联网公司资金无限的状况下难以承受宏大的数据库商业费用。 所以在这时,以 MySQL 为首的开源数据库就开始与互联网公司进行碰撞了。MySQL 在互联网公司出现了一统江湖的状态,丁奇等优良的开源技术首领都是在那个阶段开始逐步涌现。

2010 年 4G 开始大批量应用,2011 年相继呈现了很多优良的互联网公司,如美团,滴滴等。 到 2013 年这些优良的公司开始爆发,始终到明天,这波互联网红利还在继续地演进。这个阶段是互联网百花齐放的一个阶段,生产互联网还在延展,并且正在进入生产互联网和产业互联网联合的阶段。To C 畛域的生产互联网,还在大批量的爆发,诸如拼多多等破千亿美元市值的公司还在呈现。

所以我认为,从 2013 年到当初,优良的利用、公司开始涌现之后,也迎来了业务多元化高速倒退的阶段。咱们也看到这些优良的互联网公司里开始不再只是 MySQL 一种引擎去撑持公司的业务倒退。像 Postgre、MariaDB、Redis、Cassandra、MongoDB 等优良的开源数据库也都开始在这些互联网新贵的外围业务零碎中承载很重要的作用。

数据库商业模式变迁

换一个维度来看,数据库的商业状态、商业模式上到底有什么样的变迁?

方才讲到 90 年代 Oracle 数据库开始进军中国,这是一种传统商业数据库的模式,以卖 license、卖服务的模式来提供商业价值。这种模式以 Oracle、SQLServer、Informix、DB2 为代表,这种商业模式曾经存在了多年。明天早上我看了 Oracle 颁布的第四季财报,整体支出同比降落 6%;软件 license 的支出同比降落超过 20%。从财报的数据能够看到,这种传统的商业模式正在被逐步的侵蚀,客户的付费模式在发生变化。这时肯定有新的商业模式来替换。

再看两头“百花齐放”的几个倒退阶段,又能够分为三大类。第一类是老牌国产数据库,如达梦、人大金仓、南大通用等以高校为背景成立的优良数据库公司,他们的模式跟商业数据库很像,然而他们有新的响应模式,他们切的是老的党政机关政务内网、政府等一些集中式的数据库场景。

随着工夫的延长,逐步呈现第二类—开源商用数据库,MySQL、MongoDB、Redis 等优良的开源数据库呈现。但开源总归是一门生意,它是一个闭环的商业模式。国外有很多优良的商业公司在后盾运作这批开源数据库,来为用户提供更加高价值、或者企业化的服务,来实现它的商业模式闭环。比拟有代表性的比方 MongoDB atlas, 它把 MongoDB 做开源之后,提供 atlas 云服务,也提供线下的企业版服务,来造成商业模式的闭环;而 RedisLab 次要是以色列人和美国人建设的,利用 Redis 开源软件逐步的实现它的企业级性能,而后为用户提供服务。

第三类是新晋的国产数据库 ,他们的商业模式实质上没有变动,而是切入了更新的场景。比拟典型的代表有 PingCAP、巨杉等,他们提出的场景是出于用户的开发者高效运维的角度来切一个特定场景,而后用传统的企业软件模式或者 license 模式来切这部分相应的市场。

最初就是云服务模式的到来, 即云服务厂商来提供相应的数据库服务。不再是提供 license 受权、或提供人工服务,而是采纳租用模式,扭转了整个数据库商业模式。比方腾讯云、阿里云、AWS 数据库,都是云服务厂商基于开源数据库或者商业数据库做相应的产品化、商业化的工作,为用户提供租用数据库服务。

国产数据库布局

上述咱们理解了近 30 到 40 年数据库行业在商业模式上的大变迁。上面咱们聊一下国产数据库的布局。在中美贸易战背景下,包含相似 Matlab 软件应用限度事件产生后,国内有很大的声音在呐喊做自主可控的“中国芯”外围组件。而咱们认为,IT 基础设施三个最外围的组件,一个是服务器 / 芯片,一个是操作系统,另一个就是数据库。

国产数据库有哪些商业模式和利用场景?

第一类是传统国产数据库 ,由高校系的老师率领团队做产品化和商业化的运作,比方达梦、金仓等,更多的是贴合集中式数据库场景,他们的具体客户案例以集中式数据库偏多。

第二类是互联网厂商性质的数据库(也包含华为),这类的数据库厂商就是本人应用,本人的数据库在本人的业务中做了很多的独特的打磨,而后在本人的这种大规模的并发业务中,承当了很多的流量之后,再把这样的数据库去产品化,提供给宽广用户。以腾讯和阿里为代表,腾讯的像 TDSQL,TBase 都是反对外部的微信领取,财付通,有很大的交易流量,之后再逐渐产品化,给内部用户应用。像阿里的 OceanBase 可能也是这样的,外部反对蚂蚁金服,而后再去逐步的凋谢给宽广的传统行业去应用。

第三类就是新兴的数据库 ,说新兴是因为他们不是一种传统高校的背景,也没有他们本人的数据库,也没有本人外部的一个场景,然而他们的确看到了用户应用上的一个痛点,从一个细分场景去切,而后逐步的去把这种商业的盘子做大。比方像 PingCAP 这样的数据库,他们刚开始起步的时候,出于用户应用分布式数据库开发角度,或者说运维角度的不便当,应用传统的计算跟存储拆散的模式,而后以一个对立的应用形式去调用分布式数据库,而后切到了相应的场景去做线下的产出跟商业化的操作。

第四类就是第三方平台型的数据库 ,这类个别是指公司在某个行业有多年积攒,而后依据这个行业的特定场景做一款数据库,之后再逐步推广到其余畛域,比方亚信,中兴。亚信是一个运营商行业老牌公司,对于运营商的一些外围业务零碎,他们应用了实用于这些业务的数据库,再从运营商推广到其余行业,逐渐的产品化。

综上,目前咱们国产数据库也是一个百花齐放的状态,大抵能够分为这 4 类。我认为第二类的数据库厂商可能是更适宜于在当初的大环境,因为它毕竟是在大规模的利用上曾经本人磨难进去了一套绝对稳固、性能绝对齐全的一套数据库,而后再去利用不同的场景,再把这样的数据库推给更多的用户,更多的行业去应用。我认为这种模式在工程化跟商业化实际中,更容易摸索出一条胜利的路线。

新基建对数据库行业的时机

第二个话题是对于新基建对于数据库行业的挑战和机会。新基建包含了大略 7 个畛域,包含 5G 基站、城际高速等,其中跟产业互联网相干的,次要是 5G、大数据中心、人工智能、工业互联网这几个畛域,我总结新基建次要分为三个局部。

第一局部是信息基础设施, 包含三局部,一是通信网络基础设施的晋升,比如说 5G 可能有上百万个基站要去部署,整个网络的提速会十分快。二是新技术的基础设施,次要是指人工智能大数据等技术怎么去利用在新的技术基础设施上实现一个整体的晋升。三是算力的基础设施的晋升,次要包含在大数据中心,智能数据中心,边缘计算这些的基础设施方面的布局和建设。

第二局部是交融基础设施 。一是物联网的智能交通的基础设施,其中整个的数据传导、数据汇聚、数据分析,以及在这套整体的基础设施中做的整个的产业互联网的布局的减速。二是智能能源的基础设施,就是七大畛域中的工业互联网,包含这些根底的组件,数据的抽取、会集、剖析、加工,以及在整体基础设施上的全面晋升。

第三局部就是翻新基础设施 ,包含一些重大科技的基础设施的晋升,而后科教基础设施的晋升,产业技术包含翻新科技园整个翻新基础设施的全面晋升。

宏观上来看新基建的 7 大畛域会大略分为这三类,那么这些方面的晋升对于数据库来说到底有什么实质上的冲击?

不管怎么变动,其实数据库的作用一个是装数据,一个是运算数据,一个是剖析数据,最初是出现数据。所以对于数据库来说,新基建和基础设施的晋升次要有三个挑战:

第一,数据量会呈现全面井喷的状态。 在 4G 的模式下,AR、VR 等并没有很好的用户体验,但真正到了 5G 时代,这些相应的基础设施能力晋升之后,用户体验也会随之大幅晋升,带来的问题可能就是数据量会呈现井喷式增长。对于数据库来说,一方面在线交易的数据库的性能会暴发,尤其是频繁的增删改查的数据库操作。须要应答这种数据量的井喷,来满足实时的进行相应的运算。另一方面是在线剖析数据库的业务性,怎么可能疾速的进行在线的剖析,这也会对于在线剖析的数据库性能有较大的挑战。

第二是业务交融多样化的挑战。 数据的出现是多模态的,各种数据须要不同模式的数据库来承载,对于数据库来说就会滋生多模的业务需要(对于不同的数据类型、对于同样的业务接口或者指标,怎么把数据会集和加工)。另外就是场景、部署的业务交融,新基建的畛域里,有智能的 IDC 也有大数据中心,智能核心,有这种产业互联网交融基础设施的晋升,不同的部署场景,不同的部署模式或者说不同的数据中心的部署,其实对于业务的交融也有很大的挑战。数据库是否可能承受在不同的业务核心、数据中心、基础设施之间去做相应的部署和交融,这也是将来对数据库一个大的挑战跟冲击。

第三是数据自动化治理或者数据库自动化优化层面的诉求和要求。 随着中国老龄化的逐步演变,包含人才红利的开释之后,数据库人才缺口可能会更大。对于数据库的提供商来说,就是要为用户提供多种的自动化的服务,或者说是 AI 类的服务。另外就是对于数据库多模的现状,数据库的厂商是否能为用户提供这种主动运维的服务,也是对整个数据自动化治理的重要挑战。

正文完
 0