《IT 国产化特地策动》之数据库篇
作者:徐九丨公布自:思否编辑部
引言:
数据库作为中国技术科技倒退的 35 项“卡脖子”技术之一,长期以来被 Oracle、IBM、微软等美国巨头占据。在中美贸易战及云计算等新技术改革背景下,国产数据库的倒退在近一两年备受瞩目。
而这几年国产数据库的提高也是引人注目的,尤其是随着国内挪动互联网的迅猛发展,给很多国产新型数据库的利用发明了寰球举世无双的场景,也被称为是我国最容易实现弯道超车的一项技术。
那么国产数据库倒退现状如何?技术方面有了哪些冲破?又存在哪些问题、面临哪些挑战?
一、国产数据库的现状
图片起源:老鱼笔记
国产数据库的倒退最后源于国家的疏导、反对和培植,在最开始的阶段,国产数据库的研发始于高校,而随着互联网的倒退,互联网企业以及越来越多的守业企业纷纷也参加到了数据库的建设中来,让国产数据库进入到了一个百花齐放、百家争鸣的时代。
依照支流的分类形式,国产数据库目前次要分为三种:
1、传统国产数据库
咱们方才说到,国产数据库的研发始于高校,这一批中倒退最好的几家别离是人大金仓、武汉达梦、神州通用、南大通用,被称为国产数据库四小龙。
这几大数据库公司直到现在依然是国产数据库的重要参加力量,也属于国产数据库畛域的“国家队”。
1)人大金仓
人大金仓成立于 1999 年,其企业级通用数据库 KingbaseES 是入选国家自主翻新产品目录的惟一数据库软件产品,也是国家级、省部级理论我的项目中利用最宽泛的国产数据库产品。
2)武汉达梦
武汉达梦成立于 2000 年,其前身是华中科技大学数据库与多媒体研究所。目前次要利用于我国国防军事、公安、电力、电信、审计、交通、电子政务、税务、国土资源、制造业、消防、电子商务等 20 多个行业及畛域,装机量超过 10 万套。
3)神州通用
神舟通用是国家“核高基”重大科技我的项目之数据库产品的外围研制单位,通过了国家软件企业认证资格、高新技术企业认证、ISO9001 认证、波及国家机密的计算机信息系统集成资质认证。目前与浙江大学、北航、北京大学、中科院软件所等高校和科研院所均发展了深度单干。
4)南大通用
南大通用成立于 2004 年,是南开大学上司天津南创始元信息技术有限公司的控股子公司。南大通用的外围竞争力是数据处理以及数据安全技术,一直开发科技含量高、附加值较大、市场急需的具备自主品牌的软件产品,为我国电子政务、电子商务、信息安全等畛域提供根底产品撑持和业余服务。
2、头部科技企业数据库产品
尽管数据库是一项须要工夫积淀的技术,但大部分传统的数据库根本都是基于几十年前传统的技术架构设计,随着互联网和大数据的倒退,很多曾经不再适应当初更简单的利用需要和更新、更弱小的硬件环境,这也让一些头部的互联网公司和云技术厂商趁势跻身进入了这一战场。
这其中,阿里巴巴的 OceanBase、PolarDB,腾讯的 TDSQL、TBase 等,华为的 GaussDB,都凭借着本身的云平台,开始布局数据库市场;
除了云厂商外,很多传统的头部科技企业也参加到了数据库的核心技术攻关中,这其中就包含中兴、浪潮等。中兴推出了 GoldenDB,而浪潮则是推出了 K -DB。
另外,很多大型国企数据库公司,比方:中国移动、国家电网等巨头公司,也都成立了数据库产品公司钻研开源数据库如何撑持外部业务零碎。
3、新兴独立数据库守业产品
当然,既然国产数据库进入到了一个百花齐放、百家争鸣的时代,那么就不存在一个数据库通吃的状况。不同的场景须要不同类型的数据库产品,来满足特定的场景需要,这也给了很多新兴的独立数据库守业企业以倒退机会。
在 2011 年之后,我国涌现出了很多新兴的数据库公司,以下为墨天轮公布的 2020 年国产数据库名录:
从名单能够看出,我国的国产数据库产品类型多样,正在逐步造成一个成熟、全面的数据库生态。很多新兴的独立数据库守业企业,也曾经获得了很不错的问题。
PingCAP 是国内开源的新型分布式数据库公司,公司旗下的产品 TiDB 是目前国内最火的分布式 HTAP 数据库之一。自称“TiDB 亲爹之一”的黄东旭,是一名受到开源文化和自由软件静止的影响很深的开源信徒,这也让 TiDB 通过开源形式获取寰球用户的信赖,可能是在国内上影响力最大的国产开源数据库。
时序数据库 TDengine 1.0 版本在开源后,间断一周都排在 GitHub 寰球趋势榜第一,两个月内便拿到 10000 个 star。从性能方面来看,单纯从写入速度上思考,在多客户端连贯同步写入的速度 TDengine 远远高于同等条件下的 MySQL,Cassandra, InfluxDB 和 Open TSDB 以及 ClickHouse,是 Open TSDB 和 MySQL 最大写入速度的 150 倍。
巨杉数据库 SequoiaDB 则定位于金融级分布式数据库,自 2011 年起自研原生分布式引擎,基于计算存储拆散架构,提供 I/O 互不烦扰 HTAP 能力,已间断三年入选 Gartner 数据库报告。独特的引擎级多模设计,基于同一份数据可反对 MySQL、PostgreSQL、MongoDB、SparkSQL 兼容协定的跨引擎事务一致性。
还有很多优良的企业和产品咱们无奈一一举例,但毫无疑问,目前国产数据库处在倒退最佳时机,翻新的商业模式以及丰盛的利用场景推动了数据库进入百家争鸣的时代。
二、国产数据库的技术倒退
技术畛域是非常容易造成垄断的。目前,国外商业数据库如 Oracle 等在国内市场占据着极高的市场份额,国产数据库可能依然不到 10% 的份额。
咱们必须抵赖,目前数据库产品与国外标杆数据库的差距仍然较大,但近几年也一直的倒退迭代,并在这个过程中获得了肯定的问题:
- 2018 年 5 月,星环通过 TPC-DS,这是国产数据库首破 OLAP 的 benchmark 世界纪录。2019 年初,阿里云 AnalyticDB 也通过 TPC-DS;
- 2019 年 5 月,华为正式面向寰球推出了 GaussDB 数据库,其 GaussDB OLTP 数据库已在招商银行综合领取交易系统和工商银行内胜利上线投产;
- 2019 年 8 月,腾讯云公布 CynosDB 商业化版本,智能数据库诊断系统 DBbrain。11 月,发表开源 TBase 数据库,TDSQL 数据库落地张家港农商银行新一代外围业务零碎;
- 2019 年 9 月,华为云在 HC 大会上公布了 GeminiDB、TaurusDB 和 GaussDB OLTP 上云;
- 2019 年 9 月,阿里云推出 POLARDB Box,这是业内首次推出基于云原生数据库的一体机。11 月,Gartner 颁布 2019 年寰球数据库魔力象限评比后果,阿里云进入“挑战者”象限,并间断两年作为惟一的中国企业进入该榜单;
- 2019 年 10 月,蚂蚁金服 OceanBase 登顶 TPC-C,这是国产数据库首破 OLTP 的 benchmark 世界纪录;
- 2019 年 10 月,中兴 GoldenDB 胜利帮忙中信银行替换 DB2,换“心”后的中信银行信用卡外围交易系统对外投产,这是全国性股份制商业银行的首例;
- 2019 年 10 月,巨杉数据库作为惟一中国企业入围 Gartner Peer Insights 2019 年度评比,并位居第三。11 月,间断第三年入选 Gartne r 数据库举荐报告;
- 2020 年 05 月,TPC 官网颁布,由蚂蚁金服自主研发的分布式关系数据库 OceanBase,在 TPC-C 基准测试中突破由本人放弃的世界纪录;
- 2020 年 5 月,全国人大代表、合肥工业大学利用数学研究所所长檀结庆,对于数据库畛域的国产化提出了倡议,他呐喊扩充国产数据库金融畛域试点。还征引易鲸捷贵阳银行与贵阳农商银行外围交易系统数据库国产化试点我的项目;
- 2020 年 6 月,华为兑现了去年 HDC 大会上的承诺,openGauss 终于正式亮相,源代码凋谢、社区成立。
毫无疑问,过来的一两年中,无论是技术的翻新迭代还是在世界级舞台上的发声,国产数据库都获得了具备里程碑意义的停顿,甚至有媒体声称“国产数据库们的春天来了”。
不可否认,国产数据化进入了一个飞速发展的时代,但数据库产品的研发是一个大投入,长周期,对技术要求很高的畛域。我国的数据库行业尽管上了倒退的快车道,但仍存在很多主观的问题,亟待解决。
三、国产数据库存在的主观问题
华东师范大学副校长周傲英传授在谈及中国数据库倒退时,已经这样说道:
数据库始终都是中国的欢天喜地,从六五(指第六个五年计划)开始,咱们就在立项,咱们要做本人的数据库,但咱们始终没有弄明确,为什么咱们做不进去本人的数据库,起初到了互联网时代,咱们一下子觉悟过去了,就是生态。
这之中既蕴含用户生态,更蕴含技术生态,前者是咱们要将国内数据库市场空间做大,后者是咱们要造成合力,因为数据库要解决的问题是综合性的,只有一起能力将这个事件做好。
尽管,国产数据库获得了极为夺目的问题,但这并不代表国产数据库就很完满,一些亟待解决的问题仍然存在。
从用户的角度看国产数据库,次要存在几个方面的问题:
- 行业标准
- 产品生态
- 技术硬实力
首先,是规范问题。百家争鸣、百花齐放是一件坏事,但在一项技术的倒退初期则也代表着统一标准的缺失。那么多的数据库产品,我要如何做抉择?在现阶段来说并没有一个主观的评判规范。此外行业也没有一套成熟的服务体系,应急解决和售后方面作为服务商仍有很多的进步空间。
其次,是产品的生态问题。国产数据库除了谋求技术迭代外,也应该关注产品的生态倒退。与周边上下游产品的兼容性、配套软件 & 工具反对、开发者关系等等,都是一项产品能最终取得市场份额的重要因素。大部分国产数据库目前次要的关注点,仍在于相干产品自身,还未来得及开始关注产品生态和用户生态的建设。
最初,是技术硬实力的问题。目前国产的关系型数据库,大部分源自或者借鉴开源 MySQL、PostgreSQL 数据库及其变种,或收买商业源码(例如 Informix)+ 自研的形式;大数据平台,多源自或间接整合开源大数据生态组件;纯自研的国产数据库还是多数,数据库品种不够丰盛,尤其 NoSQL 这块。数据库是应用软件的外围,倒退技术硬实力才是硬道理。
最初
题目写到《国产数据库,不存在“赢家通吃”》,现阶段其实能够拆开来解读 —— 即不存在赢家,也不存在通吃。国产数据库要的不是跑赢友商,而是要施展各自的特点和劣势,争取早日在寰球市场占有一席之地。
而每一位数据库畛域的开发者和从业者,都将成为推动国内数据库产品倒退的中坚力量,让国产化走的更好、更稳、更快一点。用 TiDB 设计者黄东旭老师的一句话来做本文的结尾:
“我的一个人生理念,就是没有解决不了的问题。我置信这个世界是在往好的方向倒退,而我也真的能够让这个世界一直变得更好一点。”
局部参考资料:
1. 老鱼笔记:《盘点 2019:对国产数据库的一点察看和总结》
2. 墨天轮:《2020:国产数据库名录和产品信息一览》
3. 汉理资本:《国产数据库行业钻研报告》
4. 电子商务世界:《国产数据库产业倒退考虑》
5. 软件和集成电路:《国产数据库倒退之路》
6. 信息安全钻研:《数据库国产化代替面临的问题及对策钻研》
拓展浏览:
1.2020,IT 国产化剑指何方|国庆特地专题
2. 如何在 Windows 和 macOS 两大巨头压力下怀才不遇 | IT 国产化国庆特地专题