编者注:本系列将抉择一些行业剖析报告进行分享,同时提供下载,与读者独特剖析分享数据库行业的最新进展与动静。关注本公众号回复:下载 。能够取得下载链接。

本报告的外围观点:

数据库作为信息化的外围环节,是底层硬件根底资源与下层利用之间的重要撑持。随着海量数据的涌现和剖析能力需要增长, 预计将来数据库存储量将呈现重大错配 ,需要迫切性将显著晋升 。

从信息产业链角度来看,数据库作为信息化零碎承前启后的关键环节 ,向下调用硬件根底资源, 向上为应用软件提供重要数据撑持,是信息化两头的外围环节 ;

从国家政策角度来看, 数字经济作为国家“ 十四五 ”建设的重中之重, 数据作为新型要害生产因素 ,是推动数字经济倒退的要害一环,同时,国内数据库长期由海内厂商主导,在国内数据库行业疾速倒退下,国产数据库将迎来重要倒退时机。

一直适应市场需求变动 ,数据库行业正继续进化。报告回顾了数据库70年倒退历程, 从数据模型逻辑 、技术架构、 需要性能、 部署形式、 商业模式、 存储介质、 治理模式等七大维度对数据库倒退脉络进行具体梳理。咱们发现, 因为数据规模 、读写需求量等指数级增长 ,为防止数据冗余与架构的复杂化, 叠加分布式架构技术日趋成熟,将多技术 、多模型交融成为数据库倒退的重要方向。如将NoSQL非关系型的分布式拓展性与关系型数据模型交融诞生的NewSQL,保留了关系型数据逻辑的同时, 大幅晋升了零碎的灵便拓展能力;数据模型方面,将结构化、半结构化、非结构化等多种数据交融的多模数据库正疾速倒退;需要性能方面,将OLTP与OLAP交融的HTAP数据库正逐步成为企业首选等均显示出行业技术交融的倒退特点。

在国内大力发展数字经济建设的大背景下, 数据库行业规模将放弃快速增长 。依据信通院统计,2020年中国数据库市场规模为35亿美元 (约合240.9 亿元人民币 ),预计2025 年市场总规模将达到688亿元,CAGR 为23.4 %。基于对数据库发展趋势与国家政策导向的剖析,咱们认为,将来数据库市场增量需要次要来自于以下三方面:

国产化过程正逐渐减速 :通过对金融行业国产化数据库建设案例梳理发现, 国产数据库曾经从边缘系统逐渐实现外围零碎国产化 ,显示出国产数据库产品性能、性能程度一直加强 。预计随着行业信创逐渐落地, 对国产数据库需要将进一 步提速。

分布式架构凭借在经济性 、平安自主、 灵活性、可伸缩性等方面的劣势,逐渐实现对集中式架构代替:目前,互联网、 金融、 电信等行业分布式降级停顿较快 ,其中金融 、电信行业已有分布式数据库在股份制银行 、城商行、 二三线城市运营商等实现了外围业务零碎的革新落地 ,同时 ,墨天轮 前十大热门数据库均为分布式架构 ,其利用场景涵盖各行业,显示出国产分布式数据库曾经趋于成熟,正成为各行业数据库建设重要抉择。

随着工业互联网、互联网创新型业务 、车联网等利用的疾速倒退,非关系型数据库利用将减速落地:非关系型数据库 利用场景不断丰富 ,如 图数据库可能撑持社交网络、金融反欺诈等互联网新型利用场景的关联剖析业务;时序数据库能够高效存储和疾速解决海量时序大数据 ,在工业互联网疾速倒退下 ,传感器与设施产生的大量实时数据, 将推动时序数 据库利用疾速倒退等。

从数据模型逻辑 、技术架构、 需要性能、 部署形式、 商业模式、 存储介质、 治理模式等七大维度对数据库倒退脉络进行具体梳理。

在以后关系、非关系并行时代,新型NewSQL与多模数据库疾速倒退。传统SQL受限于其拓展性,在大数据倒退下逐步面临瓶颈, 而NewSQL提供了与NoSQL雷同的可扩展性 ,而且仍基于关系模型 ,保留了极其成熟的SQL作为查询语言,从而保障了数据的强一致性;同时,基于分布式架构,对接多种数据模型引擎,防止搭建多品种数据库的多模数据库疾速倒退。

分布式架构逐渐由分库分表中间件向原生分布式倒退 ,以应答不同利用场景。分库分表中间件晚期次要以电商 、社交起家的互联网公司自研为主, 但因为其对简单查问事务的反对较差 ,难以应答业务刹时顶峰需要, 因而更加便捷 、牢靠的原生分布式数据库应运而生 。 依照具体实现形式能够分为两类:以 Greenplum 为代表的支流MPP架构和以Cassandra、HBase为代表的分区分片架构。

开源有助于强化数据库生态建设, 已逐步成为数据库产业的共识。2021年1月,依据DB-Engines ,寰球数据库开源许可证风行度首次超过商业许可证,开源数据库逐步成为行业支流。截至2021年6月, 开源与商业许可证数量别离为198和185个 ,风行度别离 占比51.4% 和48.6% 。开 源有助于扩充人才规模及上下游生态影响力, 通过经营开源社区疾速取得反馈并放慢产品开发、晋升产 品品质,同时反哺社区开发者及独立软件开发商(ISV)等生态搭档,可能达到多方共赢目标。

智能自治成为保障数据库安全可控的重要发展趋势。数据安全是数据库建设的重要前提 ,自动检测、 防备系统故障、 运维爱护和修补安全漏洞对数据库而言至关重要;随着信息化的倒退 ,利用零碎和数据规模井喷式增长,数据库的负载调优压力增 大。因而,解脱对DBA的教训决策依赖,基于人工智能主动执行平安 、备份、 打补丁和其余须要大量人工反复劳作、从根本上彻底消除人为过错、加重DBA工作压力的自治数据库成为历史的必然选择。目前自治数据库仍停留在预先判断阶段,展望未来, 提前预判数据规模增长趋势和数据库负载情况,事先被动调优是自治数据库的倒退新方向。

金融、电信、政务、制作、互联网五个行业为数据库行业上游次要需要畛域,大数据利用疾速倒退为数据库提供增长能源。依据信通院统计,其共计市场份额高达80%以上,2020年整体采购额超过192亿元。此外,依据赛迪参谋,2020年国内大数据市场构造数据 ,其中互联网、政府、金融 、电信 、工业位列前五, 占比别离为48% 、14%、12%、9 %、5%, 共计约88%, 大数据利用与数据库需要构造根本吻合,预计随着大数据应用领域拓展与规模持续增长,将为数据库行业规模增长提供短缺能源。

依据信通院统计,目前我国金融行业海内Oracle与IBM DB 2占比约74 %,占据主导,基于MySQL与PostgreSQL二次开发的国产数据库共计占比约为19%, 国产化仍有广大空间。 其中,咱们通过对金融行业国产化数据库建设案例梳理发现, 国产数据库曾经从边缘系统逐渐实现外围零碎国产化, 显示出国产数据库产品性能 、性能程度一直加强 。预计随着行业信创逐渐落地, 对国产数据库需要将进一步提速。

分布式架构凭借在经济性、平安自主、灵活性、 可伸缩性等方面的劣势,逐渐实现对集中式架构代替。目前,互联网、金融、电信 等行业分布式降级停顿较快,以金融和电信行业 为例,其外围业务数据类型均为关系型数据库, 此类集中式数据库所面临的业务体量将出现爆发性增长。因为繁多硬件能力增长无限,所以无奈依附纵向降级硬件扩大存量数据库能力下限。而分布式数据库采纳多 种模式实现数据的扩散存储,将压力扩散到不同服务器上,并一直通过减少存储或计算节点来实现弹性降级,克服了集中式数据库 的诸多毛病,业界已有分布式数据库在股份制银行、城商行、二三线城市运营商等实现了外围业务零碎的革新落地,同时,去年12 月,腾讯分布式数据库TDSQL落地东吴证券外围交易系统,也标记着分布式数据库在券商外围零碎畛域获得冲破。

墨天轮国产数据风行度排行(截至2022/02), 前十大热门数据库均为分布式架构,其利用场景涵盖各行业,显示出国产分布式数 据库曾经趋于成熟,正成为各行业数据库建设重要抉择。

华为GaussDB是一个企业级AI-Native分布式数据库,将AI能力植入到数据库内核的架构和算法中, 智能诊断 、 索引举荐 , 为 用户提供更高性能、更高可用、更多算力反对的分布式数据库。GaussDB系列基于对立架构,底层选用分布式存储 ,中间层是每个DB特有的数据结构,下层是各个生态接口,反对关系型与非关系型数据库引擎,开启数据库极速与多模交融时代。

OceanBase是由蚂蚁团体齐全自主研发的企业级分布式关系数据库 。OceanBase始创于2010年 , 具备数据强统一、高可用、高 性能、在线扩大、高度兼容SQL规范和支流关系数据库、低成本等特点 。据国内事务处理性能委员会(TPC) 测评 ,OceanBase 在TPC-H榜单中排名第一,是惟一一个在OLTP和OLAP畛域测试均摘取桂冠的国产自研数据库。

PingCAP 成立于 2015 年, 是一家企业级开源分布式数据库厂商,致力于为寰球用户提供稳固高效、安全可靠、凋谢兼容的新型数据服 务平台 、解决方案与征询、技术支持与培训认证服务, 解放企业生产力, 减速企业数字化转型降级。PingCAP 在帮忙企业开释 增长空间的同时,也提供了一份具备高度可参考性的开源建设实际样本。