共计 3533 个字符,预计需要花费 9 分钟才能阅读完成。
编者注:本系列将抉择一些行业剖析报告进行分享,同时提供下载,与读者独特剖析分享数据库行业的最新进展与动静。关注本公众号回复:下载。能够取得下载链接。
本报告的外围观点:
数据库作为信息化的外围环节,是底层硬件根底资源与下层利用之间的重要撑持。随着海量数据的涌现和剖析能力需要增长,预计将来数据库存储量将呈现重大错配,需要迫切性将显著晋升。
从信息产业链角度来看,数据库作为信息化零碎承前启后的关键环节,向下调用硬件根底资源,向上为应用软件提供重要数据撑持,是信息化两头的外围环节;
从国家政策角度来看,数字经济作为国家“十四五”建设的重中之重,数据作为新型要害生产因素,是推动数字经济倒退的要害一环,同时,国内数据库长期由海内厂商主导,在国内数据库行业疾速倒退下,国产数据库将迎来重要倒退时机。
一直适应市场需求变动,数据库行业正继续进化。报告回顾了数据库 70 年倒退历程,从数据模型逻辑、技术架构、需要性能、部署形式、商业模式、存储介质、治理模式等七大维度对数据库倒退脉络进行具体梳理。咱们发现,因为数据规模、读写需求量等指数级增长,为防止数据冗余与架构的复杂化,叠加分布式架构技术日趋成熟,将多技术、多模型交融成为数据库倒退的重要方向。如将 NoSQL 非关系型的分布式拓展性与关系型数据模型交融诞生的 NewSQL,保留了关系型数据逻辑的同时,大幅晋升了零碎的灵便拓展能力;数据模型方面,将结构化、半结构化、非结构化等多种数据交融的多模数据库正疾速倒退;需要性能方面,将 OLTP 与 OLAP 交融的 HTAP 数据库正逐步成为企业首选等均显示出行业技术交融的倒退特点。
在国内大力发展数字经济建设的大背景下,数据库行业规模将放弃快速增长。依据信通院统计,2020 年中国数据库市场规模为 35 亿美元(约合 240.9 亿元人民币),预计 2025 年市场总规模将达到 688 亿元,CAGR 为 23.4 %。基于对数据库发展趋势与国家政策导向的剖析,咱们认为,将来数据库市场增量需要次要来自于以下三方面:
国产化过程正逐渐减速:通过对金融行业国产化数据库建设案例梳理发现,国产数据库曾经从边缘系统逐渐实现外围零碎国产化,显示出国产数据库产品性能、性能程度一直加强。预计随着行业信创逐渐落地,对国产数据库需要将进一 步提速。
分布式架构凭借在经济性、平安自主、灵活性、可伸缩性等方面的劣势,逐渐实现对集中式架构代替:目前,互联网、金融、电信等行业分布式降级停顿较快,其中金融、电信行业已有分布式数据库在股份制银行、城商行、二三线城市运营商等实现了外围业务零碎的革新落地,同时,墨天轮 前十大热门数据库均为分布式架构,其利用场景涵盖各行业,显示出国产分布式数据库曾经趋于成熟,正成为各行业数据库建设重要抉择。
随着工业互联网、互联网创新型业务、车联网等利用的疾速倒退,非关系型数据库利用将减速落地:非关系型数据库 利用场景不断丰富,如 图数据库可能撑持社交网络、金融反欺诈等互联网新型利用场景的关联剖析业务;时序数据库能够高效存储和疾速解决海量时序大数据,在工业互联网疾速倒退下,传感器与设施产生的大量实时数据,将推动时序数 据库利用疾速倒退等。
从数据模型逻辑、技术架构、需要性能、部署形式、商业模式、存储介质、治理模式等七大维度对数据库倒退脉络进行具体梳理。
在以后关系、非关系并行时代,新型 NewSQL 与多模数据库疾速倒退。传统 SQL 受限于其拓展性,在大数据倒退下逐步面临瓶颈,而 NewSQL 提供了与 NoSQL 雷同的可扩展性,而且仍基于关系模型,保留了极其成熟的 SQL 作为查询语言,从而保障了数据的强一致性;同时,基于分布式架构,对接多种数据模型引擎,防止搭建多品种数据库的多模数据库疾速倒退。
分布式架构逐渐由分库分表中间件向原生分布式倒退,以应答不同利用场景。分库分表中间件晚期次要以电商、社交起家的互联网公司自研为主,但因为其对简单查问事务的反对较差,难以应答业务刹时顶峰需要,因而更加便捷、牢靠的原生分布式数据库应运而生。依照具体实现形式能够分为两类:以 Greenplum 为代表的支流 MPP 架构和以 Cassandra、HBase 为代表的分区分片架构。
开源有助于强化数据库生态建设,已逐步成为数据库产业的共识。2021 年 1 月,依据 DB-Engines,寰球数据库开源许可证风行度首次超过商业许可证,开源数据库逐步成为行业支流。截至 2021 年 6 月,开源与商业许可证数量别离为 198 和 185 个,风行度别离 占比 51.4% 和 48.6%。开 源有助于扩充人才规模及上下游生态影响力,通过经营开源社区疾速取得反馈并放慢产品开发、晋升产 品品质,同时反哺社区开发者及独立软件开发商(ISV)等生态搭档,可能达到多方共赢目标。
智能自治成为保障数据库安全可控的重要发展趋势。数据安全是数据库建设的重要前提,自动检测、防备系统故障、运维爱护和修补安全漏洞对数据库而言至关重要;随着信息化的倒退,利用零碎和数据规模井喷式增长,数据库的负载调优压力增 大。因而,解脱对 DBA 的教训决策依赖,基于人工智能主动执行平安、备份、打补丁和其余须要大量人工反复劳作、从根本上彻底消除人为过错、加重 DBA 工作压力的自治数据库成为历史的必然选择。目前自治数据库仍停留在预先判断阶段,展望未来,提前预判数据规模增长趋势和数据库负载情况,事先被动调优是自治数据库的倒退新方向。
金融、电信、政务、制作、互联网五个行业为数据库行业上游次要需要畛域,大数据利用疾速倒退为数据库提供增长能源。依据信通院统计,其共计市场份额高达 80% 以上,2020 年整体采购额超过 192 亿元。此外,依据赛迪参谋,2020 年国内大数据市场构造数据,其中互联网、政府、金融、电信、工业位列前五,占比别离为 48%、14%、12%、9 %、5%,共计约 88%,大数据利用与数据库需要构造根本吻合,预计随着大数据应用领域拓展与规模持续增长,将为数据库行业规模增长提供短缺能源。
依据信通院统计,目前我国金融行业海内 Oracle 与 IBM DB 2 占比约 74 %,占据主导,基于 MySQL 与 PostgreSQL 二次开发的国产数据库共计占比约为 19%,国产化仍有广大空间。其中,咱们通过对金融行业国产化数据库建设案例梳理发现,国产数据库曾经从边缘系统逐渐实现外围零碎国产化,显示出国产数据库产品性能、性能程度一直加强。预计随着行业信创逐渐落地,对国产数据库需要将进一步提速。
分布式架构凭借在经济性、平安自主、灵活性、可伸缩性等方面的劣势,逐渐实现对集中式架构代替。目前,互联网、金融、电信 等行业分布式降级停顿较快,以金融和电信行业 为例,其外围业务数据类型均为关系型数据库,此类集中式数据库所面临的业务体量将出现爆发性增长。因为繁多硬件能力增长无限,所以无奈依附纵向降级硬件扩大存量数据库能力下限。而分布式数据库采纳多 种模式实现数据的扩散存储,将压力扩散到不同服务器上,并一直通过减少存储或计算节点来实现弹性降级,克服了集中式数据库 的诸多毛病,业界已有分布式数据库在股份制银行、城商行、二三线城市运营商等实现了外围业务零碎的革新落地,同时,去年 12 月,腾讯分布式数据库 TDSQL 落地东吴证券外围交易系统,也标记着分布式数据库在券商外围零碎畛域获得冲破。
墨天轮国产数据风行度排行(截至 2022/02),前十大热门数据库均为分布式架构,其利用场景涵盖各行业,显示出国产分布式数 据库曾经趋于成熟,正成为各行业数据库建设重要抉择。
华为 GaussDB 是一个企业级 AI-Native 分布式数据库,将 AI 能力植入到数据库内核的架构和算法中,智能诊断、索引举荐,为 用户提供更高性能、更高可用、更多算力反对的分布式数据库。GaussDB 系列基于对立架构,底层选用分布式存储,中间层是每个 DB 特有的数据结构,下层是各个生态接口,反对关系型与非关系型数据库引擎,开启数据库极速与多模交融时代。
OceanBase 是由蚂蚁团体齐全自主研发的企业级分布式关系数据库。OceanBase 始创于 2010 年,具备数据强统一、高可用、高 性能、在线扩大、高度兼容 SQL 规范和支流关系数据库、低成本等特点。据国内事务处理性能委员会 (TPC) 测评,OceanBase 在 TPC- H 榜单中排名第一,是惟一一个在 OLTP 和 OLAP 畛域测试均摘取桂冠的国产自研数据库。
PingCAP 成立于 2015 年,是一家企业级开源分布式数据库厂商,致力于为寰球用户提供稳固高效、安全可靠、凋谢兼容的新型数据服 务平台、解决方案与征询、技术支持与培训认证服务,解放企业生产力,减速企业数字化转型降级。PingCAP 在帮忙企业开释 增长空间的同时,也提供了一份具备高度可参考性的开源建设实际样本。