为了帮忙大家及时理解中国数据库行业倒退现状、梳理以后数据库市场环境和产品生态等状况,从2022年4月起,墨天轮社区行业剖析钻研团队出品将继续每月为大家推出最新《中国数据库行业剖析报告》,继续流传数据技术常识、致力促成技术创新与行业生态倒退,目前已更至第五期。
8月《中国数据库行业剖析报告》已正式公布(点击即可跳转,欢送大家下载查阅),本期报告介绍了墨天轮“中国数据库风行度排行”、国内外新品公布以及投融资的最新状况,从前沿动静窥得数据库行业的炽热倒退。
以后,咱们所面临的数据量正呈指数型增长、数据库所面向的场景也更为丰盛,这导致行业对数据实时剖析、并行处理的需要日益崛起。本期报告重点聚焦剖析型数据库的技术架构与演进趋势,详尽剖析MPP、HTAP数据库的架构特点、劣势利用与发展前景,并展现了国产数据库在此方面的冲破与倒退,帮忙大家理解前沿趋势、把握热点技术。
一、数据库排行榜及前沿动静
本章节目录
- 8月中国数据库风行度排名剖析
8月的墨天轮中国数据库风行度排行榜共有236个数据库参加排名,本月榜单前十名的变动能够用“两反超”来概括:openGauss 以12.7分劣势反超达梦重回第二。PolarDB 得分较上月上涨5.9%,反超人大金仓位列第六。此外,排行榜第十八名之后,竞争强烈,动向频繁。在第18名-35名这一赛区,涌现了一批新兴力量,开始锋芒毕露。
8月,排行榜排名规定有所微调,为了更加实在主观地展示各厂商在学术畛域和前沿技术上的成就,特定若其产品在VLDB、SIGMOD、ICDE三大顶会上发表论文,则每篇可额定加2分。此外,从2022年7月起,墨天轮新增了俄罗斯数据库风行度排行榜,现收录了32个俄罗斯数据库,竞相争艳。目前ClickHouse、GigaBASE、Postgres Pro别离位于前三甲。
- 海内外数据库行业倒退动向
自甲骨文和微软于 2019 年单干推出 Oracle Interconnect for Microsoft Azure 以来,至今已有数百家企业在寰球 11 个区域中采纳了这个平安的专用互联解决方案。往年,微软和甲骨文持续携手单干,推出面向 Microsoft Azure 的 Oracle 数据库服务以进一步简化 Microsoft Azure 客户的多云体验。
近期,海内外投融资、新品公布音讯频频。2022年7月5日,滴普科技实现1.1亿 B+ 轮融资;云原生数据库 SingleStore 已实现新一轮1.16 亿美元融资;Snowplow 也实现了4000万美元B轮融资。更多公司介绍、产品特点及其融资历史大家能够通过报告查看。
7月18日, 矩阵起源自研的新一代超交融异构云原生数据库 MatrixOne 0.5 版本正式公布,推出了同时反对TP和AP能力的HTAP存储引擎TAE。7月12日下午,亚信科技召开线上发布会,正式对外公布了 AntDB 数据库 v7.0,具备交融内存、磁盘双引擎以及将业务逻辑整合到数据库服务端执行的新个性。8月10日, OceanBase 召开2022年度发布会、发表产品、服务、生态、开发者利用全面降级,正式迈入 4.0 时代,同时公布业内首个单机分布式一体化架构。大家能够通过报告查看具体内容。
二、MPP 并行技术演进
本章节目录
- 钻研缘起与架构演进介绍
1990 年代以前,日常动静业务解决相干的 OLTP 需要为主,OLAP 并未独立;但尔后,随着数据量一直增多、场景逐步丰盛, 剖析型需要开始遍及,MPP 架构的 OLAP 产品开始呈现;到了2010年代,随同着物联网等技术的倒退,企业对实时数据分析的需要晋升,且OLAP、大数据技术栈一直分化也给企业理论运维治理多套零碎带来挑战, HTAP ( Hybrid Transactional Analytical Processing)混合事务剖析解决数据库的概念也应运而生。
近年来,国内传统数据库厂商、 新锐厂商和私有云等各类厂商纷纷加大了对剖析型数据库的投入和布局。从墨天轮排行榜不难发现,以后SQL关系型数据库152个,占比66%。其中OLTP数据库107个,占比70%, HTAP数据库为23个,占关系型数据库的15%。随着技术一直转型倒退, 国产剖析型数据库将迎来新机遇。本月报告则围绕 MPP、HTAP 技术开展了具体的技术剖析介绍。
接下来,报告对 Shared Everything、 Shared Disk、 Share Memory 和 Shared Nothing 四种次要的数据库构架设计进行了阐释,同时通过对硬件并行架构的分类(多处理器构造 SMP 、非统一存储拜访构造 NUMA 、海量并行处理构造 MPP)及其具体特色的介绍进行了技术溯源展现。
- MPP 数据库基本特征、倒退历程与特点
MPP 即大规模并行处理构造,由多台SMP服务器通过肯定的节点互联网络进行连贯,协同工作,实现雷同的工作。从用户的角度来看是一个服务器零碎, 每个节点只拜访本人的资源, 是一种齐全无共享( Shared Nothing) 构造。MPP 数据库是针对剖析工作负载进行了优化的数据库,以聚合和解决大型数据集,具备弱小的高吞吐、 低时延计算能力。
报告对 MPP 数据库架构的定义、特点、典型产品、倒退历程以及劣势和瓶颈作了具体介绍,此处摘选几张报告截图进行展现,更多内容能够查阅报告全文。
- 将来发展趋势与代际演进历程
尽管传统的数据仓库、 数据湖能满足以后的需要, 然而随着数据量指数型增长,数据湖、智能湖仓未然走上舞台,或者下一代智能湖仓可能帮忙国产数据库迅速抢占剖析型数据库市场,实现弯道超车。本章节末,则对MPP架构到数据湖架构、智能湖仓架构的演进及其具体的架构特点进行了介绍,同时对以后四代剖析型数据库架构的利用场景、数据类型、量级、指标要求及存储资源做了开展剖析。
同时,为了帮忙大家更好地把握 MPP 架构的利用与倒退最新现状,报告选取了 Teradata、Netezza、Greenplum、Vertica 这四款基于 MPP 架构产生的典型产品进行了介绍,通过对其架构图的展现与个性、劣势的剖析,展现 MPP 架构产品的利用场景与倒退状况,欢送大家下载报告浏览。
三、HTAP 交融架构解析
本章节目录
- 钻研缘起与架构演进介绍
随着寰球进入数字化时代,数字化技术渗透到各行各业,同时产生海量数据,数据的存储和利用成为企业决策的重要依据,业务须要实时依据TP的落地数据进行C端疾速反馈,比方实时风控、交易历史明细查问、欺诈监测、千人千面等等,传统的数仓ETL链路长、提早大,很难满足业务疾速多变的诉求,业务场景的变动也掀起了一股HTAP浪潮。这部分内容,报告则展现了 HTAP 诞生的背景与历史沿革,供大家理解 HTAP 技术的演进倒退。
HTAP 个性劣势概述与存储架构、核心技术介绍
混合事务 /剖析解决( (Hybrid Transactional/Analytical Processing)是 Gartner 报告在 2014 年提出的一种利用架构, 它利用内存计算技术在同一个内存数据存储上实现并发剖析和事务处理。这种架构应该打消对提取-转换-加载 (ETL) 流程的需要, 从而减速数据分析并带来微小的业务翻新。本章节对 HTAP 的劣势、个性、利用场景进行了剖析展现。
同时介绍了主行存储+内存中列存储、主列存储+增量行存储、分布式列存储+磁盘行存储、分布式行存储+列存储正本这四种存储架构,以及事务处理、剖析解决、数据同步、查问优化、资源调度五种关键技术,篇幅所限此处仅为大家展现其中几张,大家能够下载报告获取更多内容。
此外,也为大家介绍了市场上最早的分布式HTAP数据库之一——SingleStore (S2DB,以前称为 MemSQL),以及谷歌针对外部的OLTP数据库( F1,spanner等)减少 HTAP 服务实现的分布式系统——Lighting 的相干状况,感兴趣的报告能够查阅报告理解。
报告的最初选取了 SingleStore、TiDB、OceanBase、PolarDB、OushuDB、Apache Doris、MySQL、ClickHouse 等数据库相干典型产品进行了介绍,欢送各位朋友查阅报告理解其倒退、劣势。
本文仅对8月《中国数据库行业剖析报告》的局部内容进行了摘录、整顿,更多残缺、具体内容大家能够下载报告全文理解,也欢送各位数据行业同道交换、探讨、建言献策,咱们一起见证、独特助力中国数据库产业的发展壮大!
报告全文下载地址:https://www.modb.pro/doc/74438
【相干浏览】
- 墨天轮中国数据库风行度排行
- 国产数据库大事记-月度合辑
- 国产数据库排行榜-月度解读
- 《中国数据库行业剖析报告》往期合辑
查看更多精彩内容尽在墨天轮社区,围绕数据人的学习成长提供一站式的全面服务,打造集新闻资讯、在线问答、流动直播、在线课程、文档阅览、资源下载、常识分享及在线运维为一体的对立平台,继续促成数据畛域的常识流传和技术创新。
关注官网公众号: 墨天轮、 墨天轮平台、墨天轮成长营、数据库国产化 、数据库资讯