关于数据库:虎啸龙吟之国产数据库风云榜2022年01月

52次阅读

共计 6401 个字符,预计需要花费 17 分钟才能阅读完成。

绝壁刻字

自古华山一条路,奇险天下第一山。

太阳初升,只见墨老大 (墨天轮) 一身白衣,洒脱飘逸,萧疏轩举,湛然若神,忽见身材霎时横移,不见腿下脚下有任何动作,身材却呈现在几十丈之外,应用的正是移形换位之法。

以后已立于华山百尺峡脚下,墨老大 (墨天轮) 双足下泛起强劲光辉,正是以浅近内力汇于脚下,忽闻一声轻喝,确又如高山炸雷,墨老大起身向上飞起,在那悬崖绝壁处,运指为剑,红色幻影飘忽不定,忽左忽右,刹那间火光四溅,可见轻功和鼎力金刚指已达大成,转瞬已稳稳落地,清风吹过,只服从山壁处传来咔咔声, 碎石从山体脱落,现出矫若游龙般几个大字:“虎啸龙吟天地动,国产 DB 排行来。”。

终于 2022 年虎年 1 月份国产数据库武林大会拉开帷幕。

一战封神

话说数据库界的八大门派【武当派(关系型数据库)、峨眉派(文档性数据库)、崆峒派(键值数据库)、昆仑派(宽列存储数据库)、点苍派(图形数据库、华山派(分布式数据库)、青城派(云原生)、嵩山少林派(时序数据库)】,每月都会加入武林大会。

墨老大 (墨天轮) 顺手拿起百斤铁弓,弓拉满月,铁箭尾端挂一卷轴,刹那间,铁箭如流星般射入绝壁山巅,箭身齐全没入山体,箭尾卷轴天然垂下,原来是 2022 年 1 月份的武林大会 (国产数据库) 排行榜。

众人纷纷低头查看排行榜,榜单前 17 名竟然和上个月放弃不变,其中前五名如下:

第一名:华山派的令狐冲(TiDB 数据库)

第二名:武当派的冲虚道长(openGauss 数据库)

第三名:武当派张三丰(达梦数据库)

第四名:华山派剑宗封不平(OceanBase 数据库)

第五名:青城派余沧海(GaussDB 数据库)

华山派 (分布式数据库) 的令狐冲(TiDB 数据库),更是间断两年排名第一,然而评分较比上个月降落 7.67 分,而第二名到第五名,评分较上个月都有大幅度晋升。

尽管第二名较第一名还差 70 多分,然而回升趋势惊人,第二名武当派的冲虚道长 (openGauss 数据库) 较比上个月上涨了 49.55 分,与第一名华山派 (分布式数据库) 令狐冲 (TiDB 数据库) 分数逐步在拉近。

华山论剑

八大门派【武当派(关系型数据库)、峨眉派(文档性数据库)、崆峒派(键值数据库)、昆仑派(宽列存储数据库)、点苍派(图形数据库、华山派(分布式数据库)、青城派(云原生)、嵩山少林派(时序数据库)】每派文治招式各不相同,现将每派高手进行别离排名。

武当派(关系型)

武当派 (国产关系型数据库) 有 118 人,人数最多。

武力值前 2 名别离是冲虚道长(openGauss)、张三丰(达梦)。

冲虚道长 (openGauss 数据库) 武当剑法更胜从前,2021 年 12 月 28 日,以“汇聚数据库翻新力量 逐梦数字时代星辰大海”为主题的 openGauss summit 2021 在北京线上线下同步举办。大会现场,openGauss 开源社区理事会和技术委员会降级,openGauss 社区分委会正式成立,中国电信公布行业首个云原生关系型数据库 TeleDB for openGauss,中国联通启动基于 openGauss 的数据库自主翻新(CUDB)。

关系型数据库,是指采纳了关系模型来组织数据的数据库,其以行和列的模式存储数据,

以便于用户了解,关系型数据库这一系列的行和列被称为表,一组表组成了数据库。

关系模型能够简略了解为二维表格模型,而一个关系型数据库就是由二维表及其之间的关系组成的一个数据组织。

关系型数据库管理系统 RDBMS 在 E.F.Codd 博士发表的论文《大规模共享数据银行的关系型模型》(Communications of the ACM 杂志 1970 年 6 月刊)根底上设计进去的。

它通过数据、关系和对数据的束缚三者组成的数据模型来寄存和治理数据。

峨眉派(文档型数据库)

记得当年郭襄心中仍牵挂杨过,直到 40 岁那年才忽然大悟,并削发为尼创始峨眉一派,后将掌门的地位传给了灭绝师太,又辗转多个年代,人员凋零,只有国外的 MongoDB、CouchDB 等,国内目前无一人继承峨眉派功夫(文档型数据库)。

文档型数据库是 NoSQL 中十分重要的一个分支,它次要用来存储、索引并治理面向文档的数据或者相似的半结构化数据。

顾名思义,文档型数据库(面向文档数据库)的要害外围概念即文档(Document),它是数据库中最小的单位。

每一种文档型数据库的部署都有所不同,通常来说,它们假设文档以某种标准化格局封装并加密数据,并用多种格局进行解码,包含 XML、YAML、JSON 和 BSON, 当然也包含二进制格局如 PDF、微软 Office 文档等。

MongoDB 是一种面向汇合,模式无关的文档型数据库。

其中数据以“汇合”的形式进行分组,每个汇合都有独自的名称并能够蕴含有限数量的文档。这里的汇合同关系型数据库中的表(table)相似,惟一的区别就是它并没有任何明确的 schema。CouchDB 文档型数据库,能够通过 JSON 格局的 REST 接口进行拜访,应用 JavaScript 作为查询语言。一个 CouchDB 文档就是一个对象,由不同字段组成。字段值能够是字符串、数字、日期,甚至能够是有序列表和关联映射。

崆峒派(键值型)

崆峒派下设飞龙门、追魂门、夺命门、醉门、神拳门五大门。

目前国内只有三家,排名别离是飞龙门关能(TcaplusDB)、醉门宗维侠(Tendis)、神拳门唐文亮(Haisql_memcache)。

飞龙门关能 (TcaplusDB) 一只判官笔乖巧阴柔,令人不敢鄙视,TcaplusDB 是腾讯出品的分布式 NoSQL 数据库,存储和调度的代码齐全自研。具备缓存 + 落地交融架构、PB 级存储、毫秒级时延、无损程度扩大和简单数据结构等个性。同时具备丰盛的生态、便捷的迁徙、极低的运维老本和五个九高可用等特点。客户笼罩游戏、互联网、政务、金融、制作和物联网等畛域。

醉门宗维侠 (Tendis) 醉拳功夫也是炉火纯青,型醉意不醉,云数据库 Tendis 是腾讯云自研、100% 兼容 Redis 协定的数据库产品,作为一个高可用、高性能的分布式 KV 存储数据库,从拜访时延、长久化需要、整体老本等不同维度的考量,完满的均衡了性能和老本之间的抵触,升高业务经营老本,晋升研发效率。云数据库 Tendis 反对主从热备,提供主动容灾切换、数据备份、故障迁徙、实例监控、在线扩容、数据回档等全套的数据库服务。2020 年 12 月,腾讯发表开源 Tendis。

键值数据库是一种非关系数据库,它应用简略的键值办法来存储数据。

键值数据库将数据存储为键值对汇合,其中键作为惟一标识符。

键和值都能够是从简略对象到简单复合对象的任何内容。

昆仑派(宽列存储)

目前有两家宽列存储数据库,排名别离是乾坤一剑震山子(GeminiDB)、昆仑三圣何太冲(iBASE)。

云数据库 GeminiDB 是一款基于华为自主研发的计算存储拆散架构的分布式多模 NoSQL 数据库服务。在华为云高性能、高可用、高平安、可弹性伸缩的根底上,提供了一键部署、备份、监控等服务能力。兼容 Cassandra 等支流 NoSQL 接口,具备高性价比,实用于 IoT、气象、互联网、游戏等畛域。

宽列存储数据库 (Wide-Column Database),也称作可扩大记录存储 (Extensible record Stores) 是一种兼具了宽泛的可应用性、可拓展性、高性能和高可用性的分布式 NoSQL 数据库。

最早由 Google 在其发表的《Bigtable: A Distributed Storage System for Structured Data》论文中提出,HBase, Cassandra 均为被宽泛应用的宽列式存储。

宽列存储数据库也长被称为 宽列存储。在记录中存储数据,可能包容十分多的动静列。

因为列名和记录键都不是固定的,而且一个记录能够有数十亿列,所以宽列存储能够被看作是二维键值存储。

点苍派(图形)

目前有 23 家,前 2 名别离是:点苍一笔林伧夫(TGDB)、小人悠然君无幽(Alibaba GDB)。

腾讯云数图 TGDB 是腾讯云推出的一款原生的分布式并行图数据库,这款数据库可能实现万亿级关联关系数据实时查问,高效治理异构数据,反对实时图计算,助力企业买通数据孤岛。

比照传统的关系型数据库,TGDB 以原生形式实现属性图, 高效存储关联数据, 反对千亿级节点大图的高效查问和关联剖析, 通过反对 PageRank、社群发现、类似度计算、含糊子图匹配等社群发现算法实现高性能图计算, 在解决关联关系上性能晋升了千倍以上。

图数据库是以点、边为根底存储单元,以高效存储、查问图数据为设计原理的数据管理系统。

图概念对于图数据库的了解至关重要。图是一组点和边的汇合,“点”示意实体,“边”示意实体间的关系。

在图数据库中,数据间的关系和数据自身同样重要,它们被作为数据的一部分存储起来。

这样的架构使图数据库可能疾速响应简单关联查问,因为实体间的关系曾经提前存储到了数据库中。

图数据库能够直观地可视化关系,是存储、查问、剖析高度互联数据的最优方法。

与关系型数据库的比照

在关系型数据库设计的时候须要进行严格的数据规范化,将数据分成不同的表并删除其中的反复数据,这种规范化保障了数据的强一致性并反对 ACID 事务。

然而,这也对关系查问带来的限度。

疾速的实现逐行拜访是关系型数据库的设计原理之一,当数据的数据之间造成简单的关联时,跨表的关联查问减少,就会呈现问题。

尽管能够通过将存在不同表中的不同属性进行关联从而履行简单查问,然而开销是十分大的。

与关系型数据库相比,图数据库把关系也映射到数据结构中,对于关联度高的数据集查问更快,尤其适宜那些面向对象的应用程序。

同时图数据库能够更天然的扩大到大数据利用场景,因为图数据库 Schema 更加灵便,所以更加适宜治理长期或一直变动的数据。

华山派(分布式)

目前有 23 家,前 2 名别离是:令狐冲 (TiDB) 和封不平(OceanBase)。

近日,赛迪参谋正式公布《2021 中国分布式数据库最具成长价值企业钻研报告》,报告从技术创新力和市场影响力两个维度对中国分布式数据库翻新企业进行评估,平凯星辰在技术创新力的维度排名第一。

分布式数据库系统(DDBS)蕴含分布式数据库管理系统(DDBMS)和分布式数据库(DDB)。

在分布式数据库系统中,一个应用程序能够对数据库进行通明操作,数据库中的数据别离在不同的部分数据库中存储、由不同的 DBMS 进行治理、在不同的机器上运行、由不同的操作系统反对、被不同的通信网络连接在一起。

一个分布式数据库在逻辑上是一个对立的整体,在物理上则是别离存储在不同的物理节点上。一个应用程序通过网络的连贯能够拜访散布在不同地理位置的数据库。它的散布性体现在数据库中的数据不是存储在同一场地。更确切地讲,不存储在同一计算机的存储设备上。

这就是与集中式数据库的区别。从用户的角度看,一个分布式数据库系统在逻辑上和集中式数据库系统一样,用户能够在任何一个场地执行全局利用。分布式数据库系统是在集中式数据库系统的根底上倒退起来的,是计算机技术和网络技术联合的产物。

青城派(云原生)

以后有 5 家,前 2 名别离是: 余沧海(GaussDB)、极乐真人李静虚(TDSQL)。

TDSQL 是腾讯云企业级分布式数据库,旗下涵盖金融级分布式、云原生、剖析型等多引擎交融的残缺数据库产品体系,提供业界当先的金融级高可用、计算存储拆散、数据仓库、企业级平安等能力,同时具备智能运维平台、Serverless 版本等欠缺的产品服务体系。

云原生数据库,是一种通过云平台进行构建、部署和散发的服务。

这种云原生属性是它相比于其余类型数据库最大的特点。

作为一种云平台,云原生数据库以 PaaS(平台即服务,Platform-as-a-Service)的模式进行散发,也常常被称作 DBaaS(数据库即服务,DataBase-as-a-Service)。

用户能够将该平台用于多种目标,例如存储,治理和提取数据。

云原生数据库通常通过在云基础设施之上装置数据库软件来实现,这种形式使得云原生数据库具备了传统数据库所不具备的间接拜访性和运行时可伸缩性。

随着云原生数据和海量计算的重要性一直进步,人们空前器重通过部署这种服务为企业提供加强的可靠性和可伸缩性。

云原生是一种新型技术体系,是云计算将来的倒退方向。

云原生数据库在海内被称为「Cloud-Native Database Systems」,后面译成中文就是「云原生」,了解云原生先要了解两个关键词——云和原生。

在传统数据库的零碎架构下,必须是紧耦合的设计形式,能力最大效力地施展零碎的劣势。

云就是应用虚拟化的技术将资源池化。

这就是云原生外围逻辑,将不同类型资源解耦,并进行池化。

比方在云原生的计算存储拆散架构下,业务节点能够依据须要自在地对计算、存储进行疾速的扩缩容等操作。

嵩山少林派(时序)

以后有 23 家,前 2 名别离是:少林方丈方证大师 (TDengine)、方生大师(DolphinDB)。方丈方证大师(TDengine) 易筋经力压群雄,是真正的武林泰斗,TDengine 是涛思数据专为物联网、车联网、工业互联网、IT 运维等设计和优化的大数据平台。除外围的快 10 倍以上的时序数据库性能外,还提供缓存、数据订阅、流式计算等性能,最大水平缩小研发和运维的复杂度,且外围代码,包含集群性能全副开源。

时序数据库全称为工夫序列数据库。

工夫序列数据库指次要用于解决带工夫标签(依照工夫的程序变动,即工夫序列化)的数据,带工夫标签的数据也称为工夫序列数据。工夫序列数据次要由电力行业、化工行业、气象行业、地理信息等各类型实时监测、查看与剖析设施所采集、产生的数据,

这些工业数据的典型特点是:

产生频率快(每一个监测点一秒钟内可产生多条数据)、重大依赖于采集工夫(每一条数据均要求对应惟一的工夫)、测点多信息量大(惯例的实时监测零碎均有成千上万的监测点,监测点每秒钟都产生数据,每天产生几十 GB 的数据量)。

基于工夫序列数据的特点,关系型数据库无奈满足对工夫序列数据的无效存储与解决,因而迫切需要一种专门针对工夫序列数据来做优化的数据库系统,即工夫序列数据库。对于时序大数据的存储和解决往往采纳关系型数据库的形式进行解决,但因为关系型数据库天生的劣势导致其无奈进行高效的存储和数据的查问。时序大数据解决方案通过应用非凡的存储形式,使得时序大数据能够高效存储和疾速解决海量时序大数据,是解决海量数据处理的一项重要技术。该技术采纳非凡数据存储形式,极大进步了工夫相干数据的解决能力,绝对于关系型数据库它的存储空间减半,查问速度极大的进步。工夫序列函数优越的查问性能远超过关系型数据库。

恭贺新春

华山论剑已靠近序幕,众派掌门依照八卦阵方位站立与华山山顶,别离站在震卦、巽卦、离卦、坤卦、兑卦、乾卦、坎卦、艮卦地位,气沉丹田,双掌朝上,同时向天空连挥数掌,八股有型的空气波呈现在头顶数丈低空,几个大字在天空缓缓呈现:

瑞雪翩翩丰登景,虎蹄朵朵报春花。

提前祝大家,新年快乐!

备注:文中引入了各种比喻,门派、武侠人物等请勿对号入座。


原文链接:https://www.modb.pro/db/240271

申明:本文为墨天轮作者 陈举超 原创内容,代表作者观点。如您对上述内容有意见和倡议,请在下方评论区指导和交换,或点击作者墨天轮主页留言。*

相干浏览

  • 2022 年 1 月国产数据库排行榜:TiDB 霸榜两年势头不减,openGauss 与 OceanBase 分数大涨
  • 风波再起之国产数据库风云榜 -2021 年 12 月
  • 武林大会之国产数据库风云榜 -2021 年 11 月
  • 国产数据库大事记

墨天轮,围绕数据人的学习成长提供一站式的全面服务,打造集新闻资讯、在线问答、流动直播、在线课程、文档阅览、资源下载、常识分享及在线运维为一体的对立平台,继续促成数据畛域的常识流传和技术创新。

关注官网公众号:
墨天轮、墨天轮平台、墨天轮成长营、数据库国产化、数据库资讯

正文完
 0