报告编委
黄勇
爱剖析合伙人 & 首席分析师
洪逸群
爱剖析高级分析师
张良筠
爱剖析分析师
目录
1. 钻研范畴定义
2. 市场洞察
3. 厂商全景地图
4. 市场剖析与厂商评估
5. 入选厂商列表
1. 钻研范畴定义
钻研范畴
在国内数字化转型以及信创建设继续推动的大背景下,泛滥厂商入局国内数据库市场,为企业提供了面向多种利用场景的数据库,以及相干的生态工具或服务。国内数据库市场因而迎来了诸多新的变动,新的产品类型、新的技术、新的服务,以及新的市场格局,而这些变动也让企业在抉择数据库时须要思考更多简单的因素。
在本报告中,爱剖析将数据库市场划分为数据库产品、数据库工具和数据库服务。其中,数据库产品包含各种类型的数据库,如事务型关系数据库、剖析型数据库,以及图数据库、时序数据库等专用数据库等;数据库工具包含各种用于数据库治理运维、开发测试的工具;数据库服务包含征询布局、施行部署等服务。
综合思考细分市场的市场规模、企业关注度等因素,爱剖析在本次钻研中选取了事务型关系数据库、剖析型数据库、超交融数据库、图数据库、数据库云治理平台 5 个细分市场,进行重点钻研。
本报告面向各行业企业的 IT 部门、大数据部门、科技翻新部门,以及相干业务部门的负责人,通过对各个特定市场的需要定义和代表厂商能力解读,为企业数据库布局与厂商选型提供参考。
图 1: 数据库市场全景地图
厂商入选规范
本次入选报告的厂商需同时合乎以下条件:
厂商的产品服务满足各市场的厂商能力要求;
近一年厂商具备肯定数量以上的付费客户(参考第 4 章各市场剖析局部);
近一年厂商在特定市场的营业支出达到指标要求(参考第 4 章各市场剖析局部)。
(注:“近一年”指 2021 年 Q4 至 2022 年 Q3)
2. 市场洞察
2.1 信创政策反对下,国产数据库潜在替换空间大,但以后存量市场整体替换率还较低。
自 2018 年来,国内信创建设逐渐降级,以 Oracle 为代表的国外商业数据库在国内市场日渐式微,国产数据库迎来前所未有的倒退时机。依据爱剖析的估算,2022 年中国数据库市场规模约为 320 亿元,国产数据库潜在替换空间微小。
然而,国产数据库替换目前次要集中在行业的增量市场,在更大的存量市场,因为数据库替换迁徙是项十分繁琐、高老本的工作,且国产数据库在技术积攒、生态成熟度等方面与国外商业数据库还存在肯定差距,国产数据库目前的渗透率还较低。依据爱剖析调研,目前在全行业数据库存量市场,国产数据库的整体替换率约为 10%,而在银行的外围生产零碎,国产数据库的替换率仅有 1% 左右。
图 2: 国产数据库在存量市场的替换率
爱剖析认为,信创带来的国产数据库的替换需要将是长期且不可逆的,且目前正处于减速状态,预计国内数据库的存量市场将在将来 5 -10 年逐渐实现国产化替换,最终国产数据库的替换率将达到 80% 以上。国内数据库厂商在这个过程中要抓住机遇,需在以下几方面着重发力:
1)晋升产品与 Oracle、MySQL 等数据库在语法、性能个性,以及生态工具的兼容性,并提供易用的数据迁徙工具,保障数据库的平滑替换,并升高替换老本;
2)重视生态建设,尤其是重视造就数据库生态服务厂商,数据库利用人才,一个欠缺的数据库生态是企业应用数据库的长期保障。
3)增强技术研发,积攒客户服务教训和场景考验,进步产品化能力,并晋升产品性能和稳定性。
2.2 数据库一直呈现技术交融,新兴行业或新兴业务场景是利用主力。
近年来,数据库技术呈现了显著的交融趋势,一些全新类型的数据库交融了传统的两种或以上类型的数据库的能力,来满足用户的需要。这是因为数据库利用场景正变得更加宽泛,数据类型变得更加多样,而传统的部署多套数据库系统的模式在应用门槛和运维老本方面都很高,这导致了一些新兴的交融型的数据库的呈现,这些数据库次要包含:
1)HTAP 数据库:交融 OLTP 数据库的事务处理和 OLAP 数据库的查问剖析的能力;
2)智能湖仓:交融了数据仓库对数据的高效治理能力以及数据湖对于海量数据的低成本存储能力;
3)超交融数据库:交融了事务处理和查问剖析能力,并能对关系型数据、图数据、时序数据、文档数据等多种数据模型进行对立治理。
交融型数据库通过简化零碎架构,显著升高了应用门槛和运维老本,但其以后用户次要来自新兴行业或新兴业务场景,传统行业企业的传统业务场景对交融型数据库的利用无限。以 HTAP 数据库为例,传统行业企业内的 OLTP 数据库和 OLAP 数据库的利用场景通常在不同的部门,两者在企业外部因为业务分工导致数据库系统的物理隔离,是传统企业以后对于交融型数据库的需要有余的起因。而在新兴行业或新兴业务场景,以先进制作行业为例,智能制作对于工业生产流程的颠覆,使得记录生产过程的大规模数据须要被采集、存储、剖析,以领导自动化和智能化的生产过程,导致这类企业对于智能湖仓、超交融数据库有着较强劲的需要。
图 3: 数据库市场重要趋势
2.3 Serverless 渐成趋势,帮忙用户更快、更便捷地构利用。
数据库的服务状态在一直进化,从最早在本地数据中心自建数据库,到云上的 PaaS 服务,再到云原生数据库,数据库正在往 Serverless 的方向倒退。
Serverless 数据库是指用户在构建和运行数据库时无需对数据库自身以及底层的服务器资源进行治理,并且当用户的业务申请数减少或缩小时,数据库可能主动调度资源,实现弹性伸缩。Serverless 数据库渐成趋势的起因有两点:
1)数据库类型越来越多,数据库的架构也变得越来越简单,开发者学习和应用每种数据库的门槛越来越高,须要 Serverless 来屏蔽数据库技术的复杂度。
2)企业对于数据库的利用需要变得越来越麻利,通过 Serverless 实现数据库资源主动伸缩,并按量计费,越来越成为企业重要的需要。
目前,Serverless 技术处于晚期阶段,可能提供 Serverless 数据库的仅有局部私有云厂商和多数数据库厂商。爱剖析认为,Serverless 将成为数据库倒退的重要趋势,会有更多厂商退出这条路线,其用户根底也会逐步壮大。
2.4 数据库治理平台成为国内数据库生态的重要参与者,AI 自治是数据库治理的重要能力。
随着国产和开源数据库在国内数据库市场的崛起,数据库治理平台成为国内数据库生态的重要参与者。因为数据库治理平台具备数据库装置部署、迁徙、备份、监控告警、巡检、性能剖析、智能运维、平安管控等数据库应用全生命周期治理能力,无效补救了国产和开源数据生态中对数据库治理运维工具绝对缺失带来的诸多不便。
与此同时,数据库治理越来越强调智能化的能力。即在数据库治理中引入 AI 技术,实现数据库治理运维智能诊断、智能优化,升高数据库运维对业余人员的依赖。具体而言,智能诊断是从数据利用、数据库、底层资源不同层面进行诊断剖析,主动定位问题,实现数据库运维的可观测性;智能优化是指针对数据库表构造、集群应用效率等进行条有倡议,晋升效率。
3. 厂商全景地图
爱剖析基于对甲方企业和典型厂商的调研以及桌面钻研,遴选出在数据库市场中具备成熟解决方案和落地能力的入选厂商。
- 市场剖析与厂商评估
爱剖析对本次数据库我的项目重点钻研的特定市场定义如下。同时,针对参加此次报告的局部代表厂商,爱剖析撰写了厂商能力评估。
4.1 事务型关系数据库
市场定义:
事务型关系数据库是指采纳行和列形成的二维表格模型来组织数据,通过关系模型对表进行连贯,并针对数据“增改删”的事务处理而设计的数据管理系统。事务型关系数据库需具备事务的 ACID 个性、并反对 SQL 拜访和解析等性能。
甲方终端用户:
各行业企业的 IT 部门、大数据部门、科技翻新部门,以及相干业务部门
甲方外围需要:
近年来,随着企业数字化转型步入深水区,为了应答数据量爆发式增长、业务场景多样化扩大的趋势,甲方企业对于事务型关系数据库的选型要求也在一直晋升:除了要保障根本的零碎运行稳固及服务的可靠性,也须要数据库具备低劣的性能来更好地反对银行存取转账、电子商务订单等大规模的交易解决场景。此外,随着国家信创政策的一直深入,企业对应用的国外商用数据库替换的需要也一劳永逸,尽可能缩减迁徙改变老本成为甲方企业的次要诉求。具体而言,企业对于事务型关系数据库的外围需要包含:
可能稳固牢靠地运行。作为数据管理系统的外围,企业须要事务型关系数据库具备对外服务响应的灵敏性、整体零碎运行的流畅性和数据服务的可靠性,保障业务零碎可能稳固运行。
数据库服务高可用。许多如银行、电信、政务等行业的重要业务零碎都要求数据库提供 7 *24 不间断服务,须要事务型关系数据库尽可能缩短因为保护或者故障造成的服务不可用工夫。因而,在零碎硬件产生故障、人为出错或者软件报错等状况下,企业须要数据库服务可能在肯定工夫范畴内切换至可用状态,并且保证数据零失落。
具备高性能的事务处理能力。面对数据量爆发式增长、业务场景多样化扩大的趋势,企业须要数据库可能实现海量数据处理的工作,并且反对大量业务人员同时进行读取或写入的事务处理场景。在诸如“双十一”、秒杀流动等高并发的交易解决场景,企业须要数据库可能提供毫秒甚至更短的响应工夫来面对一直增长的业务需要。
要尽可能升高数据库替换老本。因为信创政策对数据库国产化的要求,企业须要对传统应用的国外商业数据库进行替换。在替换过程中,须要尽量减少对原有业务的革新,并且尽可能连续下层利用的应用。此外,自动化的数据迁徙工具也成为企业升高迁徙老本的需要之一。
丰盛的生态资源。企业会对数据库的周边生态有肯定依赖性,因而生态资源的丰盛水平也成为甲方选型的思考因素之一,尤其是周边工具所提供的性能反对。
此外,局部企业对于事务型关系数据库还有以下冀望需要:
在某些行业,事务型关系数据库须要满足信创资质要求。在党政军、金融等须要严格保障信息安全的行业,核心技术须要自主可控来保障安全性。因而,企业须要严格参照信创测试报告或者信创名录来进行数据库选型。此外,因为某些企业曾经进行了国产化软硬件的部署,须要数据库可能在在国产 IT 环境中顺利运行。
厂商能力要求:
基于上述外围需要,数据库厂商需具备以下能力:
厂商提供产品可能稳固地运行在企业的业务环境中,并且保障事务数据的可靠性。具体而言,厂商产品提供数据的充沛冗余,并且保障备份数据的一致性。同时,具备欠缺成熟的机制保障事务处理的一致性。其次,厂商产品被宽泛驳回应用,运行的稳定性失去企业及用户的认可。
厂商产品可能提供高可用的数据服务。厂商产品提供具备齐备的容备灾机制,反对数据的充沛冗余。在数据节点因为硬件故障或人为失误导致不可用时,备灾节点可能疾速切换,保障服务不中断。如果集群无奈提供服务,厂商有其余用于备灾的数据中心对服务进行无损接管,同时要保障服务的切换复原工夫在企业的可承受范畴内。
在性能方面,厂商提供的产品具备事务的高吞吐、横向扩大和并发解决能力,并且反对数据的实时写入和读取。在海量事务处理的场景下,厂商提供分布式部署的事务型关系数据库产品,具备高吞吐能力来升高零碎服务的响应工夫,并且通过横向扩大来撑持一直增长的数据量。在读写高并发的需要下,事务型关系数据库须要具备肯定的并行执行能力,并且通过平衡调配读写负载来反对大量业务人员同时进行查问或写入操作。
厂商数据库产品可能对企业原有数据库进行低成本替换。厂商提供的产品须要对相应被替换的数据库产品语法兼容,保障替换后下层利用的安稳运行,并且不须要进行太多的业务革新。此外,产品配套的迁徙工具也可能升高数据迁徙老本,不便企业做数据库替换。
厂商提供的产品具备肯定的生态资源。厂商的产品具备肯定的周边生态工具和服务,或者可能兼容支流生态,可能满足企业对生态资源的应用需要,尤其是生态中数据库周边工具要可能满足数据库应用全生命周期的性能反对。
针对局部企业的冀望需要,数据库厂商需具备以下能力:
厂商提供的产品须要满足信创的要求。厂商的产品须要通过了相应的信创测试或进入了信创名录,证实了本身技术的自主可靠性。此外,厂商产品对甲方企业应用的国产操作系统、芯片等软硬件进行了相应适配,可能保障数据库系统在国产 IT 环境的安稳运行。
入选规范:
- 合乎事务型关系数据库的厂商能力要求;
- 近一年在该市场服务客户数 10 家以上;
3.近一年该市场相干服务收入规模在 1000 万元以上。
代表厂商评估:
爱可生
厂商介绍:
上海爱可生信息技术股份有限公司(简称“爱可生”)成立于 2003 年,是国内出名的数据库、数据库运维治理平台以及数据处理技术提供商。产品包含关系型数据库云树®数据库 ActionDB、向量数据库 TensorDB、云树®DMP 数据库集群治理平台、云树®DBaaS 和 DaaS 数据中台系列产品等,客户次要散布于金融、电力、智能制作、电信、广电、交通、航空航天等行业。
产品服务介绍:
云树®数据库 ActionDB(简称“ActionDB”)是一款爱可生自主研发的国产关系型 OLTP 数据库,次要利用于高并发、海量数据场景下结构化数据的存储、治理和计算,具备灵便弹性扩大、金融级可靠性、自动化运维治理、多地多核心容灾等个性,实用于高并发、TB 级海量数据及国产化转型场景。目前次要在金融和运营商行业外围业务零碎有大规模的落地。
向量数据库 TensorDB 次要用于非结构化数据的低成本存储和计算,可能将图片、视频等非结构化数据以向量的模式进行示意,并反对向量数据的近似检索,可用于人脸识别、举荐零碎、图片搜寻、视频指纹、语音解决、自然语言解决等波及 AI 利用的各个行业。TensorDB 具备极高的并发检索性能,卓越的程度拓展能力,并提供满足多元业务场景下的高可用能力。
厂商评估:
爱可生云树®数据库 ActionDB 在产品的平安可靠性、分布式性能、MySQL 语法和生态兼容性方面具备劣势,同时可能适配支流国产软硬件,满足企业信创要求。同时爱可生具备较强的数据库服务能力,ActionDB 装备的可视化治理平台和 DBA 专家可能为数据库提供全面的数据库相干服务。
ActionDB 具备满足金融等行业客户要求的平安可靠性,并在此基础上实现了数据库的高可用。在可靠性上,ActionDB 采纳了自研的数据一致性技术和多正本机制保障了存储节点的数据的一致性,在分布式架构下采纳 Raft 协定保障了事务的一致性。在可用性上,存储层数据分片可能实现故障主动切换,反对同城多核心、两地三核心、多地多核心的容灾部署,整体达到“5 个 9”的可用性,在跨数据中心切换时可能实现 RPO= 0 的服务无损接管。
例如,在某大型国有银行外围业务零碎的分布式转型中,爱可生提供了反对大体量高并发场景的分布式数据库解决方案,实现了事务数据的金融级强一致性,并且满足银行业对系统灾备建设的等级要求和个人账户信息等高敏感数据对系统安全性的要求。
ActionDB 通过分布式技术实现了数据库的性能加强,可能反对海量数据、高并发交易的业务场景。在分布式架构下,ActionDB 反对上百 TB 的大体量存储,智能路由调度和自动化分片性能实现了数据库的弹性扩大,产品曾反对过某运营商行业客户电子渠道充值的高并发业务场景,交易量峰值达上亿 QPS。在 SQL 解析计算方面,ActionDB 优化了解析器并将 SQL 翻译为关系代数层面下推至存储节点进行计算,晋升了 SQL 语句解决效率。在并行计算方面,ActionDB 对线程池技术进行了优化,晋升了工作执行的并发度来晋升整体效率。
ActionDB 齐全兼容 MySQL 语法和生态,便于企业进行 MySQL 数据库的国产化替换。在语法兼容性上,ActionDB 兼容 MySQL 语法协定、数据对象和类型、内置函数等,能充沛反对 MySQL 上既有业务的平滑迁徙。在生态兼容性上,ActionDB 连续了 MySQL 技术路线并齐全兼容其生态,不便企业间接应用丰盛的生态工具和技术资源。
ActionDB 适配支流的国产软硬件并通过了多个行业的信创规范测试,可能满足企业对信创的要求。在软硬件适配方面,ActionDB 反对与国产芯片(如飞腾、海光)、中间件、操作系统(如中标麒麟、统信)及上下游软件适配。在行业信创测试方面,ActionDB 参加编写并通过了多个行业的信创规范测试,包含央行上司的金融科技联盟的信创测试、工信部信创数据库规范的测试等。
爱可生为用户提供了可视化数据库治理平台云树®DMP 和数据库相干服务,可能帮忙企业升高运维治理的难度和老本。云树®DMP 提供可视化的数据库运维治理能力,包含装置部署、配置变更监控、告警备份复原、性能诊断、扩缩容 SQL 品质审核、数据迁徙、数据安全等,可能主动解决大部分 DBA 日常工作,升高了数据库运维的难度。同时,爱可生的 DBA 专家也可能提供 MySQL 源码级服务,反对数据库的分布式转型及根底运维等一站式服务。
典型客户:
中国人民银行、中国工商银行、华夏银行、兴业银行、吉林银行
代表厂商评估:
万里数据库
厂商介绍:
北京万里开源软件有限公司(简称“万里数据库”)成立于 2000 年,专一于国产自主可控的数据库产品技术研发,打造了性能、性能、稳定性、易用性当先的一站式数据库产品与解决方案,已服务金融、运营商、能源、政府、交通等多行业重点客户,助力超 1000 个利用场景实现国产化代替与数字化转型。万里数据库领有发明专利、软件著作权百余项,是国家级专精特新“小伟人”企业,已参加多个国家级的数据库行业标准制订工作。
产品服务介绍:
万里数据库 GreatDB 是一款国产自主可控的关系型数据库,可依据用户需要采纳分布式或集中式部署,具备动静扩大、数据强统一、集群高可用等企业级个性,满足业务高并发、高扩展性、高安全性等严苛的事务处理和轻量剖析需要,齐全兼容 MySQL 生态,兼容适配了国产支流操作系统、芯片等根底软硬件,广泛应用于金融、运营商、能源、政府等行业,其衍生的开源分支版本 GreatSQL 可间接对官网 MySQL 进行兼容替换。
厂商评估:
万里数据库 GreatDB 在产品稳固可靠性、MySQL 和 Oracle 技术兼容性、部署灵活性、容备灾能力和服务等方面具备劣势,在分布式和集中式部署下的性能体现能够满足金融、运营商、能源等重点行业多样化的场景需要,同时 GreatDB 可能适配支流国产软硬件,满足企业对信创的要求。
在产品能力上,GreatDB 稳固牢靠且性能体现强劲,具备金融、运营商等多个重点行业外围业务零碎的技术撑持能力,可能满足海量数据、高并发场景下对事务容错性和解决效率的要求。如金融行业,万里数据库服务的全国股份制银行对立领取零碎,部署超 24 个节点,峰值撑持超 2000TPS,采纳同城双活架构实现机房级的高牢靠,确保 RPO=0;运营商行业,万里数据库服务的四川挪动开关机零碎,部署约 10 个节点,峰值撑持超 4500TPS,撑持顶峰订单每日超 2000 万,指令下发量 10000 万,保障全省用户的各类根底业务及增值业务性能的办理开明。
在稳定性方面,GreatDB 通过事务管理器的轻量化和读写快照的无锁化解耦,配合在通信网络技术上的优化,整体升高了网络稳定对事务响应工夫的影响;在可靠性方面,GreatDB 采纳多正本冗余和 Paxos 协定来保障事务数据的强一致性;在容灾备份方面,GreatDB 采纳备份复原机制,同城双活或三活加上异地容灾集群的部署达到了 RPO= 0 和 RTO<60 秒的高可用性。
在性能方面,GreatDB 针对事务处理要求严苛的场景优化了 SQL 并行执行、事务快照保护、正本复制协定等方面来晋升整体性能体现;同时,GreatDB 在小规模配置场景下性能体现良好,在国产鲲鹏等服务器上,用三台机器性能能够达到 100 万 TPMC。
在技术能力上,GreatDB 全面兼容 MySQL 及其生态,同时兼容 Oracle 语法及性能个性,助力企业顺畅实现数据库国产代替。在与 MySQL 的兼容性方面,万里数据库作为原 MySQL 中国研发核心积攒了深厚的技术教训。在语法上,GreatDB 全面兼容 MySQL 的语法和性能个性,可能反对 MySQL 上既有业务的平滑迁徙。在生态上,GreatDB 兼容了 MySQL 生态中数据链上下游的各种工具,可提供面向多元化终端用户的数据库工具链,升高了 GreatDB 用户的工具学习和应用老本。GreatDB 还可能兼容 Oracle 的语法和性能个性,如递归查问、DBLink、窗口函数、序列等,升高了对 Oracle 存量业务替换的老本。如万里数据库服务的河北挪动对立接触库的 Oracle 国产化代替我的项目,基于 GreatDB 的各类 Oracle 语法兼容个性,替换过程中业务保留了大量的 Oracle 个性语法,确保了我的项目周期和迁徙老本可控。
在部署模式上,根据客户不同的业务场景需要,GreatDB 可能采纳集中式或分布式的灵便部署模式。针对海量数据、并发量高的业务场景,客户能够抉择分布式的模式部署 GreatDB,利用并行计算放慢数据处理能力,同时还能保障数据一致性,将来还能按需继续扩容;针对数据量偏小、对稳定性和事务一致性要求极高的业务场景,客户能够抉择应用集中式的部署模式。
在国产生态上,GreatDB 适配支流国产软硬件,满足国家信创要求。GreatDB 与支流国产芯片(如龙芯、申威、飞腾、鲲鹏、海光、兆芯)、操作系统(如麒麟软件、统信 UOS、麒麟信安、TurboLinux 等)和第三方利用等软硬件适配,充沛满足企业在信创方面的需要。
在开源奉献上,万里数据库主导成立了 GreatSQL 社区,助力开源数据库生态。GreatSQL 社区致力于打造国内支流的开源数据库中国根社区,为金融、运营商、能源等泛滥行业客户提供自主可控的开源数据库产品。GreatSQL 数据库实用于金融级利用,能够齐全兼容 MySQL 或 Percona Server。目前,GreatSQL 社区已笼罩 2000+ 技术开发者,被 Gitee 评为“最有价值开源我的项目”。
在技术服务上,GreatDB 领有欠缺的服务体系和丰盛的利用实践经验,能够保障服务响应的及时性和故障解决能力。GreatDB 配套的规范服务包含施行阶段的现场部署、调试,上线之后的故障处理、应急响应等;高配服务提供整体架构解决方案的设计探讨、迁徙过程和业务调试的配合等服务。万里数据库服务过银行、电网、运营商等多个行业的大型头部企业客户,曾为某银行客户提供 MySQL 源码级专家服务。公司在全国设有北京、上海、成都、广州、福州 5 个技术服务中心,分公司服务范畴覆盖全国,充沛保障了服务响应的及时性。
典型客户:
四川挪动、河北挪动、中信建投、国家气象局、首都信息团体
代表厂商评估:
亚信科技
厂商介绍:
亚信科技控股有限公司 (简称“亚信科技”) 成立于 1993 年,是当先的企业级软件产品、解决方案和服务提供商,其软件产品包含数据库和大数据产品、人工智能平台、PaaS 平台、云治理平台等,次要为大型企业数字化转型继续提供端到端的全栈数智化撑持,是国内当先的“数智化全栈能力提供商”,客户波及通信、金融、能源、交通、政务等多个行业。
产品服务介绍:
AntDB 是亚信科技 21 世纪初打造的内核全自研的国产数据库,在通信运营商外围业务零碎安稳运行 15 年,服务全国 24 省市的 10 亿多用户,峰值每秒解决百万笔通信外围交易。目前,AntDB 已倒退为通用型企业级分布式关系型数据库,并在通信、交通、金融、政务等多个行业商用落地。近些年,AntDB 全面融入信创,反对泛滥国产芯片和操作系统,平安、牢靠、易用,并助力上海挪动、云南高速等行业客户率先实现降级革新指标,建立行业信创榜样和标杆。
厂商评估:
AntDB 数据库在产品可靠性、语法和生态工具兼容性、备份容灾、性能、HTAP 能力,信创反对方面具备劣势,可满足用户海量的数据处理和利用平滑迁徙等需要。
AntDB 产品成熟稳固,并领有欠缺的服务体系。AntDB 在通信运营商的生产环境安稳运行了 15 年,服务 10 亿多用户,经验了大量实战验证和技术打磨;在服务方面,亚信领有超过 1 万人的服务团队,由软件工程师组成的现场团队遍布全国各个省市,保障了服务响应的及时性。
AntDB 在 SQL 语法和生态工具上具备与国外开源和商业数据库良好的兼容性,便于企业做数据库国产化替换迁徙。在语法方面,AntDB 内置多模 SQL 解析器,兼容规范 SQL 语法,以及 PostgreSQL、MySQL 和 Oracle 等数据库的语法;在生态工具方面,AntDB 重视与开源生态的兼容性,目前兼容 95% 以上 PostgreSQL 和 MySQL 开源生态的工具,可间接应用丰盛的第三方工具。
AntDB 通过多正本存储和容备灾部署保障了数据库的高可用。AntDB 通过多存储节点实现数据多正本,保障了数据安全和强一致性。同时,AntDB 在部署上采纳“两地三核心”模式,主核心呈现故障后,备核心对业务无损接管达到 RPO=0,异地容灾核心对服务的接管达到 RTO <10 秒。
AntDB 在性能方面做了大量优化,可能反对通信、金融等行业企业高并发、大吞吐量的交易场景。AntDB 分布式版本优化了工作散发、MapReduce 计算框架,升高了计算开销;在局部极其场景,AntDB 分布式版本还进一步引入内存计算,联合相应算法优化,补救单节点的硬件性能有余;同时,AntDB 分布式版本利用两段式提交和内部事务管理机制保障了事务强一致性;AntDB 单机版本在内核层读写拆散,并反对自动化调整读写负载,实现了单机版本 TPMC 最高可达 100 万。
AntDB 反对 HTAP 混合负载,并具备实时剖析能力。AntDB 在一套引擎里同时提供了交易解决和剖析能力,升高了企业部署和运维老本;同时,剖析场景中进一步交融了流解决技术,提供数据被动推送能力,相比传统 HTAP 的剖析形式,业务响应速度失去了晋升,可能撑持企业在营销、库存治理中进行实时的数据处理与剖析。
在某省清分结算零碎中 AntDB 一体化的清分结算业务剖析能力,笼罩数据采集、上传下载、数据处理、清分、清分结算、数据校验、门路拟合、数据查问等业务场景,达到清分结算业务高效进行,推动全省收费公路联网免费工作的平安、有序倒退,助力高速的精细化经营。
AntDB 核心技术自主可控,并融入信创体系。AntDB 外围的存储和计算引擎均来自自研技术,作为信创工委会的成员单位,AntDB 通过了国家信创产品测试和国家实验室代码自主率测试,代码自主率超过 90%;在国产化适配方面,AntDB 和支流国产芯片(如飞腾、龙芯、鲲鹏、海光)、操作系统(如统信、中标麒麟、河汉麒麟、欧拉)等兼容,并适配支流国产第三方工具。
典型客户:
中国移动、中国电信、中国联通、中国邮政储蓄银行
4.2 剖析型数据库
市场定义:
剖析型数据库是指可能对各种起源的结构化数据,以及半结构化和非结构化数据进行存储和计算剖析的数据管理系统。剖析型数据库可能执行即席查问和简单剖析,满足业务剖析或商业智能的需要。剖析型数据库通常采纳列式存储,具备主动索引、总 I / O 较少、利于数据压缩等劣势,极大地晋升了查问性能。
甲方终端用户:
各行业企业的 IT 部门、大数据部门、科技翻新部门,以及相干业务部门
甲方外围需要:
随着数据量越来越大、数据结构更加简单,以及利用场景越来越多样化,业务部门须要解决和剖析一直增长的数据,从中获取有价值的信息。在传统的剖析场景中,业务数据起源较为繁多,企业大多只能对结构化数据进行较为简单的查问剖析,而且,实时数据须要一天甚至更久能力进入数据库并于与历史数据整合,短少了做实时业务决策的数据撑持。因而,企业在当下对剖析型数据库提出了更高的要求。企业对剖析型数据库的外围需要包含:
高效的查问剖析性能。企业个别须要将大量的业务历史数据进行存储,并保证数据的读取效率。在业务剖析的场景中,会波及大量的即席查问和简单剖析,须要随便组合查问条件或者跨多表对数据进行多维度聚合计算。企业须要剖析型数据库具备实现这些简单运算的能力,并且在尽可能短的工夫内取得查问后果。
高可用的数据服务。企业须要剖析型数据库具备肯定的机制来应答服务器故障、操作失误等异样场景,无需人工干预即可主动复原,缩小服务的不可用工夫。
反对多种数据源。随着业务数据结构越来越简单,利用场景更加多样化,企业须要从不同数据起源中获取有价值的信息。因而,企业心愿剖析型数据库具备反对不同数据源、多种数据结构的读取能力。
数据库周边工具。企业须要剖析型数据库周边工具来满足数据库应用中不同的性能需要,例如,企业须要使用 ETL/ELT 工具将数据同步传输至湖仓中;在剖析场景中,数据荡涤、数据挖掘等周边工具可能辅助业务人员疾速实现剖析需要。
此外,局部企业对于剖析型数据库还有以下冀望需要:
对人工智能利用的反对。近年来,随着人工智能在剖析场景中的大量利用,企业也须要剖析型数据库更好反对 AI 模型训练时大量简单数据的读取能力,并可能通过肯定的 AI 运算能力加强数据挖掘解决的效率。
厂商能力要求:
基于上述外围需要,剖析型数据库厂商需具备以下能力:
厂商提供的产品可能进行高性能的数据存取,并且反对即席查问以及简单剖析。为了满足企业大量历史业务数据的存储需要,厂商产品须要提供高效的列式存储和数据读取能力,在分布式下可能动静扩大反对数据的一直增长。此外,要可能反对查问条件的任意组合,满足业务灵便的查问需要;并且具备跨多表、多维度聚合计算的能力。
厂商产品反对多数据源。厂商产品提供数据源接口,可能对多种数据源,如 Oracle、MySQL、HDFS 等,进行读取。在更现实的状况下,厂商产品可能反对数据联邦,在不须要对数据进行整合的前提下对多源异构数据的进行对立的查问剖析。
厂商提供丰盛的周边工具来反对多项数据库应用的性能需要。数据库的配套工具可能更好地反对产品的应用,尤其 ETL/ELT 工具可能反对与数据湖仓连贯传输需要。或者,厂商产品提供标准化接口,可能对接支流利用工具。
针对局部企业的冀望需要,数据库厂商需具备以下能力:
厂商产品可能反对 AI 的相干利用。数据库须要具备肯定的数据处理能力,反对 AI 模型训练时的数据读取工作,尤其是对向量、矩阵等简单数据结构的存取。此外,数据库自身须要具备肯定的 AI 运算能力来加强数据挖掘解决的效率。
入选规范:
- 合乎剖析型数据库的厂商能力要求;
- 近一年在该市场服务客户数 10 家以上;
3.近一年该市场相干服务收入规模在 1000 万元以上。
代表厂商评估:
柏睿数据
厂商介绍:
北京柏睿数据技术股份有限公司(简称“柏睿数据”)成立于 2014 年,是一家以数据库为外围的“Data+AI”数据智能根底软件公司,国内首家因冲破数据库核心技术而取得国家级专精特新“小伟人”名称的民营企业。柏睿数据作为国内把握全内存数据库引擎要害专利的企业,基于齐全自主研发的全内存分布式数据库产品体系和人工智能产品体系,打造软硬一体化智能数据处理平台,其产品在算力性能、智能化、安全性、标准化等要害技术指标上均业界当先,已为金融、政务、能源、通信、医疗等泛滥行业标杆客户提供原创性数字化转型技术产品服务。
产品服务介绍:
RapidsDB 是柏睿数据自主研发的基于分布式架构的全内存剖析型数据库,具备残缺的数据库管理系统特色,提供高效齐备的数据库治理性能,次要包含高性能、高可用、反对海量数据、利用开发环境、运行环境和管理工具等产品个性和技术性能。RapidsDB 提供对各种数据源的对立 SQL 拜访,包含关系型和非关系数型数据。同时兼容 MySQL 语法,能够用 RapidsDB 本身提供的程序或者 MySQL 驱动。目前在金融、通信、政务、医疗、能源、工业互联网等行业实现了业务场景的落地。
厂商评估:
RapidsDB 分布式全内存数据库具备高效的数据存取和横向扩大能力,可能保障存储数据的精确可靠性,并提供继续可用的数据服务。RapidsDB 联邦层接口可能连贯多源异构的数据,并在无需进行数据交换整合的状况下即时查问。同时,RapidsDB 在内核层具备了 AI 的运算能力,并借助机器学习实现了查问的动静优化。此外,RapidsDB 装备了 ELT 及其他剖析型数据库周边工具,可能反对数据挖掘、数据治理等多项业务需要。
RapidsDB 是基于分布式架构的内存数据库,具备高效的数据存取、横向扩大能力,可能实现在高并发、跨多表的简单查问等剖析场景的即时响应。RapidsDB 采纳基于内存的行列混合存储技术,内存存储可能避开数据拜访磁盘时的 I / O 限度来达到更快的存取速度,并配合数据压缩和格局优化达到更高的 CPU、GPU 等硬件资源利用率。分布式架构可能按需动静扩大,反对日增 20TB 数据量的实时采集与剖析。同时,RapidsDB 的分布式查问优化器可能平衡调配节点负载,数据结构的无锁化容许高吞吐量的并发读写,整体达到 100TB 全内存数据量剖析 500/ 秒并发,TB 级数据毫秒级响。在简单的跨多表查问场景下,布隆 Join 通过连贯布隆过滤器来排除优化不必要的数据交互,晋升了节点之间的数据传输效率。此外,RapidsDB 将查问打算编译为机器代码执行并且缓存,不仅晋升了代码执行效率,而且使得雷同构造的后续查问可能疾速进行。
RapidsDB 具备高可靠性,可能反对金融、政务等行业重要业务零碎数据服务的继续可用。RapidsDB 提供主副两个可用性组,主副组之间通过数据实时同步来保障一致性。集群节点以成对的配置模式在彼此之间共享数据正本,当某个节点呈现故障时可能主动进行故障转移,保障数据服务的继续可用。此外,RapidsDB 反对内存数据长久化,提供齐备的备份与复原措施,在内存存储数据之外,服务器会在磁盘中保护数据正本避免数据谬误或者失落。
RapidsDB 的数据联邦技术支持用户通过对立接口层在无需对数据进行替换整合的前提下实现对多源异构数据的即时剖析。RapidsDB 内置智能化联邦连接器,可能与多种数据库或数据源相连接,包含 Oracle、PostgreSQL、Greenplum 连接器、流数据连接器、JDBC 连接器、HDFS Hive 连接器等,反对不同起源数据对象在不替换整合的状况下在繁多 SQL 中的查问。自适应查问下推机制可能根据数据源特色将局部执行打算下推至底层执行来晋升整体效率。同时,RapidsDB 优化了本身的联邦查问技术,利用人工智能和动静优化技术实现了分布式架构以及数据加密状态下的的高效门路估算,大大晋升了查问效率。
RapidsDB 装备了 ELT 等剖析型数据库周边工具,可能满足企业数据挖掘、数据治理等多项业务需要。RapidsDB 配套了 ELT 相干工具,反对数据荡涤、增量数据抽取、流式解决、批处理等多项性能,可能为企业 BI 业务提供数据撑持。此外,RapidsDB 的工具生态中还有数据挖掘等周边工具,不便对入库 / 湖数据进行解决和剖析。在数据治理方面,数据血统治理、数据关系常识图谱、虚构数据路由治理等性能反对用户对企业外部各种数据格式和不同数据源对立通明的拜访,提供了自助创立业务视图、平安认证、鉴权等一系列操作。
柏睿数据作为一家“Data+AI”的技术公司,在 RapidsDB 内核层集成了多项 AI 优化能力,同时数据库自身也提供 AI 模型训练所需的特色库性能。RapidsDB 的外围引擎具备了 AI 的运算能力,包含对简单数据结构及相应算子的反对。基于 AI 和机器学习算法,柏睿数据自主研发出了动静查问优化技术,动静查问优化可能依据数据分布特色事后捕捉不同列或表之间的相关性,并主动插入条件语句来实现优化查问打算,从而失去更准确的查问后果。同时,RapidsDB 还提供 pandas 人工智能的 API,在数据库内核层实现智能化数据挖掘、数据荡涤以及 SQL 加强,能够作为机器学习中的特色库来更好反对地模型训练中的后期数据筹备工作。
典型客户:
中国移动、南方衰弱
代表厂商评估:
睿帆科技
厂商介绍:
广州睿帆科技有限公司(简称“睿帆科技”)成立于 2015 年,是以大数据及人工智能核心技术为客户提供平台产品及服务的高新技术型企业,公司领有来自 Teradata、华为、阿里、摩托罗拉、Nokia 等机构的大数据技术团队,以及自主翻新的数据智能全生命周期产品体系,在海量数据治理与计算方面有着深厚的技术积淀。多年来曾经服务过通信、公安、轨道交通、政务、金融、应急等行业。
产品服务介绍:
SnowballDB 是睿帆科技自主研发的用于联机剖析解决 OLAP 的 MPP 列式数据库管理系统,SnowballDB 提供 PB 级别大数据集的在线多维查问和分布式存储,实用于海量结构化数据存储、高并发点查问、高吞吐即席查问和多维实时剖析场景。目前次要在运营商行业有广泛应用,SnowballDB 服务过北京挪动、四川挪动等大型客户,并且在轨道交通、公安、金融、政府、应急等行业有落地利用。
厂商评估:
SnowballDB 具备大规模数据量、高并发场景下的即时查问剖析能力,可能保证数据正本的最终一致性,提供高可用的数据服务,尤其在运营商行业领有丰盛的实践经验。此外,SnowballDB 提供多种装置部署形式、可视化监控治理平台和数据库周边工具,反对 SQL 查问和多种函数。SnowballDB 能够作为独立的 OLAP 引擎,或者与 Baymax 大数据迷信平台联合形成大数据仓库解决方案。
SnowballDB 提供 PB 级剖析数据的列式存储,反对数据的实时在线查问剖析,尤其在运营商等行业超大数据规模、高并发、低时延要求的场景下具备劣势。
在超大规模数据的查问剖析场景下,SnowballDB 通过对列式存储格局和数据压缩技术进行重构,缩小了数据存储空间和 I / O 资源耗费,晋升了查问速度,达到每秒上亿行的吞吐能力。同时,SnowballDB 采纳向量化执行技术,能够跳过不必要的数据,仅加载必要的列数据来最大化 CPU 的资源利用率,以此取得更高的吞吐能力。
在高并发、即席查问的场景下,SnowballDB 反对上千台节点的的线性扩大;MPP 集群采纳 Share-nothing 节点架构,读写操作能够在多个节点并行执行,并且通过主动平衡节点负载来大幅晋升集群整体性能;而且 SnowballDB 反对写入和查问同时进行,容许在数据库运行时创立表、加载数据和执行查问,无需重新配置或重启服务。
此外,SnowballDB 外围代码采纳 C ++ 开发,执行速度快于 Java 语言编写的数据库;LLVM 动静编译可能依据数据和硬件配置,动静生成优化的机器代码,极大进步代码执行效率。
例如,SnowballDB 的某省级运营商客户服务笼罩近亿用户,单日增量数据超过 500T。利用 SnowballDB 提供的 PB 级联机剖析能力,使各业务部门能够自主进行海量数据的在线查问和多维分析。同时,SnowballDB 反对多人多地高并发查问的需要,解决了数据更新不及时、查问响应提早高、剖析维度受限等问题,大幅提高了该运营商客户数据服务的效率和程度。
SnowballDB 可能提供牢靠的数据正本的最终一致性,容灾机制保障了数据服务的继续可用。SnowballDB 具备多正本备份性能,能够在不同的节点上保护雷同的数据,正本内数据发生变化时零碎会以异步的形式同步至其余正本,达到所有正本数据的最终统一来保障服务的可靠性。如果节点如产生故障,则主动切换由备份正本提供服务,保障数据服务的继续可用。此外,SnowballDB 反对数据跨核心备份,数据可能主动同步复原,实用于重要零碎的跨核心灾备体系。
SnowballDB 在数据库的装置部署、应用等方面具备高易用性,配套工具提供了多样灵便的应用形式,剖析人员能够应用 SQL 语句进行疾速查问剖析。
SnowballDB 反对多种装置部署和监控治理形式,能够通过 Ambari 开源平台的图形化装置配置和 RPM 安装包等形式进行装置部署;SnowballDB 配套了可视化的监控治理平台,可能对集群节点施行监控预警,展现资源应用和运行状态等多项指标,提供包含数据库治理、用户治理、集群治理、正本配置管理在内的数据库应用全生命周期的性能反对。
SnowballDB 配套了齐备的命令行客户端、数据备份、数据迁徙、数据导入导出等工具,并且反对 JDBC、ODBC 连贯,能够不便对接各类支流可视化平台和 BI 工具。
为了帮忙剖析人员疾速上手应用,SnowballDB 内置了多种表引擎,能够间接拜访 HDFS / Kafka / MySQL 等内部数据源,并且提供欠缺的 SQL 反对和多种高级函数,可能进行简单查问和多维分析。
SnowballDB 能够作为独立的 OLAP 剖析引擎,或者与 Baymax 大数据迷信平台联合提供数据仓库提供服务,实用于多样的大数据利用场景。SnowballDB 通过接口和客户端,能够作为独立的 OLAP 引擎提供数据服务。或者,SnowballDB 能够联合 Baymax 的全息数据集成和开发利用能力形成大数据仓库的解决方案,Baymax 大数据迷信平台基于 Hadoop 框架,适配各类结构化、半结构化、非结构化数据,可能通过数据处理性能构建对立标准的数据池,并利用数据编排工具将剖析所需数据推送至 SnowballDB,由 SnowballDB 提供查问剖析服务。
典型客户:
北京挪动、四川挪动、广东省公安厅机场公安局、广州市公安局白云区分局
4.3 超交融数据库
市场定义:
超交融数据库是指在内核层面采纳模块化和插件化的架构,通过插拔不同类型的数据引擎,实现对不同模型数据进行解决能力的数据库。超交融数据库可能反对用户在一套零碎中对立解决关系、图、时序、文档等多种模型的数据,并同时具备事务和剖析解决、流和批处理的能力。
甲方终端用户:
金融、制作、泛互联网行业企业的 IT 部门、大数据部门、科技翻新部门,以及相干业务部门
甲方外围需要:
随着企业业务类型以及数据利用场景的多样化,对多种数据模型进行解决变成了企业的常态化需要。在传统的解决方案中,企业会针对不同数据模型,不同利用场景部署多种类型的数据库系统,但这种形式会造成用户在跨数据库做联结剖析时操作流程非常复杂,并且多套零碎的保护老本也很高。因为超交融数据库可能使用户用一套数据库系统满足对多种模型的数据进行解决的需要,并在保障性能的前提下简化了零碎架构,升高了运维老本,近年来正被一些当先企业所采纳。企业对超交融数据库的外围需要包含:
可能在特定业务场景中反对对所需的多种数据模型进行解决。如在营销场景中对人群偏好进行剖析时,企业须要数据库反对对关系型数据、图数据、搜索引擎等模型数据进行联结剖析;在高端制造业有大量物联网设施的生产场景,企业须要数据库反对对关系型数据、时序数据进行联结剖析,并反对事务处理。
在反对多种数据模型的前提下,数据库的应用和运维尽量简化。在数据查问剖析方面,企业须要数据库反对应用对立的查询语言来简化跨模型的联结剖析,升高对用户的技能要求。在数据库运维方面,企业须要数据库简化其零碎架构,无需针对不同数据模型建设不同的开发和运维体系。
具备与专用数据库等同或更高的性能。因为目前企业次要是在一些新兴的业务场景中采纳超交融数据库,而这些场景通常具备数据量大,对于查问剖析后果的时效性要求低等特点,因而,企业在这些场景中应用超交融数据库须要防止数据库为反对多模型数据的而就义数据库的运行效率,从而取得较高的数据查问剖析的性能。
能与支流的数据库生态在肯定水平上凋谢和兼容。为了与企业外部存量业务和数据系统进行对接,超交融数据库须要反对凋谢的标准接口,满足用户跨零碎的数据迁徙、ETL 需要,以及可能与常见的计算引擎无缝对接;同时,超交融数据库须要与罕用第三方数据库生态工具兼容,满足数据库运维治理中的诸多性能需要。
产品稳固牢靠。与企业对其它数据库产品的要求一样,企业应用超交融数据库时同样须要其产品稳固牢靠,防止应用过程中呈现系统故障、数据失落等问题。
厂商能力要求:
为满足外围需要,超交融数据库厂商须要具备下述能力:
厂商的产品可反对解决多种罕用的数据模型,并且不同数据模型之间可能互通互融。为满足企业多种特定业务场景数据分析需要,超交融数据库须要反对关系型数据、宽表、图、时序、文档、队列等常见数据模型,并且这些数据模型之间能够互通互融,使得企业能够通过对立的查问引擎对多模型数据进行联结剖析。
可能在数据库中采纳创新性的零碎架构来简化运维复杂度,并晋升其运行效率。具体而言,厂商须要可能在数据库内核层采纳模块化的形式,反对插拔针对不同数据模型的存储引擎和执行器,并应用对立的数据存储、对立的 SQL 拜访接口,从而简化零碎架构,便于企业后续扩大新的数据模型,以及大幅升高数据库运维的难度。
可能针对不同数据处理需要优化做相干技术优化,取得较高的性能体现。如针对时序场景的写入及查问、单表查问、多表关联剖析、机器学习以及 OLTP 等数据处理需要,厂商在对其进行性能优化后,其性能能够比常见的专用数据库或大数据引擎,如 InfluxDB、Clickhouse、HBase、Spark 等雷同或更高。
厂商的产品可能对支流的数据库生态凋谢和兼容。超交融数据库须要兼容多种开源标准接口,如 HBase、OpenTSDB、Solr 等,并提供数据迁徙工具,便于企业对数据进行迁徙,实现业务无缝连接。同时,超交融数据库须要与罕用数据库,如 Greenplum、PostgreSQL 等的生态工具兼容,满足企业对于超交融数据库的运维治理需要。
厂商的产品稳固牢靠,且通过肯定企业用户在业务场景中的验证。具体而言,厂商产品须要取得肯定数据库企业用户的采纳,并在理论的业务场景中可能稳固牢靠的满足用户需要,取得企业用户的认可。同时,厂商须要在产品中提供多正本存储、企业级备份能力等,保障数据的可靠性。
入选规范:
- 合乎超交融数据库的厂商能力要求;
- 近一年在该市场服务客户数 5 家以上;
3.近一年该市场相干服务收入规模在 500 万元以上。
代表厂商评估:
YMatrix
厂商介绍:
北京四维纵横数据技术有限公司(简称“YMatrix”) 成立于 2020 年,是一家创新型根底软件公司,致力于物联网时代新一代数据基础设施软件的研发,并提供相干产品、解决方案及一站式商业服务。公司在业界率先提出超交融数据库理念,并公布了 YMatrix 超交融数据库,基于独创的多微内核凋谢架构,在繁多数据库之上,实现多模态数据的融通治理,及全场景查问剖析的对立反对。
产品服务介绍:
YMatrix 超交融数据库(简称“YMatrix”)是同时反对在线事务处理(OLTP)、在线剖析解决(OLAP)和物联网时序利用的分布式超交融数据库产品,具备严格分布式事务一致性、程度在线扩容、安全可靠、成熟稳固、兼容 PostgreSQL / Greenplum 协定和生态等重要个性。在万物互联的时代,YMatrix 可面向物联网利用、工业互联网、智能运维、智慧城市、实时数仓、智能家居、车联网等场景,提供架构简洁、功能丰富的数据基础设施,并已在多家行业头部公司胜利实现商业化落地。
厂商评估:
YMatrix 超交融数据库产品稳固牢靠,反对关系数据、时序数据、GIS 数据、JSON 数据、文本数据、图片等多类型数据的对立解决,简化技术架构,从而升高企业在数据库选型、应用和运维时的老本。YMatrix 超交融数据库在 OLAP 和时序数据处场景具备突出劣势,实用工厂数据基座、智能网联汽车、物联设施智能经营、实时数据仓库等场景,且能保障较高的性能。同时,YMatrix 具备较欠缺的数据库生态工具。
YMatrix 超交融数据库产品稳固牢靠,且经验过大规模工业生产场景的应用和验证。YMatrix 产品是在剖析型数据库 Greenplum 和关系型数据库 PostgreSQL 的根底上,做了大量原创性研发工作而构建。因为 Greenplum 和 PostgreSQL 技术稳固成熟,且 YMatrix 的研发团队曾有 Greenplum 的研发教训,因而 YMatrix 的稳定性和可靠性得以保正。同时,YMatrix 曾经在工业生产场景经验过多家头部企业的应用和打磨,使得其针对工业场景的产品性能稳固、功能完善,利用能力较强。
YMatrix 超交融数据库功能丰富,反对多种数据模型,尤其实用于 OLAP 和时序数据处理的场景。YMatrix 内置多个微内核数据引擎,实现了对关系型数据、时序数据、JSON 数据、键值数据、GIS 数据、文本、图像等多种数据模型的广泛支持,并在数据操作层面反对以规范 SQL 实现跨数据模型的写入、建模、查问等操作。YMatrix 尤其实用于 OLAP 和时序数据处理的场景,如车联网、智能制作、智慧能源、智慧交通、智慧城市等畛域,可利用于工厂数据基座、智能网联汽车、物联设施智能经营、实时数据仓库等场景。
YMatrix 超交融数据库技术架构简化灵便,大幅升高了企业须要运行多种类型的数据库选型、部署以及后续的运维老本。YMatrix 采纳了翻新的“多微内核凋谢架构”技术架构,实现了数据库的“多核“,面向 OLTP、OLAP,时序等场景,每个内核由不同的存储引擎和执行器组成,并针对前述场景专门优化。
基于这样的架构,企业后续能够通过 YMatrix 减少面向新场景的微内核,不便地进行数据分析场景的扩大,防止从新选型和部署一整套新数据库的高老本。同时,YMatrix 装备了欠缺的装置、监控、报警、扩容、容灾等数据库治理运维性能,并能够对多种数据模型进行对立治理,大幅升高了企业部署多套数据库系统的运维复杂度以及运维老本。
例如,现实汽车在引入 YMatrix 后,在等同数据规模下,整体服务器用量缩小三分之二,指标开发周期从按天计算大幅压缩至小时级,同时数据入库速度及查问性能均大幅晋升。
YMatrix 超交融数据库在时序等各类数据应用场景具备较优异的性能体现。YMatrix 针对写入和剖析等重点畛域进行了多达 138 项深度的指令级的优化。在时序场景的写入能力上,YMatrix 在实在的生产场景中写入速度可达 1.52 亿数据点 / 秒,满足了新能源汽车(现实汽车)、重型配备制作(三一重工)等行业客户对于超大规模时序数据的写入速度要求。在时序场景的查问性能上,YMatrix 的查问耗时在基准测试中是目前国外支流时序数据库的 1 / 5 左右;
此外,在单表查问性能上,SSB 基准测试结果表明 YMatrix 比 ClickHouse 快 27%;在多表关联剖析性能上,比照 MPP 数据库支流厂商,YMatrix 实现了数倍的性能晋升;在机器学习场景性能上,YMatrix 库内机器学习性能相比 Spark 晋升了 8 倍;在 OLTP 场景下,TPC- B 国际标准测试结果表明,YMatrix 主键查问 TPS 高达 160 万,而绝大多数低于 TPS5 万的水准。
YMatrix 超交融数据库反对库内机器学习,生态兼容齐备,能够满足企业用户多种类型的数据分析需要。YMatrix 是国内率先具备库内机器学习建模能力的数据库产品,反对通过 Python/R 等语言构建算法模型,并间接在数据库内进行剖析运算,帮忙用户大幅打消数据的迁徙 / 加载作业量,显著晋升数据利用效率。
例如:三一重工在预测性保护业务中建设须要基于大量设施数采数据做建模剖析,在应用 YMatrix 后,相比过来的 Hadoop + Spark 组合,不仅技术栈复杂度升高,同时运算速度晋升了约 5 倍。同时 YMatrix 全面兼容 Greenplum 和 PostgreSQL 的上下游生态链工具,并反对通过数据联邦对接多类型数据源,满足企业用户在各种简单剖析场景下的数据迁徙、ETL、监控及分层存储需要。
典型客户:
现实汽车、小米、三一重工、浪潮、BYD
4.4 图数据库
市场定义:
图数据库是以点和边为根本存储单元,为高效存储、查问图模型的数据而专门设计的数据管理系统。在图模型中,数据是以点和边的模式存在,“点”示意实体,“边”示意实体间的关系,从而能够清晰展示数据间的关联关系。图数据库须要将数据以丰盛的关联关系示意、反对图查询语言的拜访和解析等性能。
甲方终端用户:
金融、政务、能源、泛互联网等行业企业的 IT 部门、大数据部门、科技翻新部门,以及相干业务部门
甲方外围需要:
随着企业业务类型以及数据利用场景的多样化,对于数据之间的关系开掘逐步成为典型的业务需要。企业须要将看似离散的数据通过肯定的关联关系进行连贯,并使用可视化技术形容数据之间的互相分割。例如,常识图谱、金融反诈、社交网络、智能物联网等业务利用下,须要对图数据进行高效的查问和计算。因为图数据库相比传统的关系型数据库具备对图模型数据更加高效的存储和查问性能,近年来被许多企业所采纳。企业对图数据库的外围需要包含:
高性能的图存储和计算。金融、政务、能源等行业有大量图模型的利用,例如金融风控、反欺诈、能源管理等。企业心愿图数据库相比关系型数据库领有更高的图模型存储效率和更低的存储老本,并且在多度关系或者多点遍历的简单关系查问上更具备劣势。
疾速上手的查问剖析性能。因为图数据库目前没有对立的规范查询语言,并且图剖析的应用对于专业知识的要求程度较高,业务剖析人员可能会短少相干的常识技能上手应用。因而,企业须要图数据库具备肯定的功能设计来升高图数据库的应用门槛,不便图数据的查问剖析以及图算法的利用。
具备高可用和肯定的稳固可靠性。企业须要图数据库具备肯定的防备和复原措施来应答突发的服务中断状况,保障数据服务的高可用性,防止数据谬误、数据失落的产生。同时,作为图数据利用的底层撑持,企业心愿图数据库可能平滑稳固的运行,并且具备肯定的服务响应灵敏度。
此外,局部企业对于图数据库还有以下冀望需要:
可能反对行业常识图谱。作为图数据最根本和宽泛的利用,常识图谱在金融、公安等行业有大量的应用需要。因而,企业心愿图数据库厂商可能提供行业常识图谱的整体解决方案。
可能进行云化部署。因为数据上云趋势逐步显著,局部企业心愿将图数据库同其余数据库一起在云上部署,不便总体资源的布局和治理。
满足信创要求。在公安、政务等敏感度较高的行业,企业须要应用核心技术自主可控的产品来保证数据的安全性,因而会根据信创测试报告或信创名录进行选型。
厂商能力要求:
基于上述外围需要,图数据库厂商需具备以下能力:
厂商的产品具备高性能图存储和计算能力。厂商产品可能通过分布式部署实现大规模的图数据存储,并且保障高效的图数据拜访读取。在对于数据关系的剖析上,厂商产品要可能实现全图查问、遍历迭代的高效性,并且可能实现多样的图剖析算法。
厂商的产品具备易用性。在图数据的查问上,厂商产品的查询语言可能让用户疾速上手应用,并且须要反对罕用的图算法。此外,厂商需提供可视化剖析工具以及罕用的剖析函数,使得业务用户能够通过利落拽的形式在罕用场景,如信用卡套现、贷后失联修复、客户贡献度评估等,疾速实现图剖析性能。
厂商产品可能稳固牢靠地运行,并且继续提供可用的服务。厂商产品具备肯定的数据冗余机制,满足分布式下的数据一致性,而且在服务器呈现故障时可能保证数据不失落且服务继续可用。此外,厂商产品通过多场景的打磨验证,可能满足金融、政务、能源等行业不同利用场景下对于图数据库稳固牢靠运行的需要。
针对局部企业的冀望需要,图数据库厂商需具备以下能力:
厂商可能提供针对不同行业提供常识图谱解决方案。厂商可能根据行业需要提供金融、政务、能源等行业的常识图谱解决方案,输入包含图谱构建、开发工具等在内的常识图谱整体解决方案。
厂商的产品可能采纳云原生技术。面对企业数据上云的需要,厂商须要提供图数据库的云化部署,并且利用云原生技术实现企业资源隔离、多租户等需要。
厂商的产品要满足信创要求。在敏感度较高的行业,厂商产品须要通过信创测试来证实技术的自主可靠性。此外,因为某些企业进行了全国产化软硬件部署,厂商产品也须要做相应适配保障在国产化 IT 环境中的顺利运行。
入选规范:
- 合乎图数据库的厂商能力要求;
- 近一年在该市场服务客户数 5 家以上;
3.近一年该市场相干服务收入规模在 500 万元以上。
代表厂商评估:
海致星图
厂商介绍:
北京海致星图科技有限公司(简称“海致星图”)成立于 2015 年,公司通过自主可控的常识图谱、大数据等核心技术,提供金融、能源、制作、智慧城市等政府机构与企业级用户数字化转型的产品和服务,帮忙用户构建数据驱动的治理经营体系,赋能决策智能。海致星图目前已服务建设银行、工商银行、招商银行、上交所、深交所等 70 多家银行、券商、保险等金融机构及国家电网、南方电网等大型能源企业。
产品服务介绍:
海致星图 AtlasGraph 图数据库,是基于 Rust 自研的新一代云原生分布式实时图数据库,具备高性能图计算引擎、类 SQL 的图查询语言、分布式存储引擎等内核技术,可能反对简单的数据挖掘和机器学习场景。海致星图 AtlasGraph 图数据库反对万亿量级数据存储剖析及流式计算引擎的联合,反对数据实时入库构图,为在线业务决策分析提供无力撑持。同时,AtlasGraph 预置了 20 余种图计算算法及上百种剖析函数,并配套可视化操作剖析平台提供丰盛的剖析治理性能。AtlasGraph 目前次要利用于金融、政务、能源等行业。
厂商评估:
海致星图 AtlasGraph 图数据库在稳固牢靠和安全性、数据服务的高可用性、存储计算性能、HTAP 混合负载能力方面具备劣势,产品技术自主可控且适配国产软硬件,具备易用的查问剖析和治理性能,云原生技术支持 AtlasGraph 的云上部署并提供容器化、自动化的数据服务形式。海致星图在金融、政务等畛域有包含行业常识图谱等在内欠缺的解决方案输入能力,其自研的图数据库和解决方案适配度高,并提供针对性优化。
AtlasGraph 具备高可靠性和安全性,并可能为企业提供高可用的图数据服务,尤其在金融、政务等行业领有多年的服务教训。AtlasGraph 反对分布式下的多正本存储,可能在局部服务器呈现故障时保证数据不失落且服务继续可用。AtlasGraph 外部通过一致性协定保障数据读写的完整性和一致性。同时,AtlasGraph 采纳 Rust 语言编写,为数据库提供了平安的内存治理和拜访机制,并保障了工作并发场景下的稳定性。
AtlasGraph 的分布式引擎具备高性能的存储和计算能力,可能提供大规模集群与万亿规模节点数据的全量存储,反对万亿大图实时剖析。在分布式部署下,AtlasGraph 能够整合多台服务器的存储计算能力晋升零碎整体性能,在低成本的部署条件下晋升高并发场景解决能力,并减速对于慢查问的处理速度。AtlasGraph 的分布式数据存储,及其 shared-nothing 和存算拆散的零碎架构,不便数据库通过横向扩大来应答更高负载和更大数据量。在语言层面,Rust 语言编写可能在保障数据安全稳固的状况下达到与 C /C++ 编写同样的高性能。此外,自研的图原生存储技术、图数据在外存的编码优化、分布式下的数据划分和数据读写优化帮忙 AtlasGraph 冲破了对数据拜访的性能瓶颈。
AtlasGraph 反对 HTAP 混合负载,并反对图数据的实时剖析。在 OLTP 场景,AtlasGraph 能够反对对关系绝对稠密的数据进行高效的读取和写入,并满足高并发低提早的场景需要,例如一度、二度的关系剖析,AtlasGraph 能够在毫秒或者亚秒级实现,对于深度关系查问,如 6 度关系查问,AtlasGraph 能够在秒级实现。在须要对全图数据多轮迭代计算的 OLAP 场景,如 page rank、连通性剖析、社区划分、图神经网络 GNN 等。AtlasGraph 同样提供了高性能的图计算引擎,反对疾速的在线计算。AtlasGraph 提供实时的数据分析能力,反对数据实时采集入库,并且数据导入过程和下层计算并行执行互不影响。此外,海致星图在图技术畛域积攒了多年在金融、政务行业的服务教训,让 AtlasGraph 可能针对客户罕用的查问模式、剖析算法、并发拜访效率等方面进行大量优化,晋升执行效率和算法成果。
AtlasGraph 具备良好的易用性,提供可视化的操作和剖析平台,并反对类 SQL 的查询语言并内置上百种剖析函数。AtlasGraph 提供便捷易用的可视化操作和剖析平台,升高了图数据库的应用难度,并且为用户提供了丰盛的计算剖析和治理性能。在图数据的查问剖析上,AtlasGraph 提供类 SQL 的图查询语言 AQL (Atlasgraph Query Language),并内置了上百种的计算和剖析的图算法。在此之上,AtlasGraph 对内置算法的参数和性能进行了调优,并封装成用户能够间接上手应用的函数,升高了用户查问剖析的操作门槛。
海致星图领有丰盛的行业级解决方案教训,可能针对不同场景提供齐备的方案设计。海致星图服务金融、能源、制作等行业多年,积淀了粗浅的业务场景认知和丰盛的行业落地教训,可能针对不同客户所需的查问剖析算法、数据特点、写入查问模式进行图数据库的相应优化,并且联合本身产品体系,对企业输入蕴含图数据库、数据库周边工具集、常识图谱平台在内的行业级解决方案。
例如,在常识图谱的解决方案中,海致星图提供金融、制作、能源等行业常识图谱,同时,海致星图的图平台、图算法团队会在常识图谱和图机器学习等层面与客户进行需要沟通,并针对相应的建模形式和剖析算法进行设计优化,联合数据库内核在存储计算、下层算子反对等方面的改良,输入系统性的解决方案。
AtlasGraph 技术自主可控并适配国产软硬件,满足企业信创要求。在企业资质上,海致星图目前已是信创工委会成员单位。同时,基于多年的图数据库畛域研发教训积攒,海致星图已成为多个国家级和国际级图数据库规范的制订方之一。在产品资质上,AtlasGraph 图数据库是海致星图全栈自研的产品,已通过中国软件评测核心的“信息系统平安测评”并被收录至相干信创产品名录中,满足技术自主可控的要求。在国产化适配上,AtlasGraph 图数据库已与包含飞腾、海光、龙芯等在内的六大国产 CPU、以及支流国产操作系统、服务器等根底软硬件实现兼容适配,可能反对在不同类型的国产 IT 环境中应用。
AtlasGraph 采纳云原生技术适应数据上云的趋势,反对企业图数据库的云化部署并晋升了资源管理效率。面向大型企业用户,云原生技术支持 AtlasGraph 在企业的公有云环境中部署,并且提供多租户的资源隔离、权限管制等性能需要。此外,云原生技术为 AtlasGraph 提供故障自愈的能力,帮忙企业升高了运维的难度和老本;资源的主动调度和动静扩缩容能力,进步了资源的调配和应用效率。
典型客户:
中国某期货交易所、某国有大型银行、江南农村商业银行
4.5 数据库云治理平台
市场定义:
数据库云治理平台是面向企业多类型数据库、多云部署环境,提供对立数据库治理服务的平台。数据库云治理平台具备装置部署、迁徙、备份、监控告警、巡检、性能剖析、智能运维、平安管控等数据库全生命周期治理能力。此外,局部厂商提供的数据库云产品还具备了对多云资源进行调度治理的能力。
甲方终端用户:
各行业企业的 IT 部门、大数据部门、科技翻新部门,以及相干业务部门
甲方外围需要:
近年来,数据库的市场格局产生了粗浅变动,出于满足国产化代替、应答更多样的利用场景、以及降低成本等思考,企业对各类国产和开源数据库的需要日趋强烈,然而国产和开源数据库治理运维相干的生态工具绝对欠缺,导致企业在应用这类数据库时面临诸多困难。与此同时,数据库云化的趋势使得数据库的运行环境从物理主机转变为各种虚拟化、公有云、私有云,又给数据库的治理运维带来了更的高的复杂性。面对这些挑战,数据库云治理平台可能无效解决多数据库多元化、多云部署带来了的诸多问题,正被一些大中型企业采纳。企业对于数据库云治理平台的外围需要包含:
具备数据库应用全生命周期治理运维性能。为使数据库在应用过程中可能稳固牢靠的运行,并满足各类治理运维要求,企业须要数据库云治理平台可能面向企业内运维、DBA、开发、业务等各类人员提供数据库全生命周期治理运维性能。
具备对多元化数据库的治理能力。大中型企业外部业务线林立,相应地,企业外部会逐步部署多套、多类型的数据库系统,对这些数据库进行治理运维逐步变得更加扩散和沉重。因而,企业须要数据库云治理平台反对多种常见类型数据库的治理能力。
应用门槛较低。因为以后企业对多元化数据库的应用需要一直减少,但与此同时,企业又广泛不足对多元化数据库进行治理的人才和技术。因而,企业须要数据库云治理平台具备对多元化数据库进行治理运维的自动化和智能化的能力,升高平台的应用门槛。
此外,局部企业对数据库云治理平台还有以下冀望需要:
可能对多云资源的进行对立调度治理。随着企业内的数据库逐步部署各种基于虚拟化或容器化的环境公有云、私有云、混合云环境,对多云资源进行对立调度治理变成了企业面临的一大挑战。因而,企业须要数据库云治理平台应用云原生技术来屏蔽多种异构基础设施的复杂性,并具备资源弹性伸缩、资源隔离能力。
厂商能力要求:
基于上述外围需要,数据库云治理平台厂商需具备以下能力:
在数据库治理运维方面有长期的服务教训积攒,可能提供数据库治理运维全生命周期的性能。具体而言,厂商须要在其数据库云治理平台产品中提供包含迁徙工具、装置部署、备份、扩大、监控报警、高可用、SQL 优化、SQL 审计、性能视图等在内的欠缺的数据管理运维能力,满足运维、DBA、开发、业务等各类人员的需要。
对多种支流国产和开源数据库有深刻了解,使平台反对对这些数据库的治理运维。厂商需的数据库技术专家需对支流的国产和开源数据,如 Oracle、MySQL、PostgreSQL、TiDB、达梦、人大金仓、TiDB 等,的性能个性有深刻了解,在平台中提供对上述多种数据库进行对立治理运维的能力。
可能将数据库治理运维性能代码化和自动化。一方面,厂商须要具备大量数据库治理运维的最佳实际,并将这些最佳实际的治理教训代码化,造成数据库云治理平台的规范性能;另一方面,厂商须要可能在数据库治理中使用机器学习等 AI 技术,以自动化、智能化的形式实现监控、巡检、审核、诊断等性能。从而减低平台对用户的技能要求。
针对局部企业的冀望需要,数据库云治理平台厂商需具备以下能力:
厂商需可能在数据库云治理平台中引入云原生技术,具备对多云资源的调研度治理能力。具体而言,厂商须要具备 Kubernetes、Docker 等云原生技术的研发能力,并对操作系统技术有深刻了解,可能利用云原生技术在数据库治理中,对立治理私有云、公有云、混合云等多种异构的基础设施,同时可能在数据库系统运行时,使其可能实现资源的弹性伸缩,以及多租户的资源隔离。
入选规范:
- 合乎数据库云治理平台的厂商能力要求;
- 近一年在该市场服务客户数 5 家以上;
3.近一年该市场相干服务收入规模在 500 万元以上。
代表厂商评估:
沃趣科技
厂商介绍:
杭州沃趣科技股份有限公司(简称“沃趣科技”)创立于 2012 年,开创团队为原阿里去“IOE”期间数据库团队的外围骨干,从事数据库生态平台畛域产品研发多年,产品笼罩寰球支流数据库和云原生技术架构,提供数据库全生命周期的云平台解决方案。公司现有上百位资深数据库及零碎技术专家,累计服务近 3000 家企业客户,产品次要利用于证券、保险、银行、能源电力、医疗、广电传媒、电信、快递物流、公共事业等行业。
产品服务介绍:
沃趣科技提供中立的企业级数据库云,产品包含数据库公有云 PaaS 平台 QFusion、私有云 RDS 产品 Squids、国产化代替(数据库一体机)三大类。其中数据库公有云 PaaS 平台 QFusion 面向企业数据库多元化的场景,提供了笼罩数据库应用全生命周期的各类性能,在金融、通信、医疗、制作等十余个行业均有落地案例;私有云 SquidsRDS 产品面对数据上云的趋势,为企业提供了便捷易用的数据库私有云服务。数据库公有云 PaaS 平台 QFusion 与私有云 RDS 产品 Squids 独特形成了沃趣数据库云平台产品体系。
此外,沃趣科技打造了高性能的数据库一体机整体解决方案,包含以 Oracle 为主,实现去“I”去“E”的高性能数据库公有云平台 QData、以及全国产化适配的 QFusion-C、与达梦数据库联结研发的国内首款全栈式一体机 QDM 等三种数据库一体机,次要实用于用户的外围交易系统、主备灾备零碎、数据仓库和大数据云平台。
厂商评估:
沃趣数据库云平台在性能齐备性、稳固可靠性、数据库纳管多元化和易用性等方面具备劣势,产品引入云原生技术为企业提供了数据库平台即服务的能力,同时研发团队将本身多元化的技术背景和丰盛的一体机研发教训融入了沃趣数据库云平台的设计中,实现了数据库整体性能的晋升。
沃趣数据库云平台提供了面向各类数据库终端用户的性能,能够充沛满足数据库应用全生命周期的各类需要。沃趣数据库云平台为企业提供了 DBA 用户关注的迁徙、备份、扩容、容灾、SQL 审计优化,以及运维用户关注的监控报警、性能视图等性能。同时,平台基于云原生技术,以及将数据库治理运维教训代码化,让业务人员和利用开发人员只需在平台上通过点选所需的数据库、设置相应的参数等简略操作即可创立和应用数据库。
沃趣科技领有丰盛的数据库云平台服务教训和欠缺的测试机制,产品具备满足大型企业要求的稳固可靠性。在客户服务教训方面,沃趣科技在数据库云平台产品上有近十年的研发教训,已服务近 3000 多家企业级客户,在证券、电力、制造业、医疗、教育等 40 多个行业有落地案例,积淀了深厚的技术教训来保障产品的稳固可靠性。在产品测试机制方面,沃趣数据库云平台在每个版本公布前要经验上百项疲劳测试和故障测试,同时沃趣科技将售后工单零碎中用户的反馈问题纳入到测试场景中,收集了丰盛的利用实际案例,产品造成了欠缺的迭代演进流程。
沃趣数据库平台引入云原生作为技术底座,为数据库用户提供资源主动调度调配和多租户隔离能力。通过云原生技术,沃趣数据库平台可能将底层计算、存储、网络等资源池化,为数据库提供自动化的资源调度调配。同时,云原生技术也让平台能够轻松应答企业内多用户、多数据库实例的状况下资源隔离的需要。
例如,某头部汽车集团应用了沃趣科技基于云原生技术的 QFusion 产品定制版进行数据库容器化公有云革新,规模达到 100 多个物理节点,上千套数据库实例。容器化的数据库云平台,使该车企在数据库应用和治理中实现了真正意义的弹性架构,同时也满足多租户需要,不便各个租户随时构建服务本身业务的数据库服务。
沃趣数据库云平台对系统各层面优化实现了数据库整体性能的晋升。在数据库一体机上,沃趣科技有近十年的研发教训,产品性能在行业处于领先地位。同时,研发团队成员具备多元的技术背景,对硬件、操作系统和数据库技术等各方面有着深刻了解。因而,沃趣数据库云平台可能从 PaaS 层面实现零碎级的优化,保障了数据库整体性能低劣。
沃趣数据库云平台可能治理多种国内外支流数据库,并且仍在一直在退出对新兴数据库的反对和服务能力。在数据库多元化的趋势下,沃趣科技的技术专家对不同数据库的个性有着深刻的钻研和了解,可能充沛反对对多种数据库的纳管能力。沃趣数据库云平台目前已可能反对 Oracle、MySQL、Redis、PostgreSQL、TiDB、海量信创数据库、达梦、人大金仓等数十种国内外支流数据库,将来会继续投入钻研并反对服务更多的数据库产品。
典型客户:
中信证券、国泰君安、国网山东电力、西安国内医学中心、厦门大学
5. 入选厂商列表