共计 3615 个字符,预计需要花费 10 分钟才能阅读完成。
为了帮忙大家及时理解中国数据库行业倒退现状、梳理以后数据库市场环境和产品生态等状况,从 2022 年 4 月起,墨天轮社区行业剖析钻研团队出品将继续每月为大家推出最新《中国数据库行业剖析报告 》, 继续流传数据技术常识、致力促成技术创新与行业生态倒退,目前已更至第七期。
10 月《中国数据库行业剖析报告》已正式公布(点击即可跳转,欢送大家下载查阅),本期报告 介绍了墨天轮“中国数据库风行度排行”、国内外产品公布、评测以及国内厂商中标与投融资最新状况,由此展示以后数据库市场倒退前沿动静。
向量数据库是专门为解决向量嵌入独特构造而构建的数据库系统,本期报告 重点梳理了向量数据库外围能力与倒退历程,并公布了【向量数据库寰球产业图谱】。同时,具体解析了向量化计算如何冲破传统数据库性能瓶颈,展现向量化执行引擎的技术价值,并精选展现了国内几则典型的向量数据库、向量化技术实际案例的个性与劣势。
一、数据库排行榜及行业动态
本章节目录👆
- 10 月中国数据库风行度排名剖析
2022 年 10 月的墨天轮中国数据库风行度排行榜风起云涌,相比上月新增七个数据库,共 245 个数据库参加排名。榜单前十名变动较大:达梦数据库上市程序复原,热度大涨 ,排名反超 openGauss,重回第三;华为旗下两大数据库品牌名次均降落; 云原生数据库 PolarDB、TDSQL 再创佳绩,名次均回升一位。
此外,本月排行榜从第十一名至第三十名竞争强烈,归属变动较大。在这一赛道中,本月也崛起了一批数据库新秀,领有亮眼的体现。诸如云和恩墨推出的企业级关系型数据库 MogDB、浙江智臾科技有限公司研发的分布式时序数据库 DolphinDB、北京鼎石纵横科技有限公司的 MPP 剖析型数据库系统 StarRocks、腾讯云推出的原生分布式并行图数据库 TGDB、腾讯惟一的时序数据库 CTSDB、星环科技的分布式关系型数据库 KunDB 等均有亮眼体现。
- 国内外数据库行业倒退动静
产品公布层面,2022 年 9 月 30 日,openGauss 3.1.0 版本正式上线,在企业级个性、高可用、高性能、高智能、高平安、工具链、可扩展性七大个性上全面加强。Oracle Database 23c 的公布打算曾经明确颁布,2022 年 Beta 版曾经开始测试,新版本将在 2023 年公布。报告中对其个性进行了整顿展现。
学术层面,VLDB2022(Very Large Data Base)于 9 月 5 日召开,作为数据库畛域的三大顶级国内会议之一,代表数据库系统畛域最卓越的钻研和工程停顿。VLDB2022 会议中共有 336 篇国内外论文入选,其中中国奉献 115 篇,占比超过 1 /3。报告对收录数及次要学术机构起源进行了整顿统计。
业内调研测评层面,近日,国内出名调研机构 Gartner 公布了聚焦图技术的调研报告——《图数据库管理系统市场指南》在寰球范畴内甄选出了 32 家图数据库代表性供应商 Galaxybase、AtlasGraph、Ultipa、StellarDB 四个数据库作为优质图数据库入选。9 月 1 日,国家工业信息安全倒退钻研核心依靠两项规范组织发展了多轮电信行业数据库能力测评,最新一批入围“场景榜单”的综合排名的前三名:中兴通讯、亚信科技、阿里云。
中标、投融资等商业层面,报告整顿了 9 月国产数据库厂商中标一览表,蕴含项目名称、中标数据库及金额等信息。同时,整顿了无关当月时序数据库厂商 Greptime(格睿云)实现数百万美元天使轮融资、图数据库 Nebula Graph 取得数千万美元的 A 轮融资相干状况介绍,具体内容可通过报告理解。
二、向量数据库的概述与解析
本章节目录👆
- 向量数据库概述
向量数据库是专门为解决向量嵌入 (vector embeding) 独特构造而构建的数据库系统。它们通过比拟值并找到彼此最类似的向量来索引,以便于搜寻和剖析。 向量数据库次要解决 2 个问题:高效检索、高效剖析 。向量数据库其实就像传统数据去解决一些关系型数据、结构化数据一样,承当的是非结构化数据的低成本存储和高性能计算两大外围能力,具体包含 用于搜寻和检索的向量索引、单级过滤、数据分片、复制、混合存储以及 API 性能,查看报告可查看对这些性能进行的具体论述。
向量数据库的 利用场景 次要包含如人脸识别、举荐零碎、图片搜寻、视频指纹、语音解决、自然语言解决、文件搜寻等。并且随着 AI 技术的广泛应用,以及数据规模的一直增长,向量检索也逐步成了 AI 技术链路中不可或缺的一环。从 2017 年 Facebook 开源了 AI 相似性搜寻工具 Faiss(Facebook AI Similarity Search)起,向量数据库倒退才刚刚 5 年,报告对其倒退历程进行了梳理。
- 国内外向量数据库技术实际与案例解析
报告展现了 Faiss、Pinecone、Weaviate、Proxima 等向量数据库、向量搜索引擎 等向量化技术相干产品的架构与性能个性,便于帮忙大家更好地理解向量数据库及其相干技术的外围原理与利用倒退轨迹,此处仅展现其中局部内容,查阅报告可理解更多。
最初,报告公布了 最新【寰球向量数据库产业图谱】,将之分为了中国、国外向量数据库产品提供商,向量检索库、向量插件和向量字段,其中国内典型向量数据库代表有 Milvus、Vearch、ZSearch、TensorDB、Om-iBASE 等。
三、向量引擎加持传统数据库
本章节目录👆
- 向量化计算技术概述
随着数据库软硬件技术的倒退,经典的 SQL 计算引擎逐步成为数据库系统的性能瓶颈 ,尤其是对于波及到大量计算的 OLAP 场景。 如何充分发挥底层硬件的能力,晋升数据库系统的性能 ,成为近年来数据库畛域的热门钻研方向, 而向量化执行就是解决上述问题的一种无效伎俩。向量化计算(vectorization),指将屡次 for 循环计算变成一次计算,是一种非凡的并行计算的形式。报告对其技术框架与逻辑进行了介绍,同时,针对向量化计算能为传统数据库带来怎么的晋升也进行了剖析展现。
- 向量化执行引擎技术特点与实现原理
2005 年《MonetDB/X100: Hyper-Pipelining Query Execution》论文首次提出“向量化引擎”的概念,即为列存数据 MonetDB 设计一个 新的执行引擎 MonetDB/X100,应用向量化执行的办法,进步 CPU 使用率。报告中对此以及向量引擎 MonetDB/X100 的执行流程图和具体内容进行了展现,此处不做赘述。
向量化执行引擎自 MonerDB-X100(Vectorwise)零碎开始风行,现已成为在古代硬件条件下构建高效剖析查问引擎。不同于传统模式,向量化实现了从一次对一个值进行运算,到一次对一组值进行运算的逾越。通过实现批量读取和解决,大大精简了函数调用开销,缩小了反复运算,进步了执行效率。报告对向量化执行引擎的技术价设计实现和原理以及执行框架进行了阐释,望帮忙大家更加理解这一引擎的特色与技术价值。
报告的最初选取了基于 Milvus 的 云原生向量数据库平台 Manu、京东基于 Faiss 的 分布式向量搜寻零碎 Vearch、基于智能算法的 向量数据库 Om-iBASE、爱可生基于 Milvus 的企业发行版 向量数据库 TensorDB 等典型产品的性能架构、劣势特点等进行了介绍。同时展现了 星环科技 通过向量化执行引擎构建高性能数据库、OceanBase 引入向量化技术并齐全自主设计了向量化查问引擎实现查问性能晋升 10 倍、Doris 的向量化设计与实现、TiDB 通过向量化执行使表达式性能晋升 10 倍、MogDB 利用向量化引擎减速 OLAP 零碎 等多个技术实际,欢送各位朋友查阅报告理解其实现原理与技术价值。此处因篇幅所限仅展现其中几张,大家能够下载报告获取更多内容。
本文仅对 10 月《中国数据库行业剖析报告》的局部内容进行了摘录、整顿,更多残缺、具体内容大家能够下载报告全文理解,也欢送各位数据行业同道交换、探讨、建言献策,咱们一起见证、独特助力中国数据库产业的发展壮大!
报告全文下载地址:https://www.modb.pro/doc/78854
往期报告下载
- 2022 年 4 月中国数据库行业剖析报告 - 热点纷呈,翻新冲破
- 2022 年 5 月中国数据库行业剖析报告 - 百花齐放,开源当先
- 2022 年 6 月中国数据库行业剖析报告 - 智能风起,列存更生
- 2022 年 7 月中国数据库行业剖析报告 - 居安思危,平安后行
- 2022 年 8 月中国数据库行业剖析报告 - 死记硬背,并行不悖
- 2022 年 9 月中国数据库行业剖析报告 - 死记硬背,并行不悖
- 墨天轮中国数据库风行度排行
- 国产数据库大事记 - 月度合辑
- 国产数据库排行榜 - 月度解读
查看更多精彩内容尽在墨天轮社区,围绕数据人的学习成长提供一站式的全面服务,打造集新闻资讯、在线问答、流动直播、在线课程、文档阅览、资源下载、常识分享及在线运维为一体的对立平台,继续促成数据畛域的常识流传和技术创新。
关注官网公众号:墨天轮、墨天轮平台、墨天轮成长营、数据库国产化、数据库资讯