关于人工智能:开源铸剑五载匠心Zilliz-Cloud云服务盛装登场引领向量数据库云时代

33次阅读

共计 4533 个字符,预计需要花费 12 分钟才能阅读完成。

2023 年注定是属于大模型和向量数据库的巅峰时刻。国内大模型的倒退也迎来前所未有之时机,“百模”激战正酣。在刚落幕的世界人工智能大会上,国内外科技公司全线退出,三十余款大模型集中亮相,“国家队”尘埃落定,并正式启动大模型测试国家标准制订,掀起新一轮大模型热浪。而作为“大模型记忆体”、AIGC 利用开发新范式的重要组成部分,向量数据库的演进也逐步达到了前所未有的新高度。

Milvus 自 2019 年正式开源以来,曾经成长为寰球最大、最沉闷的向量数据库开源我的项目与开发者社区。作为 Milvus 背地的开发者与运营者,Zilliz 始终走在向量数据库的最前沿,始终秉承为开发者提供易用性强、性价比高的向量数据库服务的理念。通过五年的继续打磨,终于在国内推出了基于 Milvus 的全托管向量数据库云服务产品——Zilliz Cloud。

通过一直地开发与降级,Zilliz Cloud 俨然成为向量数据库赛道的领先者。随着 Zilliz Cloud 在国内全面开启向量数据库云服务,也为向量数据库的高速倒退开启了全新的纪元。对于此次在国内的服务落地,Zilliz 秉承的使命和指标尤为清晰和明确:

  • 提供寰球最业余的全托管向量数据库云服务。
  • 突破向量数据库服务集中在北美,国内无可用向量数据库服务的难堪场面。
  • 满足向量数据库服务多云的需要,防止业务被繁多云环境限度。
  • 为跨境业务中所须要的对立向量数据库服务和架构提供可行性。
  • Milvus 开源解决方案、SaaS、PaaS 对立接口标准,无缝线下 / 云上迁徙,并大幅度降低混合部署的综合老本。
  • 提供比开源 Milvus 具备更高性价比、更稳固服务反对的产品和解决方案。

成熟稳固,寰球率先反对十亿级别向量规模的服务

Milvus 自开源以来,始终都是企业用户自建向量数据平台的首选,全套技术解决方案已被上万家企业所采纳,其中百度、新浪、现实汽车、华泰证券、沃尔玛、LINE、BIGO 等头部企业在实践中通过重复验证,均已顺利投产。

向量数据库是 AIGC 大模型的重要补充,是提供精确牢靠、高度可扩大的长短期“记忆”的要害载体。近一年,向量数据库我的项目如雨后春笋般涌现。然而,大部分向量数据库反对的向量数据规模仅停留在千万量级,并不具备撑持生产环境的能力。

相较之下,Milvus 在过来 5 年的客户利用场景笼罩各行各业,早在 2021 年就实现稳固反对十亿级向量规模的线上服务。现在,Zilliz Cloud 的向量数据库服务可 轻松反对十亿级以上规模向量数据,可用性高达 99.9%。

此外,在产品与技术背地,Zilliz 亦领有寰球最资深的向量数据库专家团队,能够为每一位企业用户装备 4 名技术支持,“没有人比咱们更懂向量数据库”是团队对开源社区与商业化用户的承诺。

高性能 + 高性价比,性能优异远超同类产品

以后支流的向量数据索引算法是内存算法或内存 /SSD 混合,算法内核以矩阵计算为主(相似 HPC),大规模向量检索与剖析是计算 / 内存双重密集的工作。这意味着向量数据库作为基础设施,对于性能与老本更加敏感。

从性能方面来看,Zilliz Cloud 在 QPS 和升高查问提早方面远超其余同类产品。咱们将 Zilliz Cloud、Milvus、Pinecone、ElasticCloud 4 个常见的向量数据库(ElasticCloud 严格来说不属于向量数据库,但附带向量能力,在传统文本检索畛域受众最广,能够视为目前传统数据库反对向量检索的代表)在等同资源及 6 组向量查问工作的同等条件下进行了比照(测试框架已开源,详见 VectorDBBench,Leaderboard)。

比照后果如下:

在查问吞吐方面,Zilliz Cloud 在全副 6 组查问工作中全面力压北美向量数据库 Pinecone,整体性能均匀超过 2 倍以上。与此同时,Zilliz Cloud 相比 Milvus,也有将近一倍的晋升,体现令人眼前一亮。ElasticCloud 作为传统文本检索服务的代表,向量查问能力次要为补充能力,这 6 组查问工作的 QPS 均在 50 以下。

查问提早方面,Zilliz Cloud 整体在 10 ms 以下,Milvus 整体在 20 ms 以下,Pinecone 在 20-40 ms 之间,ElasticCloud 差距较为显著。

性价比方面,次要考查 Queries per dollar (高并发状况下,单位成本所能反对的查问申请数量)。相较 Pinecone、Elastic,Zilliz Cloud 的劣势非常显著。指标相比第二位的 Pinecone 最多能够高出 1 个数量级(Q1, Q2),在剩下的四组工作中广泛能够高 3 倍左右。(因为 Milvus 为开源计划,难以和商业化服务在雷同规范下比拟,咱们在这组测试中将其移除。)

黑科技加持,软硬件性能飙升,全新内核火力全开

Zilliz Cloud 采纳商业化引擎,综合性能超过 Milvus 开源引擎的 1 倍以上。引擎针对典型场景进行深度优化,性能可晋升 3-5 倍。

硬件层面,Zilliz 与英伟达、英特尔等一线硬件厂商有着长期稳固的单干,向量算法内核针对 X86、ARM、GPU 进行了定制化优化。

软件层面,Zilliz Cloud 推出了 Autoindex 智能索引。智能索引依据用户的向量维度、数据规模、数据分布、查问个性进行继续的自动化调优,免去用户索引类型选型以及参数调优的苦楚。据 Zilliz 内部测试,autoindex 智能索引曾经达到向量数据库专家手工调优成果的 84%,大幅超过用户的平均水平。在下一阶段,autoindex 智能索引的性能还会失去大幅度加强,反对用户指定 recall 进行优化,保障索引运行在指定查问准确度的最长处。

当然,针对最近大火的 AIGC 利用,Zilliz Cloud 也推出了专门的个性反对:

  • 动静 schema,能够依据 AIGC 迭代须要,灵便扩大向量特色或标签字段。
  • Partition Key,反对 AIGC 利用多用户知识库的利器,相较独自建表计划,综合老本可降落 2-3 个数量级。
  • 反对 JSON 类型,能够将 JSON 与 embedding 这两种超强能力相结合,实现基于 JSON 与 embedding 向量的混合数据表示以及简单的业务逻辑。

突破“CAP”不可能三角,给用户灵便抉择

向量数据库技术倒退到当初并不完满,通常状况下,业务须要在老本(Cost)、查问成果与准确度(Accuracy)、查问性能(Performance)之间做衡量,即向量数据库的 CAP 问题。目前来看,CAP 是一个不可能三角,Zilliz 的解法是在典型的地位给出部分最优解,并给用户以灵便的抉择。

事实上,用户的广泛场景能够演绎为性能需求型、容量需要型与老本敏感型。为此,Zilliz Cloud 在向量数据库实例中也相应提供了三类反对:性能型、容量型和经济型。不同的实例类型由不同的算法与硬件资源组合而成,实用于不同的业务场景。

  • 性能型 实例实用于须要低提早和高吞吐量的向量相似性检索场景,该类型的实例可能保障毫秒级的响应。

性能型实例的实用场景包含但不限于:生成式 AI、举荐零碎、搜索引擎、聊天机器人、内容审核、LLM 加强的知识库、金融风控。

  • 容量型 实例能够反对的数据量是性能型的 5 倍,但查问提早略有减少,因而实用于须要大量存储空间的场景,尤其是须要解决千万级以上向量数据的场景。

容量型实例的实用场景包含但不限于:搜寻大规模的非结构化数据(如:文本、图像、音频、视频、药物化学构造等)、侵权检测、生物身份验证。

  • 经济型 实例可反对的数据规模与容量型统一,但价格优惠 7 折左右,性能略有降落,实用于谋求高性价比或估算敏感的场景。

经济型实例的实用场景包含但不限于:数据标记或数据聚类、数据去重、数据异样检测、均衡训练集类型散布。

反对大模型与非结构化数据处理全生态笼罩

没有任何一套零碎能够满足使用者业务上的所有需要,向量数据库也是如此。在以向量数据库为撑持的业务中,往往须要解决多道流程,包含:

  • 业务数据的语义结构化,如从文本数据中梳理题目 embedding、内容段落的 embedding、一二级主题、浏览工夫;
  • 面向端到端成果的模型选型,如寻找能带来最佳成果的 embedding 模型选型;
  • 模型与向量数据库的集成,如向量数据库查问驱动的原始数据召回以及后续 LLM 对召回内容的总结或重构等。

为了进一步升高利用构建老本,提供标准化组件,Zilliz Cloud 为开发者提供了双重反对:

  • 大模型生态对接。2023 年 3 月,Zilliz 作为 OpenAI 首批向量数据库合作伙伴,实现了 Milvus 与 Zilliz Cloud 的插件化集成,被纳入官网举荐的向量数据库插件名单。不止如此,Zilliz 还与 LangChain、Cohere、LlamaIndex、Auto-GPT、BabyAGI 等热门我的项目进行了深度集成。此外,与国产大模型如文心一言、通义千问、智谱 AI、MiniMax、360 智脑等对接工作正在进行中,近期将会有更多成绩公布。
  • 面向非结构化数据处理流水线。Zilliz Cloud 提供了开源的 Towhee 工具框架。开发者能够在相熟的 Python 环境,以相似 Spark 的算子语法编写本人的流水线,轻松解决文本、图片、音频、视频、化合物构造等非结构化数据的 ETL 过程。Towhee 同时提供自动化编排工具,一键在 Python 环境验证过的流水线组织成基于 Triton、TensorRT、ONNX 以及一系列硬件加速算法的服务镜像,面向如文本近似搜寻、智能问答、知识库等典型场景。当然,Towhee 也提供深度优化的规范流水线。

目前,Zilliz Cloud 提供 SaaS 和 PaaS 服务,其中 SaaS 已笼罩 AWS、GCP、阿里云,PaaS 笼罩 AWS、GCP、Azure、阿里云、百度智能云、腾讯云和金山云。国内官网已同步上线,更多详情和案例能够拜访 https://zilliz.com.cn(海内官网和云服务入口:https://zilliz.com)。

为了减速打磨业界最佳实际,咱们行将启动「寻找 AIGC 时代的 CVP 实际之星」 专题流动,Zilliz 将联合国内头部大模型厂商一起甄选利用场景,由单方提供向量数据库与大模型顶级技术专家为用户赋能,一起打磨利用,晋升落地成果,赋能业务自身。如果你的利用也适宜 CVP 框架,且正为利用落地和实际效果发愁,可间接申请参加流动,取得最业余的帮忙和领导。(注:CVP 即 C 代表以 ChatGPT 为代表的 LLMs,V 代表 Vector DB,P 代表 Prompt Engineering,联系方式参见 business@zilliz.com

2023 年随同着 AGI 和 LLMs 的暴发曾经过半,减速摸索大模型落地之路曾经火烧眉毛。行业的高度共识推动着 AI 奇点的降临,大模型将重构企业级利用,重塑人工智能产业的倒退方向。Zilliz 示意,将来将继续聚焦向量数据库行业倒退的最前沿,以各行各业的智能化演进为指标,为大模型时代的企业和开发者提供最具竞争力的“大模型记忆体”。

🌟点击跳转中文服务网站,理解更多对于 Zilliz Cloud 的信息。


  • 如果在应用 Milvus 或 Zilliz 产品有任何问题,可增加小助手微信“zilliz-tech”退出交换群。
  • 欢送关注微信公众号“Zilliz”,理解最新资讯。

本文由 mdnice 多平台公布

正文完
 0