关于人工智能:给大模型持久记忆GitHub-2万星向量数据库云服务升级国内云产品下周上线

一个在GitHub上标星超2万的数据库，到底是什么来头？

原来，这正是最近大火的向量数据库之一、首个在这一赛道开源产品Milvus。

自卑模型爆火以来，它的关注度也一路飙升，官网显示，目前Milvus曾经领有超过1000+企业用户。

而就是这么一个GitHub上最风行的向量数据库，背地公司Zilliz曾经实现了1.13亿美元融资。

Zilliz专一于研发面向AI利用的向量数据库系统，旗下有Milvus、Zilliz Cloud等产品，目标是为开发者提供易用性强、性价比高的向量数据库服务。

这两天，Zilliz Cloud公布2.0重磅更新，更是带起一波业界对向量数据库的探讨热潮。

大模型技术停顿突飞猛进，向量数据在风口浪尖上也起起伏伏，不少人说它是给AI提供长期记忆的必备基建，也有人认为进步大模型上下文长度才是将来方向。

这不，还有谷歌工程师专门为此摆摊舌战群儒。

七嘴八舌之下，状况到底如何？不如来听听向量数据库一线从业者怎么说。

咱们分割到了Zilliz创始人兼CEO星爵，心愿和他聊一聊向量数据库对于这一轮AI浪潮的意义，以及它背地改革的形式。

星爵认为，大模型的呈现给AI带来了新的计算范式CVP Stack，向量数据库是不可或缺的要害：

其中，“C”代表大模型（ChatGPT）负责向量计算；“V”代表向量数据库（vector database），负责向量存储；“P”代表Prompt工程，负责向量交互。

不仅如此，他还零碎解答了在大模型倒退过程中，向量数据库具体起到的作用，以及作为向量数据库头部公司的Zilliz，又要如何应答这一轮AI改革浪潮。

在不更改原意的根底上，量子位对与星爵的交换内容进行了整顿，心愿能为大家带来一些思考与启发。

大模型的数据基础设施

发问：最近向量数据库很火，能不能先简略科普一下？

星爵：向量数据库是一种为了高效存储和索引AI模型产生的向量嵌入（embedding）数据而专门设计的数据库。

在传统的关系型数据库中，数据通常以表格的模式存储，而在向量数据库中，数据以向量的模式存储。向量（embedding）是一组数值，能够示意一个点在多维空间中的地位。向量数据库十分善于解决大量的高维embedding数据，这种数据在机器学习和深度学习利用中很常见。

发问：在最近半年里，向量数据库被广泛应用于大模型畛域。向量数据库在大模型畛域具体有哪些利用？

星爵：诸如GPT、Bard、Claude和LLaMA这样的大模型能够产生海量向量嵌入数据来表白简单的语义关系，但模型自身的存储空间无限，无奈长久保留这些数据。

向量数据库就像一块外置的记忆块，能够长期存储这些数据，供模型随时调用。向量数据库在LLM畛域的利用次要能够分为以下几类:

1、治理公有数据和知识库

开发者能够不便高效地将本人的畛域数据集或者公有数据集转换成向量格局，让大模型间接操作，而无需将这些数据裸露给模型训练方，无效爱护了数据隐衷和产权。

2、为大模型提供实时数据更新。

通过向量数据库能够为大模型提供实时的数据更新，解决大模型“胡说八道”的问题，而无需频繁重训模型。这比间接fine-tune模型的成本低很多。

3、实现大模型的个性化和加强。

开发者能够在向量数据库中增加上下文和本人的数据来扩大大模型的感知能力，实现个性化利用。

4、提供智能体的记忆。

智能体是大模型的一个新兴利用场景，用于构建具备独立智能的虚构人物、虚构代理甚至人形机器人。向量数据库不仅能够帮忙智能体记忆其感知的历史数据和上下文，帮其做出智能决策，还能使其依据长期记忆来实现自我演进。

5、保留大模型的处理结果。

向量数据库能够长久保留大模型解决过的数据，进行离线剖析和开掘。而不像大模型那样，用过即弃。比如说，开源我的项目GPTCache能够将大模型的查问后果缓存至向量数据库，防止反复计算，进步查问效率，这有点像CDN和Redis对网站数据的作用。

6、构建更简单的AI零碎。

在很多场景下，咱们须要将多个大模型和向量数据库串联，实现更弱小的性能。其中，多个大模型甚至是多模态模型独特负责解决语义，向量数据库负责数据流转。

对于大模型利用开发者来说，向量数据库是一个十分重要的基础设施，能够在最大限度施展大模型威力的同时爱护数据隐衷，实现更丰盛的性能。LLM和向量数据库独特推动AIGC的倒退，二者缺一不可。

全面拥抱大模型

发问：咱们理解到，Zilliz Cloud在两周前于硅谷公布了全面的产品更新和降级。这次产品升级背地的动机是什么？

星爵：咱们的出发点是all-in大模型利用开发。

在过来的几年里，咱们的开源产品Milvus和商业产品Zilliz Cloud被广泛应用于计算机视觉、NLP、举荐零碎、搜索引擎、主动驾驶和生物制药等畛域。在过来的半年里，向量数据库经验了它的iPhone时刻，数百万LLM利用开发者涌入，LLM利用开发成为了向量数据库的杀手级利用场景。泛滥的LLM利用开发者给咱们带来了大量新兴的需要，咱们决定拥抱这些变动，为LLM利用开发提供更全面、更便当的撑持。

发问：能不能具体介绍下Zilliz Cloud做了哪些更新和降级？

星爵：首先，引入了对RESTful API的全面反对。咱们看到新进的LLM开发者大多具备丰富的Web利用和挪动利用开发背景，他们相熟基于RESTful API将多个服务的能力串起来打造弱小的利用。有了RESTful API，开发者能够便捷地将「LLM+向量数据库+提醒词」三者连接起来，打造LLM应用程序。咱们将这种新开发范式称为CVP Stack，能极大进步开发效率。举个例子说，明道云的一位工程师应用RESTful API一天就实现了Zilliz Cloud和对方平台的整合。

其次，提供了动静schema。此前向量数据库采纳动态schema的形式，须要开发者在建表时依据业务定义数据的schema，这对于大型企业的成熟业务而言是一种常见的解决形式。然而，当下AIGC利用多处于晚期疾速迭代阶段，面向业务成果，须要频繁调整向量数据库内的字段，对于这类需要，重复重建schema构造以及频繁的数据重导入会重大影响产品的迭代速度。为此咱们引入了动静schema，反对用户依据开发须要动静灵便地进行数据处理。

再者，新增了JSON数据类型的反对。JSON是目前最风行且最灵便的数据表示形式之一，被宽泛地利用于利用程序开发中。咱们将MongoDB的根底能力搬进了向量数据库，用户在Zilliz Cloud上能够将JSON与embedding这两种超强能力相结合，实现基于JSON与embedding向量的混合数据表示和解决。

另外，咱们还引入了Partition Key，反对基于Partition Key的高效数据过滤；减少了组织和角色的概念，反对基于Role-Based Access Control（RBAC）的多粒度访问控制；减少了全面的LLM生态反对，深度整合了OpenAI、Claude、Cohere、LLaMA、Bard、Dolly、LangChain、LlamaIndex和Semantic Kernel等热门我的项目。

发问：咱们看到Zilliz Cloud之前只提供专有集群一种产品，此次新增了Serverless和云上公有部署两种产品。这背地的起因是什么？

星爵：Zilliz Cloud面向不同阶段的用户提供多种用户打算。

基于Serverless的入门打算

为每位用户提供一个收费的Serverless实例，开箱即用，可反对百万条数据规模的向量检索，适宜集体开发者和小型开发团队应用。

专有集群产品

面向大型开发团队和企业，专一高性能、高可用、高可扩展性、智能运维和优化、数据安全以及麻利技术支持等企业级个性，并提供性能型、容量型、经济型三类实例类型，满足企业不同维度的业务需要。

自托管打算

容许用户在其虚构公有云（VPC）上部署咱们的向量数据库服务，提供齐全管制，它是重视隐衷、数据安全和合规的大型企业的现实抉择。

通过提供不同状态的产品，咱们心愿满足LLM开发者在不同倒退阶段的须要，让每一个开发者、每一个开发团队、每一个企业都能不便地应用向量数据库服务，减速实现AI数据根底软件的普及化。

向量数据库市场的竞争和趋势

发问：今年以来，多家向量数据库初创公司取得了大额融资，一些大厂也纷纷把向量数据库的研发列入日程。你怎么对待日益升温的竞争？

星爵：竞争意味着市场确认和机会。竞争的加剧阐明向量数据库的价值失去了市场的宽泛认可，其市场机会和后劲得以证实。与此同时，强烈的竞争也在肯定水平上推动了技术的提高，这对消费者和整个行业而言都大有裨益，是一件实打实的坏事。

当然，这种竞争环境迫使公司更加关注客户的需要。这意味着咱们必须亲密关注市场趋势，并适应这些变动，以提供客户真正须要的解决方案。咱们必须不断创新和优化咱们的产品和服务。这对LLM开发者和整个行业来说都是无益的。我置信在一个衰弱的生态系统中，有多个玩家是至关重要的。这为开发者和客户提供了抉择，也为行业设置了规范。

在Zilliz，咱们作为向量数据库行业的先行者和开拓者，尤其欢送这种竞争。咱们将持续致力于推动向量数据库技术的倒退，并与其余参与者一起，为用户提供最先进的工具和服务。

发问：方才你提到了行业标准，在关系型数据库畛域有TPC-C和TPC-H这样的benchmark，向量数据库畛域有相似的benchmark么？

星爵：目前还没有规范的benchmark，这给开发者和企业在向量数据库产品比照和抉择时造成了很多的纳闷和艰难。

为此，咱们近期凋谢了一套开源的向量数据库评测工具VectorDBBench（https://github.com/zilliztech/VectorDBBench）。

该工具蕴含一套标准化数据集，联合多个典型场景，笼罩数据插入与索引构建、向量查问、混合查问、数据容量等多个能力维度，同时反对用户自定义的数据集与测试场景。

咱们欢送开发者们参加到这个开源benchmark的开发和迭代中来，心愿VectorDBBench能倒退成为像ClickBench这样的行业标准。

发问：你认为向量数据库赛道将来竞争的外围是什么？

星爵：向量数据库作为一款数据库产品，“更大更快更便宜”是将来倒退的外围趋势。更大是指能解决更大的数据量，这意味着反对百亿条数据甚至更高的可扩展性；更快是指更高的性能，包含毫秒级的响应工夫和高达数万的QPS；更便宜是指更少的资源耗费更高的性价比，在雷同资源耗费的状况下提供更弱小的性能。

咱们的Zilliz Cloud基于Milvus开源我的项目，这是寰球当初惟一一款真正分布式的向量数据库系统，能提供数百亿条向量数据的毫秒级查问。得益于Milvus的云原生架构，Zilliz Cloud高效地实现了多租户能力，在雷同的实例配置下，性能远超其余竞品。举个例子说，在基于VectorDBBench的评测中，Zilliz Cloud性能是Pinecone的两倍以上，综合性价比超过Pinecone三倍以上。

国内云产品行将推出

发问：Zilliz Cloud当初曾经反对了AWS和GCP，有没有打算反对国内云平台？

星爵：咱们打算在往年7月上旬推出国内的云服务产品，首期预计会反对阿里云、百度云、腾讯云和金山云，并将逐渐笼罩国内更多的云厂商。Zilliz Cloud国内云产品定价相比海内产品将会有较大幅度的下调，致力于为国内用户提供最高性价比的全托管向量数据库服务。

参考链接：

Zilliz Cloud：https://zilliz.com/cloud
Milvus：https://milvus.iohttps://github.com/milvus-io/milvus
VectorDBBench：https://github.com/zilliztech/VectorDBBench
GPTcache：https://github.com/zilliztech/GPTCache

（本文为转载文章，原文刊载于微信公众号【量子位】）

🌟全托管 Milvus SaaS/PaaS 行将上线，由 Zilliz 原厂打造！笼罩阿里云、百度智能云、腾讯云、金山云。目前已反对申请试用，企业用户 PoC 申请或其余商务单干请分割 business@zilliz.com。

如果在应用 Milvus 或 Zilliz 产品有任何问题，可增加小助手微信 “zilliz-tech” 退出交换群。
欢送关注微信公众号“Zilliz”，理解最新资讯。

本文由mdnice多平台公布

关于人工智能:给大模型持久记忆GitHub-2万星向量数据库云服务升级国内云产品下周上线

大模型的数据基础设施

全面拥抱大模型

基于Serverless的入门打算

向量数据库市场的竞争和趋势

国内云产品行将推出

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于人工智能:给大模型持久记忆GitHub-2万星向量数据库云服务升级国内云产品下周上线

大模型的数据基础设施

全面拥抱大模型

基于Serverless的入门打算

向量数据库市场的竞争和趋势

国内云产品行将推出

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复