关于人工智能:Zilliz-GOTC大模型的记忆体向量数据库的现在与未来

近日，2023 寰球开源技术峰会（Global Open-source Technology Conference，以下简称 GOTC 2023 ）在上海张江迷信会堂召开，Zilliz 创始人兼首席执行官星爵、Zilliz 合伙人兼技术总监栾小凡以及 Zilliz 开发者关系及市场经营负责人李晨受邀参会。

GOTC 2023 由上海浦东软件园、凋谢原子开源基金会、 Linux 基金会亚太区和开源中国联结发动，以行业展览、主题发言、专题论坛、开源市集多种形式出现，主题为 Open source，into the future，在本次主题的框架之下，开源、AIGC、供应链平安等话题成为大会探讨的重点。

其中，引人侧目标是主论坛对于 AIGC 主题的探讨。2023 年，ChatGPT 的倒退引发 AI 畛域对于 AIGC 技术的探讨。在腾讯开源联盟主席、OpenCloudOS 社区秘书长单致豪的主持下，LF AI & Data 基金会执行董事、PyTorch 基金会执行董事 Ibrahim Haddad，Zilliz 创始人兼首席执行官星爵，NVIDIA 工程和解决方案高级总监赖豪杰，Untiy 中国技术副总裁左瑞文探讨了 AIGC 技术如何重塑互联网畛域和寰球社会。

星爵示意：“以 ChatGPT 为代表的大模型仍处于倒退过程中，‘常识储备’非常无限，经常出现‘AI 幻觉’，加上大模型的训练老本昂扬，使得大模型的利用受到诸多限度。向量数据库作为大模型的记忆体，不仅可能为其提供数据存储，而且能通过数据检索的形式让大模型进行常识加强。在向量数据库的加持下，大模型将变得博闻强识、老本可控。”

｜Zilliz 创始人兼首席执行官星爵

在随后对于开源话题的探讨中，星爵感叹颇深：从大教堂模式到集市模式，开源以它那海纳百川般的翻新精力感化着每一位开发者，也为开源我的项目赋予了长久的生命力和力量，Zilliz 的第一个开源我的项目 Milvus 也不例外。从在 GitHub 上将第一行代码开源到成长为寰球当先的向量数据库，从一个开源我的项目倒退成领有成千家企业级用户体量的产品，Milvus 受害良多，而这所有都源自开源。

开源的力量自不必说，这股星星之火烧到了大模型时代，星爵认为，将来肯定会呈现越来越多的开源模型，尤其是垂直畛域的小模型。当下，ChatGPT 的通用大模型是超级计算机，而大家手中罕用的工具是 PC 笔记本、手机等，将来可能同时须要十几个模型配合工作，这时候小模型的劣势就会凸显进去。再配合垂直畛域训练的加持，小模型在资源配置方面会变得更加高效。因而，开源大模型与开源小模型并存将是常态。

在次日的“数据与数据库技术”论坛中，栾小凡则带来了名为《大模型构建的 AI 原生数据库 Milvus》的主题演讲。

｜Zilliz 合伙人、技术总监栾小凡

栾小凡提到，当下“AI 幻觉”是大模型的次要痛点之一，因为信息密度有余，大模型常常会生成一些无意义或不可信的内容。在此状况下，有三种计划能够解决这一问题：微调模型、管制 prompt、构建知识库。

微调模型是大略三五年前比拟风行的解决形式，一来须要足够多的数据对微调进行撑持，二来对算力要求较高，整体较难实现。管制 prompt 是通过 prompt 对内容的抉择和长度加以限度，不过这同时也会限度信息量，最终仍无奈失去现实的后果。知识库是为大模型灌输额定的常识，为其提供更多参考，不过因为知识库的内容未必都对问题有帮忙，须要对它们进行语义搜寻或初步筛选，这时候便须要 CVP Stack。

何为 CVP Stack？C 是 ChatGPT，即利用大语言模型实现以 ChatGPT 为代表的智能问答；V 是 Vector database，即通过向量数据库为 ChatGPT 提供大规模的、牢靠的知识库；P 是 Prompt as code，即应用提醒匹配用户问题与来自知识库的参考内容。CVP Stack 的利用场景代表为面向开源用户和开源社区运维人员的问答机器人 OSSChat（https://osschat.io/）以及 GPT 的缓存层 GPTCache(https://github.com/zilliztech/GPTCache)。

在整个 CVP Stack 中，向量数据库扮演着重要角色，它是为 AI 而生的数据库，Milvus 是这一赛道的奠基者与领先者。Milvus 2.0 是云原生分布式的一款向量数据库，具备百亿规模的向量可扩展性，可能实现存储计算拆散、离在线一体化等。同时，Milvus 2.0 的性能亦值得关注，它的查问速度高于 ES 10 倍，高于支流竞品 2 倍，具备毫秒级提早响应。此外，可插拔引擎、云端一体的特点也让 Milvus 2.0 成为寰球当先的向量数据库。

而 Milvus 的下一站是全托管 SaaS 服务的 Zilliz Cloud，它具备保护成本低、应用门槛低、丰盛的企业级个性、平安释怀的特点。目前，Zilliz Cloud 已反对 AWS、GCD，往年 6 月底行将登陆阿里云，以便可能更好地为国内用户服务。

在“AI is Everywhere”的论坛上，李晨以《向量数据库，大模型的记忆体》为主题进行了分享。

｜Zilliz 开发者关系及市场经营负责人李晨

李晨着重解释了向量数据库为何是大模型的记忆体。他示意，在 CVP Stack 之中，Vector Database 作为一个大模型的内部存储，能够为大模型提供最无效的常识加强计划。再深刻点了解，如果把大模型看作人类的大脑，那么这个大脑除了须要具备弱小的计算能力，还须要领有与之匹配的存储能力。在传统的经典计算架构中，冯·诺伊曼架构是计算与存储拆散的模式，这也成为大模型的趋势。起因在于，纵观整个计算机倒退历史，存储的价格用于低于计算价格一个乃至多个数量级，大模型也不例外，在老本与计算的双重考量下，如向量数据库个别的内部存储的重要性，显而易见。

在向量数据库的加持下，大模型将以更低的老本失去更智能的常识加强成果。那么，失去常识加强后的大模型，下一站在哪里？答案是智能体（ Intelligent agents）。

例如 Auto-GPT，能够了解为齐全自制的 GPT-4，它齐全具备思维推导与执行的能力，将来甚至可能产生相似智能体的思考。又如斯坦福和谷歌做的名为“Generative Agents: Interactive Simulacra of Human Behavior”的钻研，他们在一个虚拟环境中模仿了几个卡通人，每个卡通人都具备自主的判断能力和意识，能够在虚拟世界中生存、交互、成长。

此外，第一个智能体机器人的虚拟社区 Chirper.ai、AI 分身、小说创作公司开始制作人物的虚构实体、游戏公司开始用虚构分身与玩家交互、聊天……

这其中，除了须要借助大模型的能力，也要用到向量数据库的能力。在此状况下，向量数据库将来将迎来百万级的市场增长，将来可期。

对于 Zilliz

Zilliz 作为向量数据库畛域的拓荒者与奠基者，不仅创始了向量数据库赛道，也提供了世界上最快的向量数据库产品。随着近一年来大模型的火爆，Zilliz 也迎来了全世界的关注：早在 3 月份英伟达寰球开发者大会上，Milvus 便作为向量数据库的代表被黄仁勋提名；紧接着 Zilliz 旗下的 Milvus 和 Zilliz Cloud ，也成为了 OpenAI 官网首批 plugin 单干的向量数据库。最近，Zilliz 先后接入和反对了各种热门的我的项目，例如 LangChain、 Auto-GPT、BabyAGI 等，成为寰球最煊赫一时的向量数据库品牌。

Zilliz 产品生态丰盛，致力于构建开源+云的大模型增强计划，其中开源向量数据库 Milvus 扮演着大模型知识库的角色；Towhee 能够为大模型提供编排服务；GPTCache 则为大模型提供缓存；Zilliz Cloud 能够为用户提供开箱即用的全托管向量检索服务。

如果在应用 Milvus 或 Zilliz 产品有任何问题，可增加小助手微信 “zilliz-tech” 退出交换群。
欢送关注微信公众号“Zilliz”，理解最新资讯。

本文由mdnice多平台公布

关于人工智能:Zilliz-GOTC大模型的记忆体向量数据库的现在与未来

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于人工智能:Zilliz-GOTC大模型的记忆体向量数据库的现在与未来

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复