关于人工智能:Zilliz-GOTC大模型的记忆体向量数据库的现在与未来

42次阅读

共计 3223 个字符,预计需要花费 9 分钟才能阅读完成。

近日,2023 寰球开源技术峰会(Global Open-source Technology Conference,以下简称 GOTC 2023)在上海张江迷信会堂召开,Zilliz 创始人兼首席执行官星爵、Zilliz 合伙人兼技术总监栾小凡以及 Zilliz 开发者关系及市场经营负责人李晨受邀参会。

GOTC 2023 由上海浦东软件园、凋谢原子开源基金会、Linux 基金会亚太区和开源中国联结发动,以行业展览、主题发言、专题论坛、开源市集多种形式出现,主题为 Open source,into the future,在本次主题的框架之下,开源、AIGC、供应链平安等话题成为大会探讨的重点。

其中,引人侧目标是主论坛对于 AIGC 主题的探讨。2023 年,ChatGPT 的倒退引发 AI 畛域对于 AIGC 技术的探讨。在腾讯开源联盟主席、OpenCloudOS 社区秘书长单致豪的主持下,LF AI & Data 基金会执行董事、PyTorch 基金会执行董事 Ibrahim Haddad,Zilliz 创始人兼首席执行官星爵,NVIDIA 工程和解决方案高级总监赖豪杰,Untiy 中国技术副总裁左瑞文探讨了 AIGC 技术如何重塑互联网畛域和寰球社会。

星爵示意:“以 ChatGPT 为代表的大模型仍处于倒退过程中,‘常识储备’非常无限,经常出现‘AI 幻觉’,加上大模型的训练老本昂扬,使得大模型的利用受到诸多限度。向量数据库作为大模型的记忆体,不仅可能为其提供数据存储,而且能通过数据检索的形式让大模型进行常识加强。在向量数据库的加持下,大模型将变得博闻强识、老本可控。”

|Zilliz 创始人兼首席执行官星爵

在随后对于开源话题的探讨中,星爵感叹颇深:从大教堂模式到集市模式,开源以它那海纳百川般的翻新精力感化着每一位开发者,也为开源我的项目赋予了长久的生命力和力量,Zilliz 的第一个开源我的项目 Milvus 也不例外。从在 GitHub 上将第一行代码开源到成长为寰球当先的向量数据库,从一个开源我的项目倒退成领有成千家企业级用户体量的产品,Milvus 受害良多,而这所有都源自开源。

开源的力量自不必说,这股星星之火烧到了大模型时代,星爵认为,将来肯定会呈现越来越多的开源模型,尤其是垂直畛域的小模型。当下,ChatGPT 的通用大模型是超级计算机,而大家手中罕用的工具是 PC 笔记本、手机等,将来可能同时须要十几个模型配合工作,这时候小模型的劣势就会凸显进去。再配合垂直畛域训练的加持,小模型在资源配置方面会变得更加高效。因而,开源大模型与开源小模型并存将是常态。

在次日的“数据与数据库技术”论坛中,栾小凡则带来了名为《大模型构建的 AI 原生数据库 Milvus》的主题演讲。

|Zilliz 合伙人、技术总监栾小凡

栾小凡提到,当下“AI 幻觉”是大模型的次要痛点之一,因为信息密度有余,大模型常常会生成一些无意义或不可信的内容。在此状况下,有三种计划能够解决这一问题:微调模型、管制 prompt、构建知识库。

微调模型是大略三五年前比拟风行的解决形式,一来须要足够多的数据对微调进行撑持,二来对算力要求较高,整体较难实现。管制 prompt 是通过 prompt 对内容的抉择和长度加以限度,不过这同时也会限度信息量,最终仍无奈失去现实的后果。知识库是为大模型灌输额定的常识,为其提供更多参考,不过因为知识库的内容未必都对问题有帮忙,须要对它们进行语义搜寻或初步筛选,这时候便须要 CVP Stack。

何为 CVP Stack?C 是 ChatGPT,即利用大语言模型实现以 ChatGPT 为代表的智能问答;V 是 Vector database,即通过向量数据库为 ChatGPT 提供大规模的、牢靠的知识库;P 是 Prompt as code,即应用提醒匹配用户问题与来自知识库的参考内容。CVP Stack 的利用场景代表为面向开源用户和开源社区运维人员的问答机器人 OSSChat(https://osschat.io/)以及 GPT 的缓存层 GPTCache(https://github.com/zilliztech/GPTCache)。

在整个 CVP Stack 中,向量数据库扮演着重要角色,它是为 AI 而生的数据库,Milvus 是这一赛道的奠基者与领先者。Milvus 2.0 是云原生分布式的一款向量数据库,具备百亿规模的向量可扩展性,可能实现存储计算拆散、离在线一体化等。同时,Milvus 2.0 的性能亦值得关注,它的查问速度高于 ES 10 倍,高于支流竞品 2 倍,具备毫秒级提早响应。此外,可插拔引擎、云端一体的特点也让 Milvus 2.0 成为寰球当先的向量数据库。

而 Milvus 的下一站是全托管 SaaS 服务的 Zilliz Cloud,它具备保护成本低、应用门槛低、丰盛的企业级个性、平安释怀的特点。目前,Zilliz Cloud 已反对 AWS、GCD,往年 6 月底行将登陆阿里云,以便可能更好地为国内用户服务。

在“AI is Everywhere”的论坛上,李晨以《向量数据库,大模型的记忆体》为主题进行了分享。

|Zilliz 开发者关系及市场经营负责人李晨

李晨着重解释了向量数据库为何是大模型的记忆体。他示意,在 CVP Stack 之中,Vector Database 作为一个大模型的内部存储,能够为大模型提供最无效的常识加强计划。再深刻点了解,如果把大模型看作人类的大脑,那么这个大脑除了须要具备弱小的计算能力,还须要领有与之匹配的存储能力。在传统的经典计算架构中,冯·诺伊曼架构是计算与存储拆散的模式,这也成为大模型的趋势。起因在于,纵观整个计算机倒退历史,存储的价格用于低于计算价格一个乃至多个数量级,大模型也不例外,在老本与计算的双重考量下,如向量数据库个别的内部存储的重要性,显而易见。

在向量数据库的加持下,大模型将以更低的老本失去更智能的常识加强成果。那么,失去常识加强后的大模型,下一站在哪里?答案是智能体(Intelligent agents)。

例如 Auto-GPT,能够了解为齐全自制的 GPT-4,它齐全具备思维推导与执行的能力,将来甚至可能产生相似智能体的思考。又如斯坦福和谷歌做的名为“Generative Agents: Interactive Simulacra of Human Behavior”的钻研,他们在一个虚拟环境中模仿了几个卡通人,每个卡通人都具备自主的判断能力和意识,能够在虚拟世界中生存、交互、成长。

此外,第一个智能体机器人的虚拟社区 Chirper.ai、AI 分身、小说创作公司开始制作人物的虚构实体、游戏公司开始用虚构分身与玩家交互、聊天……

这其中,除了须要借助大模型的能力,也要用到向量数据库的能力。在此状况下,向量数据库将来将迎来百万级的市场增长,将来可期。

  • 对于 Zilliz

Zilliz 作为向量数据库畛域的拓荒者与奠基者,不仅创始了向量数据库赛道,也提供了世界上最快的向量数据库产品。随着近一年来大模型的火爆,Zilliz 也迎来了全世界的关注:早在 3 月份英伟达寰球开发者大会上,Milvus 便作为向量数据库的代表被黄仁勋提名;紧接着 Zilliz 旗下的 Milvus 和 Zilliz Cloud,也成为了 OpenAI 官网首批 plugin 单干的向量数据库。最近,Zilliz 先后接入和反对了各种热门的我的项目,例如 LangChain、Auto-GPT、BabyAGI 等,成为寰球最煊赫一时的向量数据库品牌。

Zilliz 产品生态丰盛,致力于构建开源 + 云的大模型增强计划,其中开源向量数据库 Milvus 扮演着大模型知识库的角色;Towhee 能够为大模型提供编排服务;GPTCache 则为大模型提供缓存;Zilliz Cloud 能够为用户提供开箱即用的全托管向量检索服务。


  • 如果在应用 Milvus 或 Zilliz 产品有任何问题,可增加小助手微信“zilliz-tech”退出交换群。
  • 欢送关注微信公众号“Zilliz”,理解最新资讯。

本文由 mdnice 多平台公布

正文完
 0