共计 1942 个字符,预计需要花费 5 分钟才能阅读完成。
过来一年,ChatGPT 和其余大语言模型(LLMs)的爆火也带动了向量数据库的倒退。
许多用户在搭建检索加强生成(RAG)零碎过程中抉择了应用向量数据库 Zilliz Cloud,但 Zilliz Cloud 的性能不止于此,它在搜寻和检索系统中的利用也非常宽泛。这也反映出了 Zilliz Cloud 产品的设计初衷——帮忙计算机真正了解人类数据,包含文本、图像、银行交易用户行为等。
近期,Zilliz Cloud 公布了新版本,并上线了 Range Search、多租户和 RBAC 等新个性。同时,Zilliz Cloud 搜寻和索引性能也晋升了 10 倍,取得了许多用户的踊跃反馈。本文将通过 3 个实在的用户案例,展现 Zilliz Cloud 的新个性是如何为其赋能的。
01. 智能问答机器人
对于智能问答机器人而言,一个重要组成部分就是记忆——特指传入 LLM 中的上下文文本片段。通过记忆,问答机器人就能够获取历史信息。然而 LLM 的上下文窗口有着严格限度:
1)长度限度
2)上下文过长将明显降低文本生成速度
3)大多数长上下文 LLM 只偏向于“记住”上下文窗口开始和完结的信息
向量数据库可能很好地解决上述问题。以客服机器人为例,机器人会收到许多不同的信息,蕴含原始知识库、用户的所有提醒、用户上传的图像、音频片段、回复内容等,这些都存储在 Zilliz Cloud 中以便进行疾速检索。每当用户输出音讯时,都会优先检索来自知识库和之前对话的所有相干内容。这样一来,零碎的读写负载会减轻,每秒须要存储大量音讯数据。此外,提供给客服机器人的的数据实质上是多模态的,因而,仅有文本搜寻是远远不够的。
Zilliz Cloud 的分布式数据库架构可能很好地解决上述问题:减少查问节点数量以进步读取吞吐量,减少数据节点数量以进步写入吞吐量。此外,新公布的 Cardinal 搜索引擎中进行了多方面的性能优化,蕴含 Zilliz 自研的向量索引、机器代码级别的计算优化,以及优化缓存感知算法等。
总而言之,在问答机器人的用例中,用 Zilliz Cloud 后能够实现与其余向量数据库雷同的搜寻和索引吞吐量,但价格却不到其余解决方案的三分之一。因而,在思考老本但同时保障性能的用例中,Zilliz Cloud 相对是一个不错的抉择。
02. 商品举荐
举荐零碎 (https://zilliz.com.cn/use-cases/recommender-system) 会依据消费者之前的观看或浏览历史推送各种内容,例如产品、新闻、用户内容等,向量数据库非常适合用来搭建这类利用。开发者能够将内容转化为向量并将数据存储在 Zilliz Cloud,随后通过调用 collection.search
便可轻松进行向量相似性搜寻获取相干内容,实现举荐。
搜寻速度和相关性是所有 B2C 产品的基石。在电商畛域,产品举荐后果对整体用户体验尤为要害,很大水平上能够决定收益。Zilliz 在理论利用中发现,有用户的诉求就是通过借助 AI 的力量晋升产品举荐零碎性能。这些用户和用例对延时和吞吐量有着极高要求——向量数据库须要在 10 毫秒内实现查问。此外,举荐零碎还需对搜寻后果进行过滤(例如,依据服装的特定尺寸或特定鞋码筛选搜寻后果)。从实质上来说,商品数据是简单的多模态数据,蕴含了产品名称、产品描述、产品图片等数据。
Cardinal 可能满足用户对性能的要求,再配合动静 Schema 性能和反对 JSON 的个性加持,Zilliz Cloud 便成为此类用户的不二之选。有了 Zilliz Cloud,用户便可能依据每个产品类别的特定特色,定制本人的数据模型,从而确保无效存储和查问每个商品向量数据多样且简单的元数据。
03.AI 制药
制药过程极其简单艰难,不同的药物分子大小不同,有些药物可能具备几十个原子的“小分子”,有些则是具备数万个原子的大型生物制剂。机器学习能够依据药物效用(如医治特定疾病或缓解特定症状)将每个分子转化为向量。
在此用例中,Zilliz Cloud 的 Rang Search 性能就能施展关键作用。钻研人员能够将须要医治的疾病或症状转化为向量,并在 Zilliz Cloud 中搜寻相干药物。相比根底的 top-k 搜寻,Rang Search 可能在肯定间隔内找到与指标类似的所有向量(分子),提供所有在此范畴内的相干搜寻后果,而不仅仅是固定数量的后果。此性能不仅对 AI 制药至关重要,也实用于欺诈爱护、网络安全等畛域。例如,在银行零碎中,咱们能够将交易转化为向量并通过范畴搜寻与新交易进行比拟,以辨认相似的历史流动,有助于进行异样检测。
本文中咱们通过 3 个业界典型用例介绍了 Zilliz Cloud 的局部新个性,欢送大家上手尝试 (https://cloud.zilliz.com.cn/signup) !
本文由 mdnice 多平台公布