共计 1267 个字符,预计需要花费 4 分钟才能阅读完成。
“AI 的 iPhone 时刻曾经到来。”
在刚刚完结的 NIVIDIA GTC Keynote 中,这句话被 NVIDIA CEO 黄仁勋重复提及,长达 1 个多小时的分享中,生成式 AI 相干的内容占据了绝大部分比重。他示意,生成式 AI 的炽热能力为企业带来了挑战,因此此次 Keynote 的重点次要是探讨“减速计算和 AI 如何成为弱小的工具,帮人们应答这些挑战和把握将来的微小时机。”
在减速库局部,黄仁勋首次提及向量数据库(Vector Database),并 强调对于构建专有大型语言模型的组织而言,向量数据库至关重要。
1. 向量数据库为何如此重要?
NIVIDIA GTC(英伟达 GPU 技术大会)是 AI 与元宇宙时代的开发者大会,参会者通常是学生、开发者、钻研人员、创作者、IT 决策者、企业首领等,次要探讨如何利用 AI、减速计算、数据迷信等技术力量塑造当今世界。此次 GTC Keynote,生成式 AI 毫无悬念地成为焦点。
在介绍减速库局部,黄仁勋提到,举荐零碎广泛应用向量数据库来存储、索引、搜寻和检索非结构化数据的大型数据集。向量数据库的一个新型重要用例是大型语言模型,在文本生成过程中可用于检索畛域特定事实或专有事实。
“咱们将推出一个新的库,即 RAFT,用于减速索引、数据加载和近邻检索。咱们正在将 RAFT 的减速引入到 Meta 的开源 FAISS AI 相似性搜寻,超过 1000 家组织应用的 Milvus 开源向量数据库以及 Docker 镜像下载次数超过 40 亿次的 Redis。对于构建专有大型语言模型的组织而言,向量数据库至关重要。”黄仁勋示意。
2.Milvus:世界上最快的向量数据库
黄仁勋在 Keynote 中提到的 Milvus 是寰球首家以“向量数据库”命名的非结构化数据我的项目,由商业公司 Zilliz 进行经营反对。截至目前,Milvus 已失去寰球上千家企业级用户的信赖,包含 NVIDIA、eBay、Shopee、Walmart、快手、宜家等,最大部署规模超过 10 亿向量。同时,在很多利用场景下,Milvus 的 QPS 超过 10K。
Milvus 典型的利用场景包含:在长文本畛域,能够进行翻译、问答、语义检索、情感剖析,语义检索和问答能够与 ChatGPT 配合应用,晋升其答复的准确度;在图片畛域能够进行去重、指标检测、图片检索、多模态的图文互搜;在视频畛域进行举荐、合规检测、分类等。
当然,也有很多新兴的利用场景,包含在生物制药畛域把生物分子式转化成向量,判断生物小分子与蛋白质是否紧密结合;在音频畛域进行去重、情感剖析;在风控畛域辨认潜在的危险;在主动驾驶畛域能够通过向量检索帮忙主动驾驶找出实时判断过程中没有剖析进去的物体。
值得一提的是,Milvus 近日上线了反对 GPU 的 2.3 Beta 版本,灵活性和性能失去显著晋升。不止如此,Milvus 2.3 Beta 版本还减少了 upsert、rangesearch、mmap 等社区用户呼声较高的性能,将为用户带来全新的降级体验!
AI 的 iPhone 时刻曾经到来,作为 AI 基础设施的向量数据库 Milvus 亦站在了新的节点上。
本文由 mdnice 多平台公布