关于人工智能:向量数据库的行业标准逐渐清晰Vector-DB-Bench-正式开源

48次阅读

共计 2218 个字符,预计需要花费 6 分钟才能阅读完成。

大模型带火了向量数据库赛道,也让各式各样的向量数据库进入开发者视线。

对于开发者而言,如何抉择一个适宜本人的向量数据库至关重要。不过,向量数据库的选型并不简略,开发者不仅须要对市面上各种开源和闭源的数据库进行全面的性能评估,还要依据本人的业务数据设计测试计划……为了让更多开发者能够匹配到适宜本人业务的向量数据库,咱们开发了一个全新的开源性能测试工具——Vector DB Bench,它能够通过测量要害指标来掂量向量数据库的性能,使得向量数据库施展出最大的潜能。

本文将从 Vector DB Bench 的特点和长处登程,帮忙开发者全面、主观、高效地评估向量数据库。

01. 开发背景

在设计 Vector DB Bench 的过程中,咱们思考了很多因素,包含测试目标、用例准确定义要求、数据的形态等。

首先是测试目标,性能测试旨在测量和比拟不同状况下零碎、应用程序或组件的性能。开发者能够应用它来评估不同办法的有效性和效率,并理解如何改良。

用例准确定义要求对性能测试同样非常重要。例如,如果用户正在解决大型数据集,可能会想要理解数据库能够解决多少向量或数据库搜寻性能(检索相干数据的速度)。此外,测试过滤性能能够帮忙查看零碎如何解决大型数据集的简单查问。

最初是数据的形态。数据的形态是指开发者打算在向量数据库中存储和应用的向量数量和向量维度。在设计性能测试时,数据形态能够影响零碎的性能。

02. 设计指标

以下是咱们在构建开源性能测试工具时思考的一些设计指标:

  • 灵便、可扩大:基准测试工具应灵便、可扩大。它应反对多个向量数据库系统,以便开发者可能轻松地进行性能测试和比拟不同选项。此外,该工具应具备模块化架构,以反对增加更多向量数据库、指标和自定义测试场景,使开发者可能依据具体要求自定义评估。
  • 实在负载模仿:基准测试工具应利用开发者的工作负载作为实在负载模仿,以确保精确的性能评估。模仿开发者的理论用例和查问模式能够提供无关各种状况下数据库行为的见解。这种模仿有助于掂量向量数据库在理论状况下的体现,确定其适用性。
  • 交互式报告和可视化:该工具应具备生成报告和可视化的直观零碎,以便轻松辨认性能瓶颈、比拟数据库,并理解如何优化。这些报告将是重要的决策资源,可促成无效的团队沟通。
  • 开源社区合作:该工具应是开源的,以促成向量数据库用户和开发人员的合作。通过共享见解、最佳实际和性能后果,社区独特为改良和欠缺该工具做出奉献,最终帮忙开发人员抉择适宜工作的正确工具。

03.Vector DB Bench – 开源基准测试工具

Vector DB Bench 是为谋求高性能数据存储和检索系统的用户设计的开源性能测试工具,它容许用户测试和比拟不同向量数据库系统的性能,以确定最适宜的数据库系统。应用 Vector DB Bench 后,用户能够依据他们正在评估的数据库系统的理论性能做出理智的决策,而不是依赖于营销宣传。

Vector DB Bench 是用 Python 编写的,已取得 MIT 开源许可证受权,任何人都能够自在应用、批改这一工具。相干的开发人员也在踊跃改良其性能和性能中。

04. 疾速开始

应用 pip 下载 Vector DB Bench 并应用以下命令进行装置:pip install vectordb-bench。而后运行以下命令:init_bench。

咱们将看到屏幕显示“Vector Database Benchmark”页面。此页面显示以后月份曾经进行的测试后果。从这个页面,能够跳转至“QPS with Pricing”页面,按云服务的定价排序查看后果。这些测试曾经涵盖不同规模的数据集进行了全面的测试。

要执行本人的测试,能够转到“Run Your Test”页面进行设置。

05. 如何设置 Vector DB Bench 自行测试?

如需自行测试,请跳转至“Run Your Test”页面,并抉择要测试的向量数据库,并增加这些向量数据库的配置。抉择不同数据库还将显示不同 uri、用户名、明码和 db 标签。Vector DB Bench 目前反对六个向量数据库:Milvus、Zilliz Cloud、Pinecone、WeaviateCloud、QdrantCloud 和 ElasticCloud。设置要运行的测试类型(容量或搜寻性能)、索引类型、用例(搜寻、低或高过滤)和数据集大小(小、中和大)。

在抉择所需配置后,能够运行测试并期待后果。

在后果页面上,能够查看测试后果。如果抉择了多个数据库进行测试,将看到比照后果。开发者还能够自在分享在本地示例上运行的测试后果。

欢送大家分享对 Vector DB Bench(https://github.com/zilliztech/VectorDBBench)的应用体验,当然也能够退出咱们的 GitHub 或 Vector DB Bench slack 频道(https://milvusio.slack.com/?redir=%2Fapp_redirect%3Fchannel%3…),点击链接感触测试工具的便捷!

🌟全托管 Milvus SaaS/PaaS 行将上线,由 Zilliz 原厂打造!笼罩阿里云、百度智能云、腾讯云、金山云。目前已反对申请试用,企业用户 PoC 申请或其余商务单干请分割 business@zilliz.com。


  • 如果在应用 Milvus 或 Zilliz 产品有任何问题,可增加小助手微信“zilliz-tech”退出交换群。
  • 欢送关注微信公众号“Zilliz”,理解最新资讯。

本文由 mdnice 多平台公布

正文完
 0