共计 2491 个字符,预计需要花费 7 分钟才能阅读完成。
面对高速增长的非结构化数据处理需要,Milvus 2.0 应运而生。Milvus 2.0 是一款面向 AI、专为大规模生产级场景设计的向量数据库系统。如何疾速上手这款非结构化数据处理神器?除了 Milvus 专属的命令行客户端 Milvus_cli,你还能够抉择 Zilliz 为 Milvus 专门开发的图形界面客户端—— Attu。
本期内容将手把手带你应用 Attu 进行向量搜寻。
/ ˈætu /
Attu
人迹罕至的阿图岛位于阿留申群岛最西端,
国际日期变更线在这里拐了一个微小的弯,
人类文明建造的工夫概念摇摇摆摆。
八十年后草木曾经吞噬战场,
冬季的午夜亮堂异样,
微小的鹰隼在风暴中回旋。
荒凉秘境 Attu
象征着开荒路上的壮士精力。
相较于 Milvus_cli 简略间接的应用体验,Attu 带来更多的个性:
- 提供 Win,Mac,Linux 可执行安装包
- 易用的图形化界面,治理 Milvus 更不便
- Milvus 次要性能全笼罩
- 插件不便拓展自定义性能
- 零碎拓扑图信息齐备,易于应用;帮忙运维人员了解零碎架构,不便零碎调试
接下来,让咱们看看 Attu 到底有什么乾坤。
装置与运行
你能够在 https://github.com/zilliztech… 找到最新公布的版本,Attu 提供各平台的可执行文件安装包,源码全副开源,欢送大家提交 pull request。
Attu 以后版本安装包与源码
你还能够应用 docker 装置 Attu:
docker run -p 8000:3000 -e HOST_URL=http://{attu IP}:8000 -e MILVUS_URL={milvus server IP}:19530 zilliz/attu:latest
其中,attu
`IP 示意运行 attu 环境的 IP 地址,
milvus server `IP
是运行 Milvus 环境的 IP 地址。
启动胜利后的界面如下图所示,输出正确的 Milvus IP 及端口就能进入 Attu 了!
性能概览
开展左侧的导航栏,你能够看到目前有 Overview、Collection、Vector Search 和 System View 四大标签页。
其中,Overview 列出目前 Milvus 中曾经加载的所有 collections,如上图所示。
Collections 页面以列表模式出现所有 collections,包含 loaded 和 unloaded,别离代表了 milvus 的 collection 是否加载。
Vector Search 及 System View 两个标签页都是以 插件 的模式加载到 Attu 中的,对于插件的具体概念和应用办法将在文末具体介绍。
其中,Vector Search 是用来进行向量搜寻的界面:
System View 以拓扑模式展示 Milvus 零碎的构造,并具体列出每个节点的具体信息:
在拓扑图中点击单节点,能够看到该节点的具体信息:
性能演示
接下来,咱们将应用测试数据,与你一起摸索 Attu 的各个性能。
测试数据见:https://github.com/zilliztech…
首先,在 collection 创立一个名为 test 的 collection,增加 4 个 field 别离为:
Field Name: id
Field Name: vector Dimension: 128
Field Name: brand Field Type: Int64
Field Name: color Field Type: Int64
创立结束后,点击 load,因为只有 loaded collection 才能够被搜寻。
此时在 overview 界面曾经能够看到新创建的 test collection 了:
当初,咱们来创立数据,import 预约义的测试数据 example_vectors.csv
查看导入的数据,在 Overview 或者 Collection 界面点击 collection name 能够进入 query 界面。
增加 filter(1),新增条件 id
` !=
`0
(2),点击 apply filter(3),点击 query(4)。
能够看到 50 条数据都曾经胜利导入了:
接下来,咱们试一下向量搜寻。
在 vector value 中贴入 search_vectors.csv 文件中的其中一条记录,而后抉择 test collection,点击 search:
能够看到向量间的间隔计算的后果,也不须要写代码,就能疾速验证向量搜寻的后果,十分不便。
最初,让咱们来看一下 System View。
因为目前仅有 node sdk 封装了 metrics api,该 api 能够实时获取 Milvus 目前零碎状态、节点间关系、以及每个节点本身的状态。
作为 Attu 的特有性能,System View 蕴含了一张残缺的 Milvus 零碎拓扑图,点击拓扑图中的每个节点,能够理解到节点本身的状态变动(每 10 秒动静刷新)。
点击具体子节点,能够进入 node list view,该视图用来查看每个 coord 下治理的所有子节点列表及状态。通过排序,能够迅速定位到高 CPU 占用或者高内存占用节点,不便排查问题。
One more thing……
前文提到,目前零碎中的 Vector Search 及 System View 两个标签页是以 插件 的模式加载到 Attu 中的。
咱们激励用户开发满足本身业务须要的组件,以插件的模式增加到 Attu 中来。在 Attu 代码中,有专门的 plugins 目录用来寄存插件代码。
你能够参考其中任意一个插件的代码来学习如何创立插件。配置如下 config 文件,零碎就会加载插件到 Attu 中来:
更多帮忙
Attu 具体文档请查阅:attu/doc at main · zilliztech/attu、https://milvus.io/docs/v2.0.0…
Attu 正在继续优化中,如果你有任何问题,欢送提交 GitHub Issue,一起为 Attu 添砖加瓦!
提交 issue:https://github.com/zilliztech…
心愿 Attu 能够帮忙你更轻松地应用 Milvus 向量数据库,也欢送扫码填写 Attu 产品调研问卷
,您的倡议会让咱们做得更好!
周四(3 月 3 日),咱们还邀请了 Zilliz 前端工程师陈臻直播介绍 Milvus_Cli & Attu 的性能,并分享开发教训,敬请期待!