关于开源:JTech-开源之夏|什么是比快更快的向量搜索

4次阅读

共计 760 个字符,预计需要花费 2 分钟才能阅读完成。

J-Tech Talk
由 Jina AI 社区为大家带来的技术分享工程师们将深刻细节地解说具体的问题分享
Jina AI 在开发过程中所积攒的教训

本期 J-Tech Talk 邀请到了在开源之夏我的项目中怀才不遇的杨小燕,分享她负责的我的项目《反对 Redis 数据库作为 DocArray 的存储后盾》帮忙更多的开发者高效地进行向量检索。

作为 Jina 生态的底层模块,DocArray 是一种可扩大的数据结构,完满适配深度学习工作。总的来说,DocArray 可能把非结构化数据,对立成同一种数据结构。反对的数据类型包含文本、图像、音频、视频、3D mesh 等,并且可能高效地解决、检索、举荐、存储及传输数据。在小燕的奉献下,DocArray 新增了 Redis 数据库的后端存储反对,当初 DocArray 反对了更多向量数据库作为存储后盾,如 Annlite,SQLite,Qdrant 以及 Elasticsearch 等。

分享内容

1、什么是 DocArray
DocArray 是一种为机器学习而生的数据结构工具包。
2、如何实现 DocArray 的 Redis 后端存储
增加 Redis 反对,能够应用基于图的 ANN 搜索算法:HNSW,该算法可能最大水平地达到检索召回率和检索工夫的均衡。
3、教训分享 – 在开源之夏和世界各地的工程师一起开发的体验

对于讲师杨小燕
Jina AI 开源社区 DocArray 贡献者中国原子能迷信研究院的核能迷信与工程业余硕士二年级在读,本科毕业于清华大学工程物理系。

流动工夫
2022 年 9 月 22 日 周四晚 19:00 – 19:45

开源之夏是由中国科学院软件研究所“开源软件供应链点亮打算”发动,并长期反对的一项暑期开源流动,由软件所与 OpenEuler 社区联结主办,旨在激励在校学生积极参与开源软件的开发保护,促成优良开源软件社区的蓬勃发展。
欢送私信申请报名流动~

正文完
 0