共计 1365 个字符,预计需要花费 4 分钟才能阅读完成。
简介: 阿里云作为国内首家上线 Elasticsearch 8.9 版本的厂商,在提供 Elasticsearch Relevance Engine™ (ESRE™) 引擎的根底上,提供加强 AI 的最佳实际与 ES 自身的混合搜寻能力,为用户带来了更多翻新和摸索的可能性。
近年来,人工智能的疾速倒退和广泛应用在各个行业中都获得了显著的成绩。在搜寻畛域,阿里云 Elasticsearch 作为一款功能强大的搜索引擎,始终以来都在为企业提供高效、精确的搜寻服务。当初,阿里云作为国内首家上线 Elasticsearch 8.9 版本的厂商,在提供 Elasticsearch Relevance Engine™ (ESRE™) 引擎的根底上,提供加强 AI 的最佳实际与 ES 自身的混合搜寻能力,为用户带来了更多翻新和摸索的可能性。
此次从 8.5 版本到 8.9 版本的全新降级,新增了以下重点性能,使得阿里云 Elasticsearch 在向量检索和混合搜寻能力都具备显著改善,大大晋升了搜寻后果的准确性和相关性。
- 反对文本和向量召回后果混排(RRF)。
- 向量最大维度晋升到 2048。
- 暴力检索性能晋升。
- KNN 查问反对多个字段同时查问。
- 内置 ELSER 模型。
- 稳固反对 NLP 分布式模型调度治理。
- ……
向量检索 — 为搜寻插上飞跃的翅膀
向量检索作为 8.x 版本的重要新增能力,冲破了传统的基于关键词的搜寻,利用机器学习和人工智能的力量,将文本内容转换为向量示意,行将文本数据中的每个单词示意为一个向量,并通过计算向量之间的间隔来判断文本之间的类似度来实现检索,从而实现文本的高效检索和解决。相较于传统文本检索,通过减少了单词和文档之间的语义关系,使得搜寻的相关性显著晋升;同时解决对象从文本到图像、语音等类型的扩大,利用场景的层面也失去了相应的减少;当然向量检索更可能依据用户偏好定制化搜寻后果,为用户提供了个性化的搜寻体验。
向量检索技术的利用场景十分宽泛,包含搜索引擎优化、图像搜寻、自然语言解决、举荐零碎、情感剖析等畛域。现阿里云 Elasticsearch 产品曾经提供向量检索根底能力,可依据基于 Elasticsearch 向量检索的以文搜图进行体验。
混合搜寻 RRF— 搜寻后果和性能的双重助力
混合搜寻 RRF(Reciprocal rank fusion)反对对多种不同形式召回的多个后果集进行综合再排序,返回最终的排序后果。之前 Elasticsearch 曾经别离反对基于 BM25 的相关性排序和向量类似度的召回排序,通过 RRF 能够对这两者的后果进行综合排序,使得排序的准确性显著晋升。绝对于繁多搜寻搜寻技术,混合搜寻 RRF 的劣势非常显著,可任意组合多个搜寻技术并取得综合性搜寻后果,使得搜寻的准确性和相关性大幅晋升,从场景的适应性来看,企业可依据本身业务设计专属搜寻计划,自由度也明显提高。对于混合搜寻 RRF 在搜寻后果准确性和相关性晋升的试验验证,可依据 阿里云 Elasticsearch 应用 RRF 混排优化语义查问后果比照 进行测试查看,并取得如下后果。
随着新版本的上线,阿里云 Elasticsearch 再次展示了其在搜寻畛域的不断前进。为用户带来了更加智能化和深层次的搜寻体验。将来,阿里云 Elasticsearch 将持续致力翻新,为用户带来更多搜寻技术的冲破和可能性。
Elasticsearch 技术社区 2 群