关于java:elastic-stack-那些事4

实现对 es 中存储的数据进行查问剖析，endpoint 为_search，如 GET /_search
查问有两种模式

URI search
Request body search
es 提供的齐备的查问语法 Query DSL domain specific language

通过 url query 参数来实现搜寻，罕用参数如下：

q 指定查问的语句，语法为 query string syntax
df q 中不指定字段时默认查问的字段，如果不指定，es 会查问所有的字段
sort 排序
timeout 指定超时工夫

from size 分页

 GET /my_index/_search?q=alfred&df=user&sort=age:asc&from=4&size=10&timeout=1s
 查问 user 字段中蕴含 alfred 的文档，后果依照 age 升序排列，返回第 5 -14 个文档，如果超时 1s 则完结

alfred way 等于 alfred OR way
“alfred way” 词语查问要求先后顺序
泛查问
alfred 等效与在所有的字段取匹配该 term
在指定字段
name:alfred

group 分组设定，应用括号指定匹配规定

(quick OR brown) AND fox
status:(active OR pending) title:(full text search)

AND OR NOT

name:(tom NOT leee)
必须大写

+- 对应 must 和 must_not

name:(tom +lee -alfred)
name:((lee && !alfred) || (tom && lee && !alfred))
- 在 url 中会被解析为空格要应用 encode 后后果才能够 %2B

范畴查问反对数值和日期

区间写法闭区间用[] 开区间用{}
1. age:[1 TO 10]
2. age:[1 TO 10}
3. age:[1 TO] age>=1
4. age:[* TO 10] age<=10
算数符号写法
1. age:>=1
2. age:(>=1 && <=10)
3. age:(+>=1 +<=10)

？代表一个字符 * 代表 0 或者多个字符
通配符匹配执行效率低，占用内存大，不倡议应用
如无非凡需要，不要将?/* 放在最前
name:/[ab]oat/ 正则表白的问题和通配符一样

含糊匹配 fuzzy query

name:roam~1 匹配与 roam 差一个 character 的词例如 foam roams

近似度查问 proximity search

“fox quick”~5 以 term 为单位进行差别比拟，例如 ”quick fox” “quick brown fox” 都会被匹配

基于 json 定义的查询语言，次要蕴含如下两种类型

字段类查问
如 term match range 等只针对某一个字段进行查问
复合查问
如 boolean 查问蕴含一个或多个字段类查问或者复合查问语句

全文匹配
针对 text 类型的字段进行全文检索，回对查问语句进行分词解决，如 match match_phrase 等 query 类型
单词匹配
不会对查问语句做分词解决，间接去匹配字段的倒排索引如 term terms range 等 query 类型
minimum_should_match 管制须要匹配的单词数

指文档与查问语句间的相关度 relevance

通过倒排索引能够获取与查问语句项匹配的文档列表，那么如何将最合乎用户查问需要的文档放在前列
实质是一个排序问题排序的根据是相关性算分

关于java:elastic-stack-那些事4

search api

URI search

term and phrase

Group 分组

boolean 操作符

范畴查问

通配符正则表达式

含糊匹配近似度查问

Query DSL

字段类查问

相关性算分

match phrase query

query string query

simple query string query

term query

range query

date math

复合查问

count and source api